lascap
Ben si... Ma FC5 plante souvent, ses derniers temps... Mais je rassure tout le monde, c'est à priori un bins matériel..
J'avoue que je serais pas contre quelques conseils zavertis avant de me plonger les mains dans le cambouis
-- Les symptomes --
En fait, c'est assez étrange, mais ma machine se bloque régulièrement (parfois toutes les 24h, parfois tous les 3 jours..). Et qd je dis qu'elle se bloque, c'est l'écran qui se fige et la machine qui ne répond plus (les Ctrl+Alt+Fx ne donnent rien, du ssh ou du samba d'une machine distante non plus, ... pas la forme, quoi.
Le truc étrange, c'est que je n'ai qu'à faire un reset brutal pour que tout refonctionne, et c'est reparti pour n jours (ma machine est allumée en permanence, mais comme tous les linux du monde non?).
Il ne semble pas y avoir de problème de chaleur, les températures restent dans les 28, 29, et ma fedora est "up to date" (je fais des yum update assez brutaux sur core, extras et update tous les quelques jours)
Pour ceux que ça intrigue, la machine est un relativement vieux athlon XP2400+ avec du **plutôt** bon matos
-- La piste du disque dur --
En fait, la seule piste que j'ai, puisque ça me ferait vraiment mal que ça soit ma ptite fedora la fautive, c'est celle du disque dur.. C'est un bon et plutot récent disque (un seagate barracuda 160Go), et cette fois j'ai évité les énormes partitions, mais j'ai fréquemment un message dans mes logs
>> smartd[1727]: Device: /dev/hda, 1 Offline uncorrectable sectors
et je ne sais pas comment y faire quelque chose. J'ai lu quelque part qu'il n'y avait pas vraiment d'outils qui ressembleraient à scandisk, et que le système de fichier ext3 n'avait en règle général pas ce genre de problèmes, mais voilà... Est-ce que le fait d'avoir ce message fréquemment dans /var/log/messages signifie qu'il y a régulièrement un secteur qui saute, auquel cas je vais bientôt plus avoir de secteurs à me mettre sous la dent, ou est-ce que ça veux dire que c'est le même secteur qui revient en erreur, auquel cas il faudrait que je trouve le moyen de désactiver ce foutu secteur, voire cette portion de disque.
Je m'interroge... changer de disque ? changer de fedora ? me mettre au raid rapidement ? appliquer bêtement la ligne de commande postée (comme ça serait bien, ça ...)
Lascap
drpixel
Je m'interroge... changer de disque ? changer de fedora ? me mettre au raid rapidement ? appliquer bêtement la ligne de commande postée (comme ça serait bien, ça ...)
Tu devrais d'abord vérifier ton disque avec badblocks.
eddy33
bon qq pistes:
- tu as effectivement le DD. Si tu peux le tester avec les SMART tools (
http://smartmontools.sourceforge.net/= qui permettent de te donner un etat de ton DD et voir s'il est sur le point de tomber en panne.
- tu as la memoire. Je pencherai plutot pour cela a cause du PC fige (ca m'est personnellement arrive). Tu peux dans un premiers temps changer dans les BIOS les timings et les augmenter (RAS, CAS...). Si ca marche pas, alors teste ta memoire avec memtest86 :
http://www.memtest86.com/
++
Neuromancien
Tu peut meme tester la totale tant que tu y es 🙂
Essai le superbe UBCD
UltimateBootCD
C'est un CD Bootable avec plein d'utilitaires pour tester les pc, chercher les virus, tous ca 🙂
Dessus, tu as les utilitaires made in Seagate, memtest, etc ..
Bon courage
eddy33
oui ! UBCD est le CD de depannage ! Ca m'a servi entre autre a resetter un passwd XP...
++
pnymat
Mais pour commencer tu peux faire un "dmesg | grep error"
Si tu as des I/O Error c'est le disque dur qui est en train de flancher (dans 95% des cas c'est la mémoire cache du disque dur qui déconne).
lascap
Salut, et merci pour toutes vos réponses. J'ai pas beaucoup avancé, malheureusement, mais c'est qd même bizarre ce qui m'arrive.... lol. alors déjà le dmesg | error ne donne rien, tout est ok, pas plus qu'un gros badblocks sur tout le disque dur (sur 160Go... heureusement que j'ai plusieurs machines..)
Seulement, un tail -f /var/log/messages m'envoie toujours le même message :
smartd[1726]: Device: /dev/hda, 1 Offline uncorrectable sectors
et ce qui est qd même super fort, c'est que c'est toutes les 1/2h, pile... démonstration :
May 16 19:29:48 asia smartd[1726]: Device: /dev/hda, 1 Offline uncorrectable sectors
May 16 19:59:48 asia smartd[1726]: Device: /dev/hda, 1 Offline uncorrectable sectors
May 16 20:29:48 asia smartd[1726]: Device: /dev/hda, 1 Offline uncorrectable sectors
May 16 20:59:48 asia smartd[1726]: Device: /dev/hda, 1 Offline uncorrectable sectors
May 16 21:29:48 asia smartd[1726]: Device: /dev/hda, 1 Offline uncorrectable sectors
May 16 21:59:49 asia smartd[1726]: Device: /dev/hda, 1 Offline uncorrectable sectors
May 16 22:29:48 asia smartd[1726]: Device: /dev/hda, 1 Offline uncorrectable sectors
May 16 22:59:48 asia smartd[1726]: Device: /dev/hda, 1 Offline uncorrectable sectors
May 16 23:29:48 asia smartd[1726]: Device: /dev/hda, 1 Offline uncorrectable sectors
May 16 23:59:48 asia smartd[1726]: Device: /dev/hda, 1 Offline uncorrectable sectors
c'est qd même étrange, non ?
Apres, en fouillant dans dmesg , j'ai repéré un troupeau de log pas très sympa :
EXT3-fs: INFO: recovery required on readonly filesystem.
EXT3-fs: write access will be enabled during recovery.
input: ImExPS/2 Generic Explorer Mouse as /class/input/input1
kjournald starting. Commit interval 5 seconds
EXT3-fs: hda2: orphan cleanup on readonly fs
ext3_orphan_cleanup: deleting unreferenced inode 4063351
ext3_orphan_cleanup: deleting unreferenced inode 17057321
ext3_orphan_cleanup: deleting unreferenced inode 4948011
ext3_orphan_cleanup: deleting unreferenced inode 17072059
ext3_orphan_cleanup: deleting unreferenced inode 17054680
ext3_orphan_cleanup: deleting unreferenced inode 17052358
ext3_orphan_cleanup: deleting unreferenced inode 17049541
ext3_orphan_cleanup: deleting unreferenced inode 17056750
ext3_orphan_cleanup: deleting unreferenced inode 17057939
ext3_orphan_cleanup: deleting unreferenced inode 17048755
ext3_orphan_cleanup: deleting unreferenced inode 17060619
ext3_orphan_cleanup: deleting unreferenced inode 17069770
ext3_orphan_cleanup: deleting unreferenced inode 17048244
ext3_orphan_cleanup: deleting unreferenced inode 4948056
ext3_orphan_cleanup: deleting unreferenced inode 5177443
ext3_orphan_cleanup: deleting unreferenced inode 17064800
ext3_orphan_cleanup: deleting unreferenced inode 17048363
...
...
(y'en a une 300aine de lignes, 293 semble-t'il)
...
EXT3-fs: hda2: 293 orphan inodes deleted
EXT3-fs: recovery complete.
EXT3-fs: mounted filesystem with ordered data mode.
Alors alors ??? Est-ce que c'est pas effectivement mon disque dur qu'est en train de me lacher lentement mais surement ??? Si oui, il faut que je réagisse vite, c'est qd même un serveur de developpement assez important pour moi, cette machine... J'ai tendance à sauvegarder les choses fréquemment, ces temps ci, mais rien que le temps de la réinstall, ça va me gaver.. Est-ce qu'il n'existe pas un soft qui permette de faire une image complète de mon disque, sous linux?? un truc qui ressemblerait à ghost ou true image, et qui serait relativement simple à utiliser. Idéalement, j'acheterais un disque de la même capacité, voire le même modèle, et je le clonerais directement, ça doit être jouable, non?
lascap
Salut,
Un ptit up pour dire que le problème est toujours là... memtest n'a rien donné, pas plus que la vérif du disque dur avec un badblock.. Je m'oriente de plus en plus vers la mise en place d'un autre disque dur, mais voilà, comme je disais j'aimerais bien pouvoir cloner le disque existant pour ne pas avoir a tout réinstaller... c'est jouable ? Et tant qu'a faire, comme je pourrais faire pour optimiser un peu plus la chose et faire en sorte de ne pas avoir trop de problème si un disque lache ? Le raid logiciel, c'est suffisant ? Si oui, c'est faisable de "transformer" un système de fichier existant sans trop se galérer ? Style : partir de mon disque dur unique, ajouter un deuxième disque, et hop..
merci
Lascap
eddy33
Essaye comme tu as smartd qui tourne :
smartctl -a /dev/hda
Ca te donnera la liste des erreurs hard enregitres par ton DD.
infos la :
http://valaurea.free.fr/documents/sig11_smart.html
si tu as des secteurs defectueux, Tu peux utiliser badblocks combine a mkfs pour ignorer les secteurs mauvais (tu reformattes, attention). Ca peut resoudre le probleme a l'instant t mais pas forcement dans le temps avec encore la degradation de ton DD..
++