Salut,

Depuis deux/trois jours, j'ai Fedora 32 bits (gnome) qui freeze une 10aine de fois par jour et de façon aléatoire.

Que je sois sur le net, sur GIMP ou autre, tout se fige pendant quelques secondes (de 5 à 10) puis tout revient à la normale.

Pour info voici ce qu'un DMESG me sort (uniquement la fin):
ata2.00: status: { DRDY ERR }
ata2.00: error: { UNC }
ata2.00: configured for UDMA/133
sd 1:0:0:0: [sda] Unhandled sense code
sd 1:0:0:0: [sda] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
sd 1:0:0:0: [sda] Sense Key : Medium Error [current] [descriptor]
Descriptor sense data with sense descriptors (in hex):
        72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00 
        0e 0d fb 23 
sd 1:0:0:0: [sda] Add. Sense: Unrecovered read error - auto reallocate failed
sd 1:0:0:0: [sda] CDB: Read(10): 28 00 0e 0d fb 20 00 00 08 00
end_request: I/O error, dev sda, sector 235797283
ata2: EH complete
[root@WhatTheFuck ~]# uname -r
2.6.33.5-124.fc13.i686.PAE

kmod-nvidia-2.6.33.5-124.fc13.i686.PAE.i686
Je n'ai pas tout mis car il fait 955 lignes.

Si vous voulez d'autres infos, pas de souci 😉

Merci à tous.
Ca sent les erreurs disque dur ça : "end_request: I/O error, dev sda, sector 235797283".
Si quelqu'un se rappel du nom de l'utilitaire qui check les HDD (avec les erreur sur les secteurs, etc...) j'ai un gros trou de mémoire...
Ouais, je le sens moyen ce truc là... :s
Partition démontée il faudrait que tu utilises e2fsck avec les options qui t'intéresse. Tu peux commencer par -nf afin de forcer le contrôle global de la partition mais sans appliquer de changement. Selon les données présentes sur cette partition pense aussi à faire une sauvegarde si ce n'est déjà fait.
Peux-tu poster le retour des commandes suivantes :
# fdisk -l
$ df -h
Perso je ferais un smartctl avant tout. C'est quand même un risque de faire un fsck avec si le disque est susceptible d'être défectueux.
Merci.

le fdsik -l
[root@WhatTheFuck ~]# fdisk -l

Disque /dev/sda: 203.9 Go, 203928109056 octets
255 têtes, 63 secteurs/piste, 24792 cylindres
Unités = cylindres de 16065 * 512 = 8225280 octets
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Identifiant de disque : 0xb895b895

Périphérique Amorce  Début        Fin      Blocs     Id  Système
/dev/sda1               1       11474    92160000    7  HPFS/NTFS
/dev/sda2   *       11474       14661    25600000   83  Linux
/dev/sda3           14661       24477    78850048   83  Linux
/dev/sda4           24478       24792     2530237+   5  Etendue
/dev/sda5           24478       24792     2529280   82  Linux swap / Solaris

Disque /dev/sdb: 80.0 Go, 80026361856 octets
255 têtes, 63 secteurs/piste, 9729 cylindres
Unités = cylindres de 16065 * 512 = 8225280 octets
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Identifiant de disque : 0x176f176e

Périphérique Amorce  Début        Fin      Blocs     Id  Système
/dev/sdb1               1        9729    78148161   83  Linux
le df -h
[tom@WhatTheFuck ~]$ df -h
Sys. de fichiers    Taille  Uti. Disp. Uti% Monté sur
/dev/sda2              25G  4,9G   18G  22% /
tmpfs                1007M  328K 1007M   1% /dev/shm
/dev/sda3              75G   34G   37G  49% /home
nouvo09 wrote:Perso je ferais un smartctl avant tout. C'est quand même un risque de faire un fsck avec si le disque est susceptible d'être défectueux.
Je viens de le faire.

Par contre, je ne sais pas si cette option là que tu voulais. Dans le doute, j'ai fais un --all:
smartctl 5.39.1 2010-01-28 r3054 [i386-redhat-linux-gnu] (local build)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Model Family:     Maxtor DiamondMax 10 family (ATA/133 and SATA/150)
Device Model:     Maxtor 6L200M0
Serial Number:    L40XDB3H
Firmware Version: BANC1G10
User Capacity:    203 928 109 056 bytes
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   7
ATA Standard is:  ATA/ATAPI-7 T13 1532D revision 0
Local Time is:    Sat Jun 26 11:44:14 2010 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82)    Offline data collection activity
                    was completed without error.
                    Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0)    The previous self-test routine completed
                    without error or no self-test has ever 
                    been run.
Total time to complete Offline 
data collection:          (1562) seconds.
Offline data collection
capabilities:              (0x5b) SMART execute Offline immediate.
                    Auto Offline data collection on/off support.
                    Suspend Offline collection upon new
                    command.
                    Offline surface scan supported.
                    Self-test supported.
                    No Conveyance Self-test supported.
                    Selective Self-test supported.
SMART capabilities:            (0x0003)    Saves SMART data before entering
                    power-saving mode.
                    Supports SMART auto save timer.
Error logging capability:        (0x01)    Error logging supported.
                    General Purpose Logging supported.
Short self-test routine 
recommended polling time:      (   2) minutes.
Extended self-test routine
recommended polling time:      (  81) minutes.
SCT capabilities:            (0x0021)    SCT Status supported.
                    SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  3 Spin_Up_Time            0x0027   207   196   063    Pre-fail  Always       -       13717
  4 Start_Stop_Count        0x0032   252   252   000    Old_age   Always       -       2422
  5 Reallocated_Sector_Ct   0x0033   253   253   063    Pre-fail  Always       -       1
  6 Read_Channel_Margin     0x0001   253   253   100    Pre-fail  Offline      -       0
  7 Seek_Error_Rate         0x000a   253   252   000    Old_age   Always       -       0
  8 Seek_Time_Performance   0x0027   249   239   187    Pre-fail  Always       -       43317
  9 Power_On_Minutes        0x0032   217   217   000    Old_age   Always       -       648h+59m
 10 Spin_Retry_Count        0x002b   253   252   157    Pre-fail  Always       -       0
 11 Calibration_Retry_Count 0x002b   253   252   223    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   247   247   000    Old_age   Always       -       2710
192 Power-Off_Retract_Count 0x0032   253   253   000    Old_age   Always       -       0
193 Load_Cycle_Count        0x0032   253   253   000    Old_age   Always       -       0
194 Temperature_Celsius     0x0032   035   253   000    Old_age   Always       -       40
195 Hardware_ECC_Recovered  0x000a   253   252   000    Old_age   Always       -       22329
196 Reallocated_Event_Count 0x0008   253   253   000    Old_age   Offline      -       0
197 Current_Pending_Sector  0x0008   253   253   000    Old_age   Offline      -       1
198 Offline_Uncorrectable   0x0008   253   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0008   199   199   000    Old_age   Offline      -       0
200 Multi_Zone_Error_Rate   0x000a   253   252   000    Old_age   Always       -       0
201 Soft_Read_Error_Rate    0x000a   253   252   000    Old_age   Always       -       22
202 Data_Address_Mark_Errs  0x000a   253   252   000    Old_age   Always       -       0
203 Run_Out_Cancel          0x000b   253   252   180    Pre-fail  Always       -       25
204 Soft_ECC_Correction     0x000a   253   252   000    Old_age   Always       -       0
205 Thermal_Asperity_Rate   0x000a   253   252   000    Old_age   Always       -       0
207 Spin_High_Current       0x002a   253   252   000    Old_age   Always       -       0
208 Spin_Buzz               0x002a   253   252   000    Old_age   Always       -       0
209 Offline_Seek_Performnce 0x0024   241   241   000    Old_age   Offline      -       151
210 Unknown_Attribute       0x0032   253   252   000    Old_age   Always       -       0
211 Unknown_Attribute       0x0032   253   252   000    Old_age   Always       -       0
212 Unknown_Attribute       0x0032   253   252   000    Old_age   Always       -       0

SMART Error Log Version: 1
ATA Error Count: 492 (device log contains only the most recent five errors)
    CR = Command Register [HEX]
    FR = Features Register [HEX]
    SC = Sector Count Register [HEX]
    SN = Sector Number Register [HEX]
    CL = Cylinder Low Register [HEX]
    CH = Cylinder High Register [HEX]
    DH = Device/Head Register [HEX]
    DC = Device Command Register [HEX]
    ER = Error register [HEX]
    ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 492 occurred at disk power-on lifetime: 11872 hours (494 days + 16 hours)
  When the command that caused the error occurred, the device was in an unknown state.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 00 00 00 00 00 a0

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  ec 00 00 00 00 00 a0 00      02:01:47.893  IDENTIFY DEVICE
  c8 00 08 20 fb 0d ee 00      02:01:45.058  READ DMA
  27 00 00 00 00 00 e0 00      02:01:45.057  READ NATIVE MAX ADDRESS EXT
  ec 00 00 00 00 00 a0 00      02:01:45.054  IDENTIFY DEVICE
  ef 03 46 00 00 00 a0 00      02:01:45.051  SET FEATURES [Set transfer mode]

Error 491 occurred at disk power-on lifetime: 11872 hours (494 days + 16 hours)
  When the command that caused the error occurred, the device was in an unknown state.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 00 00 00 00 00 a0

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  ec 00 00 00 00 00 a0 00      02:01:44.978  IDENTIFY DEVICE
  c8 00 08 20 fb 0d ee 00      02:01:42.152  READ DMA
  27 00 00 00 00 00 e0 00      02:01:42.151  READ NATIVE MAX ADDRESS EXT
  ec 00 00 00 00 00 a0 00      02:01:42.147  IDENTIFY DEVICE
  ef 03 46 00 00 00 a0 00      02:01:42.144  SET FEATURES [Set transfer mode]

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]


SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
Le pc vient de replanter.

Un tail /var/log/messages me donne:
[root@WhatTheFuck ~]# tail /var/log/messages
Jun 27 21:31:24 WhatTheFuck kernel: sd 1:0:0:0: [sda] Unhandled sense code
Jun 27 21:31:24 WhatTheFuck kernel: sd 1:0:0:0: [sda] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
Jun 27 21:31:24 WhatTheFuck kernel: sd 1:0:0:0: [sda] Sense Key : Medium Error [current] [descriptor]
Jun 27 21:31:24 WhatTheFuck kernel: Descriptor sense data with sense descriptors (in hex):
Jun 27 21:31:24 WhatTheFuck kernel:        72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00 
Jun 27 21:31:24 WhatTheFuck kernel:        0e 0d fb 23 
Jun 27 21:31:24 WhatTheFuck kernel: sd 1:0:0:0: [sda] Add. Sense: Unrecovered read error - auto reallocate failed
Jun 27 21:31:24 WhatTheFuck kernel: sd 1:0:0:0: [sda] CDB: Read(10): 28 00 0e 0d fb 20 00 00 08 00
Jun 27 21:31:24 WhatTheFuck kernel: end_request: I/O error, dev sda, sector 235797283
Jun 27 21:31:24 WhatTheFuck kernel: ata2: EH complete
Je pense que mon disque dur à un coup dans l'aile... En même temps, cela fait 6 ans que je l'ai... Et en 6 ans, il en a vu des installations...
Les installations ne fatiguent en aucun cas les disques. Il se peut qu'il soit fatigué mais pas pour cette raison là.

Sinon je vois des erreurs même si je ne sais pas pour chacune d'elles le degré de criticité. Si tu pensais changer de disque, je pense qu'il ne faut pas tarder.
Au vu de tous les "Pre-fail" qu'on peut voir dans le log de Smart (voila le nom que je cherchais :-D ), c'est plus prudent de changer de disque dur...
Tu peux aussi changer le câble SATA.

Pre-fail c'est simplement le type d'information.

Sinon je te conseil aussi de changer de disque, préférence actuel pour les WesternDigital Caviar blue ou encore mieux Black. Laisse tomber les seagate pour le moment.

De plus les black sont garantie 5 ans. Actuellement niveau fiabilité j'ai pas eu le moindre problème ou retour, alors que les Seagate j'en ai eu pas mal à retourné au SAV, sans compter les lots hors service à réception...