Bonjour,
mon SSD vient de de me dire qu'il y a plein de secteur erronés sur I/O error dans ma partition /.
Ce qui est surprenant c'est que les deux premiers tiers du SSD contiennent windows 7 et ce dernier ne râle pas même après un chkdsk avec recherche de secteurs défectueux. J'ai constaté ce phénomène depuis que je suis sous Fedora 17 alors qu'avant tout allait bien (même sans le discard et le noop). Et naturellement, comme tout va bien sous win7, j'hésite à faire une mise à jour du firmware.

D'où ma question: est-ce vraiment une bonne idée de lancer un fsck -c -c (badblocks R/W non destructif) sur un SSD ?

Après 14h de fsck, je n'ai traité que 28% de la partition et j'ai déjà plus de 11000 erreurs. Je crains le pire pour mon installation Linux ( 🙁 ) et je n'ai pas trop envie de réinstaller les deux OS.

D'avance merci pour toute idée.
Tiens, ça me rappelle quelque chose. C'est quoi ton SSD ? Et ces erreurs, tu les vois où ?
Crucial M4 128GB. Par contre il faut que j'attende la fin du fsck pour récupérer la version du firmware.
J'avais les erreurs dans la log système et maintenant dans le fsck.
Le fsck en est à 48% pour 23:23:12 d'exécution et 18007 erreurs. C'est lent 🙂
Est ce que ça fait le même genre de truc qu'expliqué ici ?
Malheureusement ça y ressemble très fortement. La différence est que j'ai des I/O error maintenant en continu via le fsck -c -c (lancé depuis un live CD).
Je me demande quand même si le fait d'avoir la première partie du disque sous win7 n'est pas à l'origine des soucis. Ne serais-je pas en train de récupérer les secteurs dont windows ne veut plus ?
Je vais laisser le fsck se finir pour voir dans quel état est le tandem Linux / windows. Si win7 continue à fonctionner, je mettrai un disque neuf (SSD Corsair probablement) pour Linux en parallèle et je laisserai windows seul sur le Crucial.
A suivre donc.
Pour ma part j'ai aussi un Crucial M4 128 avec le dernier firmware à jour 010G http://www.crucial.com/help/ssd/index.aspx (j'ai du faire quasi toutes les montées de version depuis que je l'ai), par contre je n'ai pas d'autre OS que Fedora dessus et surtout je n'ai pas d'erreurs.
ton fsck tu le fais sur une partition linux? pas la partition windows?
J'ai fait la recherche de secteur défectueux via chkdsk.exe pour ce qui concerne win7 et fsck pour linux. j'ai préféré ne pas mélanger les genres (vu que j'avais déjà fauté en ce sens en partageant le disque).
Me suggères-tu de faire le fsck sur la partition win7 ? (je tremble).
non justement, je cherchais à comprendre pourquoi tu disais que le fsck trouvais des badblocks sur la partition windows. Si ton fsck tourne sur ta partition linux, il ne touche à rien de ta partition windows.
Ce qui va être intéressant est de voir comment le SSD (vu de win7) va réagir après le gros coup que lui assène le badblock. Je ne sais pas ce que va produire l'algo de wear-leveling avec autant d'erreurs détectées (sauf si c'est un bug de ext4/badblocks ...). J'espère que les deux partitions vont gentiment continuer à s'ignorer.
J'espère que le fsck sera fini ce soir pour en avoir le coeur net.
Au fait avez-vous vu ce thread ext4 filesystem errors on SSD disk dans les bugs Ubuntu ? ça a un air de déjà vu et le plus curieux est la dernière entrée.
Vivement que mon système soit disponible que je regarde le smartctl.
Bonsoir,
en bref, badblocks sur un SSD est une très mauvaise idée. Mon /dev/sda5 est défunt; Paix à son âme linuxienne.

La version longue: après 48h (!) de fsck, j'ai découvert que les mauvais blocs indiqués étaient en fait une conséquence d'un problème de SATA. Comme je n'ai pas pu capturer l'écran proprement, j'ai pris une photo de l'écran Trace pb SATA. Vu le nombre de reset du lien, cela explique le temps d'exécution prohibitif...
Au reboot grub2 ne retrouvait plus ses fichiers; sda5 est dans un état lamentable. Je le considère comme perdu définitivement.
J'ai remis le MBR de win7 et la machine est repartie tranquillement. :-o Je compose ce message depuis win7 sans avoir de problème.
Par curiosité j'ai utilisé DiskCheckup pour récupérer les informations smart. On constate que seules les erreurs DMA posent question et que sinon le disque est plutôt sain (selon smart).
Voilà le contenu complet des infos smart:
*** DiskCheckup V3.1 Build: 1005 Report ***

SysInfo DLL Version:                                                  SysInfo v1.0 Build: 1028
Time of export:                                                       07:48:40 28-nov.-2012

Device information:                                                   
   Device ID:                                                         0
   Interface:                                                         SATA
   Device Capacity:                                                   122103 MB
   Serial Number:                                                     00000000111903072398
   Model Number:                                                      M4-CT128M4SSD2
   Firmware Revision:                                                 0001
   Partitions:                                                        
      C:         75674 MB

ATA information:                                                      

   Disk geometry:                                                     
      Cylinders:                                                      15566
      Tracks/Cylinder:                                                255
      Sectors/Track:                                                  63
      Bytes/Sector:                                                   512
      Total disk sectors:                                             250069680
      Logical sector size:                                            512
      Physical sector size:                                           512
      Media rotation rate:                                            SSD
      Buffer size:                                                    0 KB
      ECC size:                                                       0 Bytes

   Standards compliance:                                              
      ATA8-ACS Supported:                                             Yes
      ATA/ATAPI-7 Supported:                                          Yes
      ATA/ATAPI-6 Supported:                                          Yes
      ATA/ATAPI-5 Supported:                                          Yes
      ATA/ATAPI-4 Supported:                                          Yes
      Serial/Parallel:                                                Serial
         SATA 3.0 Compilance:                                         Yes
         SATA 2.6 Compilance:                                         Yes
         SATA 2.5 Compilance:                                         Yes
         SATA II: Ext Compilance:                                     Yes
         SATA 1.0a Compilance:                                        Yes
         ATA8-AST Compilance:                                         Yes
   World Wide ID:                                                     500A075103072398

   Feature support:                                                   
      SMART supported:                                                Yes
         SMART enabled:                                               Yes
      SMART self-test supported:                                      Yes
      SMART error log supported:                                      Yes
      LBA supported:                                                  Yes
      IORDY supported:                                                Yes
      CFast supported:                                                No
      DMA supported:                                                  Yes
         Maximum Multiword DMA mode supported:                        2
         Multiword DMA selected:                                      None
         Maximum UltraDMA mode supported:                             5
         UltraDMA selected:                                           5
      Maximum PIO mode supported:                                     4
      SATA Compliance:                                                Yes
         NCQ priority information supported:                          Yes
         Unload while NCQ commands are outstanding supported:         No
         Phy Event Counters supported:                                Yes
         Receipt of power management requests supported:              Yes
         NCQ feature set supported:                                   Yes
         SATA Gen2 Signaling Speed (3.0Gb/s) supported:               Yes
         SATA Gen1 Signaling Speed (1.5Gb/s) supported:               Yes
         Software Settings Preservation:                              Supported, Enabled
         In-order data delivery:                                      Not supported
         Initiating power management:                                 Supported, Disabled
         DMA Setup auto-activation:                                   Supported, Disabled
         Non-zero buffer offsets:                                     Not supported
      Trusted Computing supported:                                    No
      Host Protected Area (HPA) supported:                            Yes
      Read look-ahead supported:                                      Yes
         Read look-ahead enabled:                                     Yes
      Write cache supported:                                          Yes
         Write cache enabled:                                         Yes
      Power management supported:                                     Yes
      Security mode supported:                                        Yes
         Security mode enabled:                                       No
      Device Configuration Overlay (DCO) supported:                   Yes
      48bit Addressing supported:                                     Yes
      Auto Acoustic Managment (AAM) supported:                        No
      Power-up in Standby (PUIS) supported:                           No
      Advanced Power Management (APM) supported:                      Yes
         Advanced Power Management (APM) enabled:                     Yes
         Current APM level:                                           Maximum performance
      CompactFlash Association (CFA) supported:                       No
      General Purpose Logging (GPL) supported:                        Yes
      Streaming supported:                                            No
      Media card pass through supported:                              No
      Extended power conditions supported:                            No
      Extended status reporting supported:                            No
      Write-read-verify supported:                                    Yes
         Write-read-verify enabled:                                   No
      Free-fall control supported:                                    No
      TRIM command supported:                                         Yes
      SCT command transport supported:                                Yes
      NV Cache enabled:                                               No
      NV Cache Power Management supported:                            No

SMART ATTRIBUTES:
 ID	Description                         	Status    	Value     	Worst     	Threshold 	Raw Value 	TEC                 
---------------------------------------------------------------------------------------------------------------------------------------------
  1	Raw Read Error Rate                 	OK        	100       	100       	50        	0         	N.A.                
  5	Reallocated Sector Count            	OK        	100       	100       	10        	0         	N.A.                
  9	Power On Time                       	OK        	100       	100       	1         	1797      	N.A.                
 12	Power Cycle Count                   	OK        	100       	100       	1         	346       	N.A.                
170	(Unknown attribute)                 	OK        	100       	100       	10        	0         	N.A.                
171	(Unknown attribute)                 	OK        	100       	100       	1         	0         	N.A.                
172	(Unknown attribute)                 	OK        	100       	100       	1         	0         	N.A.                
173	(Unknown attribute)                 	OK        	100       	100       	10        	5         	N.A.                
174	(Unknown attribute)                 	OK        	100       	100       	1         	0         	N.A.                
181	(Unknown attribute)                 	OK        	100       	100       	1         	1112400527557	N.A.                
183	SATA Downshift Error Count          	OK        	100       	100       	1         	0         	N.A.                
184	End-to-End error                    	OK        	100       	100       	50        	0         	N.A.                
187	Reported Uncorrectable Errors       	OK        	100       	100       	1         	0         	N.A.                
188	Command Timeout                     	OK        	100       	100       	1         	0         	N.A.                
189	High Fly Writes                     	OK        	100       	100       	1         	117       	N.A.                
195	Hardware ECC Recovered              	OK        	100       	100       	1         	0         	N.A.                
196	Reallocation Event Count            	OK        	100       	100       	1         	0         	N.A.                
197	Current Pending Sector Count        	OK        	100       	100       	1         	0         	N.A.                
198	Uncorrectable Sector Count          	OK        	100       	100       	1         	0         	N.A.                
199	UltraDMA CRC Error Count            	OK        	100       	100       	1         	487788    	N.A.                
202	Data Address Mark Errors            	OK        	100       	100       	1         	0         	N.A.                
206	Flying Height                       	OK        	100       	100       	1         	0         	N.A.                

SMART HISTORY:
Attribute ID: 1    	Attribute Name: Raw Read Error Rate
                     Date	Value     	Worst     
---------------------------------------------------------------------------------------------------------------------------------------------
  Mon Nov 19 19:54:54 201	100       	100       
  Mon Nov 19 20:04:56 201	100       	100       
  Mon Nov 19 20:14:58 201	100       	100       
  Mon Nov 19 20:25:01 201	100       	100       
  Mon Nov 19 20:35:03 201	100       	100       
  Mon Nov 19 20:45:05 201	100       	100       
  Mon Nov 19 20:55:07 201	100       	100       
  Mon Nov 19 21:05:09 201	100       	100       
  Mon Nov 19 21:15:10 201	100       	100       
  Mon Nov 19 21:25:12 201	100       	100       
  Mon Nov 19 21:35:14 201	100       	100       
  Mon Nov 19 21:45:16 201	100       	100       
  Mon Nov 19 21:55:17 201	100       	100       
  Mon Nov 19 22:05:19 201	100       	100       
  Mon Nov 19 22:15:21 201	100       	100       
  Mon Nov 19 22:25:23 201	100       	100       
  Mon Nov 19 22:35:24 201	100       	100       
  Mon Nov 19 22:45:26 201	100       	100       
  Mon Nov 19 22:55:28 201	100       	100       
  Mon Nov 19 23:05:29 201	100       	100       
  Mon Nov 19 23:15:31 201	100       	100       
  Wed Nov 21 08:04:31 201	100       	100       
  Wed Nov 21 08:05:49 201	100       	100       
  Wed Nov 21 08:08:03 201	100       	100       
  Wed Nov 21 08:13:40 201	100       	100       
  Wed Nov 21 08:15:41 201	100       	100       
  Wed Nov 21 19:04:10 201	100       	100       
  Wed Nov 21 19:13:04 201	100       	100       
  Wed Nov 21 19:13:12 201	100       	100       
  Wed Nov 21 19:21:28 201	100       	100       
  Wed Nov 21 19:21:41 201	100       	100       
  Wed Nov 21 19:22:32 201	100       	100       
  Wed Nov 21 19:27:08 201	100       	100       
  Wed Nov 21 20:27:10 201	100       	100       
  Wed Nov 21 21:27:11 201	100       	100       
  Thu Nov 22 18:24:38 201	100       	100       
  Wed Nov 28 07:46:38 201	100       	100       
Donc soit le contrôleur disque me lâche doucement soit c'est la carte mère qui a un le port 1/6GB qui rend l'âme.
Je laisse /dev/sda5 en l'état si cela devait servir à quelqu'un pour tester quelque chose. Je crois que je vais aussi tenter un upgrade du firmware (j'ai la rev 1).

Au bilan, je pense que découper les disques est une mauvaise idée et que je vais en acheter un spécialement pour linux. Par contre SSD ou HDD, je n'ai pas encore tranché. D'ici là je garde mon M4 pour win7.
Je vais donc marquer ce thread comme résolu (?) même si j'aimerai bien comprendre pourquoi win7 gère mieux le SATA que linux (ce qui me gêne/vexe).
D'après https://ata.wiki.kernel.org/index.php/Libata_error_messages pour UnrecovData et Handshk
These bits are set by the SATA host interface in response to error conditions on the SATA link. Unless a drive hotplug or unplug operation occurred, it is generally not normal to see any of these bits set. If they are, it usually points strongly toward a hardware problem (often a bad SATA cable or a bad or inadequate power supply).
Donc ils suggèrent un problème de cable, ou d'alim.
OK. Je vais commander un bon câble (cher ?) pour être certain de mon hard. L'alim est récente et plutôt surdimensionnée (j'avais avant un C2050 assez gourmande ... remplacée depuis par une version fanless nettement plus sobre). Je lui fait assez confiance (encore que maintenant).
Avec diskcheckup, je vais pouvoir surveiller cela finement.
Merci du conseil.
J'ai eu un problème un peu similaire, sur une carte Gigabyte, finalement c'est probablement le contrôleur sata qui est bugué, car les messages d'erreur sata apparaissent que quand je branche un lecteur dvd... (en ide, mais géré par le même controleur sata). Si t'as d'autres périphériques sur tes controlleurs essayes sans... on sait jamais.
J'ai une carte mère ASUS P8Z68-V Pro dont je n'ai jamais mis le BIOS à jour. Cela vaut peut-être le coup ? En tout cas, elle me pose soucis car c'est une UEFI et la mise à jour du firmware du M4 ne fonctionne pas en UEFI. (Grrr).
Mes autres périphériques sont les disques de DATA dont je ne peux guère me passer 😉
Je vais faire le changement de câble et ensuite on verra bien.
Regarde dans les changelogs des mises à jours BIOS/EFI dispo chez ASUS, s'ils sont dispo, et si ça parle de SATA/ATA tu peux tenter ça en effet. C'est toujours bon d'être à jour, surtout quand ya des problèmes de ce style.