[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Plantage avec de nombreux IO error sur un SSD



C. Mourad Jaber a écrit :
Bonjour,

	Bonsoir,

J'ai eu plusieurs plantages "violents" avec mon laptop... A priori c'est
lié à la sortie de veille.

Au bout d'un certain nombre de cycles de sortie de veille, le laptop se
met à chauffer et la console est inondée de read error, de ext4 failure
et autre insulte du file system...

Tous les processes se figent en l'attente du disque et je suis obliger
d'éteindre l'ordinateur...

Après redémarrage tout va bien...

N'ayant qu'une connaissance limité des SSD, je me pose plusieurs
questions :

- soit le matériel est en fin de vie (3 ans en usage quotidien avec un
/tmp en tmpfs et principalement de la navigation web et mail),

- soit le dernier noyau de la serie 4.9 introduit une régression
concernant les filesystems en sortie de veille...

	Je n'ai rien observé de tel.

Est-ce quelqu'un à rencontré ce problème ?

Comment auditer un SSD pour connaitre son état d'usure ? sachant que
hdparm et smart-tool ne remontent rien de spécialement alarmant...

Il y a deux phénomènes. Les SSD (sont des merdes, zut, ça m'a échappé ;-) ) sont soumis au vieillissement des cellules, à leur firmware et aux problèmes de température. Au-delà de 55°C, on commence à voir des erreurs de lecture qui disparaissent à froid (il y a des codes correcteur d'erreur assez puissant à l'intérieur en règle générale).

Si la machine commence à chauffer, pas étonnant. Pour information, la durée de vie d'un SSD tout venant (c'est-à-dire MLC, les TLC sont encore plus merdique, mais plus rapides et moins chers) à 60°C est de quelques mois. J'en ai plusieurs milliers dans la nature et je commence à pouvoir faire des statistiques intéressantes. Les SLC tiennent beaucoup plus longtemps mais sont plus lents.

De toute façon, au bout de trois ans, ça m'étonnerait que ce soit une usure des cellules. Tout au plus un problème de firmware ou de température. Le symptôme est alors un fs qui se met à la suite d'une erreur en lecture seule et la console qui balance des tas d'I/O error. Certains firmwares déconnectent carrément le lecteur lorsqu'il détecte un problème (cas des Vertex d'OCZ). C'est assez désagréablecar là, le fs est complètement en morceau. Je ne sais pas pourquoi, mais je parie sur un firmware qui déconnecte le disque...

	Cordialement,

	JKB

PS: pour info, dans les applications critiques et embarquées, on voit de plus en plus de demandes sur des vrais disques durs en raid1 qui préviennent avant de tomber en panne. Chez Toshiba (Fujitsu réétiqueté) se trouve un disque capable de fonctionner à 95°C et de supporter je ne sais plus combien de g en fonctionnement. 300 € le disque, 320 Go, et on n'a plus de problème ;-)


Reply to: