Bonjour, voilà j'ai quelques soucis avec mon pc depuis quelques temps.

Sous linux par exemple, j'ai mon pc qui rame de plus en plus (curseur qui saccade) puis le pc se bloque complet. Et plante...
Je suis obligé de le laisser refroidir pour récupérer les services!

Pourtant j'ai fais une vérification totale de mes disques (SSD et HD) sous windows avec un logiciel qui ne m'a trouvé aucune erreur!

Auriez-vous la possibilité de me conseiller des vérifications sous fedora afin de vérifier voire réparer tout cela?

Merci. :-P
A tout hasard depuis quand n'as tu pas dépoussiéré le ventilateur du proc ?
Effectivement ça ressemble étrangement à un souci de surchauffe.

Sinon tu as combien de RAM et SWAP ?
Ça chauffe pas mal un phenom2 et une r9 290. Ne pas chercher plus loin tu dois. Nettoyage ou remplacement du ventirad qui a tout les coup est celui fourni avec le cpu qui est vraiment sous dimensionné surtout si qqchose fourni plus de chaleur.

Pour info une r9 290 monte jusqu'à plus de 90°c rien que le gpu.
Merci pour les réponses, cela dit je ne suis pas sûr que c'est obligatoirement un problème de surchauffe.
Car en effet, le problème ne semble pas apparaitre sous windows.

Donc, peut-être un problème du système sous linux... Des idées pour faire des vérifications?
As-tu vérifié au moins ? Via sensors ou lors du reboot dans le bios ?
$ df -h
$ free -h
Je dois taper ça dans quelle interface?

Sinon, je pense aussi qu'il y a peut-être un soucis avec le bios parce-qu'avec windows j'ai quelques soucis également.
(pc qui lag... son qui lag, etc)

Dites-moi ce que je dois faire, merci.
Tout simplement dans un terminal, un endroit où tu peux saisir des lignes de commandes. Tu as bien dû en entendre parler depuis 2007 tout de même.
Oui oui, bien sûr! 😉

Mais je n'étais pas sûr si tu voulais que je tape ça sous linux ou windows... Mais comme on est sur un forum linux!

Voilà les résultats de chaque commande:
Sys. de fichiers                        Taille Utilisé Dispo Uti% Monté sur
/dev/mapper/fedora_bombastic--pc-root      29G    8,3G   19G  31% /
devtmpfs                                  3,9G       0  3,9G   0% /dev
tmpfs                                     3,9G     92K  3,9G   1% /dev/shm
tmpfs                                     3,9G    956K  3,9G   1% /run
tmpfs                                     3,9G       0  3,9G   0% /sys/fs/cgroup
/dev/mapper/fedora_bombastic--pc00-var     29G    2,3G   25G   9% /var
/dev/mapper/fedora_bombastic--pc00-home   154G     11G  136G   7% /home
/dev/mapper/fedora_bombastic--pc00-tmp    7,6G     20M  7,2G   1% /tmp
             total       used       free     shared    buffers     cached
Mem:          7,8G       1,5G       6,3G         0B        67M       536M
-/+ buffers/cache:       913M       6,9G
Swap:         5,9G         0B       5,9G
Et l'envoi de la commande sensors:
[root@Bombastic-PC ~]# sensors
radeon-pci-0100
Adapter: PCI adapter
temp1:        +67.0°C  (crit = +120.0°C, hyst = +90.0°C)

k10temp-pci-00c3
Adapter: PCI adapter
temp1:        +52.1°C  (high = +70.0°C)
                       (crit = +67.0°C, hyst = +62.0°C)

it8720-isa-0228
Adapter: ISA adapter
in0:          +1.47 V  (min =  +0.00 V, max =  +4.08 V)
in1:          +1.94 V  (min =  +0.00 V, max =  +4.08 V)
in2:          +3.34 V  (min =  +0.00 V, max =  +4.08 V)
+5V:          +2.94 V  (min =  +0.00 V, max =  +4.08 V)
in4:          +3.02 V  (min =  +0.00 V, max =  +4.08 V)
in5:          +0.22 V  (min =  +0.00 V, max =  +4.08 V)
in6:          +3.34 V  (min =  +0.00 V, max =  +4.08 V)
5VSB:         +2.94 V  (min =  +0.00 V, max =  +4.08 V)
Vbat:         +3.30 V  
fan1:        1386 RPM  (min =    0 RPM)
fan2:           0 RPM  (min =    0 RPM)
fan3:        1967 RPM  (min =    0 RPM)
fan5:           0 RPM  (min =    0 RPM)
temp1:        +46.0°C  (low  = +127.0°C, high = +127.0°C)  sensor = thermistor
temp2:        +55.0°C  (low  = +127.0°C, high = +127.0°C)  sensor = thermal diode
temp3:        +82.0°C  (low  = +127.0°C, high = +127.0°C)  sensor = thermistor
cpu0_vid:    +1.250 V
intrusion0:  ALARM
Du coup ce n'est clairement pas côté capacité de stockage ou mémoire.

Reste à surveiller avec sensors les températures car comme dit depuis le début ça ressemble beaucoup à un souci de surchauffe.
Dès que le problème se reproduit fait un relevé des températures donc le bios.
Ben en fait, j'ai remarqué depuis quelques temps (que j'ai recouvert le boîtier de mon pc vu que c'est l'hiver) des ralentissements et lags sur les deux OS!
Sous windows ça reste du lag mais sous linux ça plante carrément le pc au bout d'un moment!
Ton boitier est dehors ?

Sinon bon dépoussiérage et pas de couverture chauffante, ni de bouillotte.
Le boîtier n'est pas dehors! ^^
Mais je suis surpris si ça chauffe autant. (je n'ai changé que la carte graphique récemment)

Et j'ai un bon Noctua pour refroidir mon processeur!
Encrassement, GPU qui chauffe trop, ventirad mal posé, voir sans pâte thermique, etc...

Bref tant que tu ne te seras pas assuré de ça et que tu ne préciseras pas ton "j'ai recouvert le boîtier de mon pc vu que c'est l'hiver" nous allons tourner en rond et nous lasser... surtout avec les infos données au compte goutte.

Je te laisse prendre en considération toutes nos aides et faire le nécessaire en ton âme et conscience.
Ok, mais je ne donne pas les infos au compte goutte par plaisir.
Je ne veux pas inonder les gens d'infos d'un coup et préfère répondre aux questions...

De plus, si j'ai recouvert la plaque sur le côté du boitier de mon pc parce-que "c'est l'hiver" c'est pas pour dire des conneries (par plaisir également) mais simplement car l'été il fait très chaud où j'habite et donc je préfère ne pas laisser boîtier du pc entièrement recouvert pour éviter justement ces problèmes de surchauffe!

Voilà, pourquoi j'ai dis que je l'avais recouvert parce-que c'est hiver!!!

Je ne suis ni un noob ni un kevin! J'ai aussi vérifié et regardé déjà qu'il n'y avait pas d'excès de poussière dans mon boîtier. J'ai déjà vu un pc rempli de poussière et c'est pas beau! Ce n'est pas le cas du miens.

De toute façon, je vais redébrancher le tout et rebrancher à nouveau en vérifiant les pâtes thermiques etc...
(j'ai remarqué que j'avais la veille qui ne fonctionnait plus sur windows et faisait planter le pc depuis la dernière fois où j'avais tout rebranché la dernière fois déjà)

Si ça me gonfle et que le résultat reste le même je changerai ma carte mère + proc + ram car ils commencent à dater... C'est tout.

Merci néanmoins à tous pour vos observations et diagnostics.
En fait plus l'on a d'informations organisées, moins l'on a de questions/divinations à avoir et être plus efficient dans nos réponses.

En fait tu as déjà pour habitude de retirer le panneau latéral l'été et de le remettre l'hiver, c'est bien ça ? Le terme recouvert n'est pas forcément bien adapté dans ce cas et prête à confusions.

Le ventirad est-il adapté au CPU en terme de puissance calorifique qu'il peut évacuer. Quel est la charge CPU (processus qui tournerait en tâche de fond, difficile à concevoir sur les 2 OS) ?

Il faudrait surveiller l'évolution des températures comme dit plus haut. A savoir pendant l'utilisation et suite à plantage via les informations dans le bios. Ca permettrait de savoir si tout va bien ou non de ce côté. Cependant côté GPU se sera peut-être plus difficile. Ou alors le chipset qui chauffe trop aussi.

Tu peux aussi regarder l'état des disques avec la commande smartctl, adapter les chemins au besoin..
# smartctl -a /dev/sda
# smartctl -a /dev/sdb
52°C au repos c'est quand même élevé, mais pas anormal non plus.
temp3:        +82.0°C  (low  = +127.0°C, high = +127.0°C)  sensor = thermistor
Alors là je m'inquièterai plus. Le temp3 correspond à quoi? Si c'est une sonde de la carte mère, alors il y a un élément qui est mal refroidit et donc surchauffe pas mal.

Si en plus tu es obligé de laisser le boitier ouvert l'été, il y a un problème quelque part.

Quelques photos de l'intérieur de ton ordi permettrai aussi de ce faire une idée, si cela t'es possible.
En fait, je ne suis pas obligé de laisser le boîtier ouvert l'été mais je le fais par précaution car il fait très lourd.

J'ai effectué les manipulations que je disais: nettoyage de certains ventilos, filtres... et j'ai remis de la pâte thermique au niveau du processeur et son dissipateur (d'ailleurs c'est un Noctua avec ventilo donc très bon) car j'ai bien l'impression qu'il y avait quasiment plus rien.
J'ai aussi mis un peu de pâte thermique sur le dissipateur de mon disque dur.

Voici un autre petit coup de sensors après avoir utilisé un jeu sous windows intensément puis reboot sous linux:
sensors
radeon-pci-0100
Adapter: PCI adapter
temp1:        +87.0°C  (crit = +120.0°C, hyst = +90.0°C)

k10temp-pci-00c3
Adapter: PCI adapter
temp1:        +62.9°C  (high = +70.0°C)
                       (crit = +67.0°C, hyst = +62.0°C)

it8720-isa-0228
Adapter: ISA adapter
in0:          +1.47 V  (min =  +0.00 V, max =  +4.08 V)
in1:          +1.94 V  (min =  +0.00 V, max =  +4.08 V)
in2:          +3.34 V  (min =  +0.00 V, max =  +4.08 V)
+5V:          +2.94 V  (min =  +0.00 V, max =  +4.08 V)
in4:          +3.02 V  (min =  +0.00 V, max =  +4.08 V)
in5:          +0.50 V  (min =  +0.00 V, max =  +4.08 V)
in6:          +3.34 V  (min =  +0.00 V, max =  +4.08 V)
5VSB:         +2.94 V  (min =  +0.00 V, max =  +4.08 V)
Vbat:         +3.25 V  
fan1:        1486 RPM  (min =    0 RPM)
fan2:           0 RPM  (min =    0 RPM)
fan3:        1997 RPM  (min =    0 RPM)
fan5:           0 RPM  (min =    0 RPM)
temp1:        +64.0°C  (low  = +127.0°C, high = +127.0°C)  sensor = thermistor
temp2:        +63.0°C  (low  = +127.0°C, high = +127.0°C)  sensor = thermal diode
temp3:        +84.0°C  (low  = +127.0°C, high = +127.0°C)  sensor = thermistor
cpu0_vid:    +1.250 V
intrusion0:  ALARM
smartctl -a /dev/sda :
smartctl 6.2 2014-07-16 r3952 [x86_64-linux-3.14.27-100.fc19.x86_64] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Caviar Green
Device Model:     WDC WD10EADS-00P8B0
Serial Number:    WD-WMAVU0216876
LU WWN Device Id: 5 0014ee 0ac47e8ac
Firmware Version: 01.00A01
User Capacity:    1 000 204 886 016 bytes [1,00 TB]
Sector Size:      512 bytes logical/physical
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ATA8-ACS (minor revision not indicated)
SATA Version is:  SATA 2.6, 3.0 Gb/s
Local Time is:    Fri Jan  8 13:35:52 2016 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x84)	Offline data collection activity
					was suspended by an interrupting command from host.
					Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		(27480) seconds.
Offline data collection
capabilities: 			 (0x7b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   2) minutes.
Extended self-test routine
recommended polling time: 	 ( 315) minutes.
Conveyance self-test routine
recommended polling time: 	 (   5) minutes.
SCT capabilities: 	       (0x303f)	SCT Status supported.
					SCT Error Recovery Control supported.
					SCT Feature Control supported.
					SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   175   172   021    Pre-fail  Always       -       6233
  4 Start_Stop_Count        0x0032   096   096   000    Old_age   Always       -       4757
  5 Reallocated_Sector_Ct   0x0033   198   198   140    Pre-fail  Always       -       15
  7 Seek_Error_Rate         0x002e   100   253   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   085   085   000    Old_age   Always       -       11377
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   097   097   000    Old_age   Always       -       3941
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       124
193 Load_Cycle_Count        0x0032   086   086   000    Old_age   Always       -       343555
194 Temperature_Celsius     0x0022   088   088   000    Old_age   Always       -       62
196 Reallocated_Event_Count 0x0032   199   199   000    Old_age   Always       -       1
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       14
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]


SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
smartctl -a /dev/sdb :
smartctl 6.2 2014-07-16 r3952 [x86_64-linux-3.14.27-100.fc19.x86_64] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Intel 320 Series SSDs
Device Model:     INTEL SSDSA2CW160G3
Serial Number:    CVPR13500AFQ160DGN
LU WWN Device Id: 5 001517 95967221d
Firmware Version: 4PC10362
User Capacity:    160 041 885 696 bytes [160 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    Solid State Device
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ATA8-ACS T13/1699-D revision 4
SATA Version is:  SATA 2.6, 3.0 Gb/s
Local Time is:    Fri Jan  8 13:38:26 2016 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00)	Offline data collection activity
					was never started.
					Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		(    1) seconds.
Offline data collection
capabilities: 			 (0x75) SMART execute Offline immediate.
					No Auto Offline data collection support.
					Abort Offline collection upon new
					command.
					No Offline surface scan supported.
					Self-test supported.
					Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   1) minutes.
Extended self-test routine
recommended polling time: 	 (   1) minutes.
Conveyance self-test routine
recommended polling time: 	 (   1) minutes.
SCT capabilities: 	       (0x003d)	SCT Status supported.
					SCT Error Recovery Control supported.
					SCT Feature Control supported.
					SCT Data Table supported.

SMART Attributes Data Structure revision number: 5
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  3 Spin_Up_Time            0x0020   100   100   000    Old_age   Offline      -       0
  4 Start_Stop_Count        0x0030   100   100   000    Old_age   Offline      -       0
  5 Reallocated_Sector_Ct   0x0032   100   100   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       7686
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       2686
170 Reserve_Block_Count     0x0033   100   100   010    Pre-fail  Always       -       0
171 Program_Fail_Count      0x0032   100   100   000    Old_age   Always       -       0
172 Erase_Fail_Count        0x0032   100   100   000    Old_age   Always       -       0
183 SATA_Downshift_Count    0x0030   100   100   000    Old_age   Offline      -       4
184 End-to-End_Error        0x0032   100   100   090    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
192 Unsafe_Shutdown_Count   0x0032   100   100   000    Old_age   Always       -       97
199 CRC_Error_Count         0x0030   100   100   000    Old_age   Offline      -       3
225 Host_Writes_32MiB       0x0032   100   100   000    Old_age   Always       -       246632
226 Workld_Media_Wear_Indic 0x0032   100   100   000    Old_age   Always       -       1125
227 Workld_Host_Reads_Perc  0x0032   100   100   000    Old_age   Always       -       99
228 Workload_Minutes        0x0032   100   100   000    Old_age   Always       -       461192
232 Available_Reservd_Space 0x0033   100   100   010    Pre-fail  Always       -       0
233 Media_Wearout_Indicator 0x0032   099   099   000    Old_age   Always       -       0
241 Host_Writes_32MiB       0x0032   100   100   000    Old_age   Always       -       246632
242 Host_Reads_32MiB        0x0032   100   100   000    Old_age   Always       -       339722

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]


SMART Selective self-test log data structure revision number 0
Note: revision number not 1 implies that no selective self-test has ever been run
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
Bombastic wrote:En fait, je ne suis pas obligé de laisser le boîtier ouvert l'été mais je le fais par précaution car il fait très lourd.
J'avais lu quelque part qu'ouvrir son boitier pour qu'il soit mieux ventilé n'était pas forcement une bonne idée.
Les boitier sont conçus pour assurer un flux d'aération vers les composants le demandant, et ouvrir son boitier contrarie ces flux.

Mais chacun fait comme il le veut.
Pour un PC qui plante aléatoirement, le premier test à faire est déjà de booter sur un Live et de lancer un memtest pendant plusieurs heures (une nuit complète)...