Bonsoir à tous,

Bon voilà j'ai un problème d'ordre matériel sur mon PC portable Sony Vaio VPCF13 qui a tout de même plus de 12 ans presque.

Ce problème n'est sans doute pas lié à Fedora mais bon étant donné que c'est du matériel j'ai placé le sujet ici.

Donc le pc a commencé à s'éteindre tout seul depuis quelque temps, et c'est très aléatoire mais assez régulier. Parfois ça va se produire une ou deux fois par jour, parfois quand ça arrive ça va se produire 5-10 fois d'affilée...
Alors je précise que la batterie n'est pas prise en charge également, est-ce qu'elle est morte ou pas je n'en sais rien, pourtant rachetée récemment (à peine 2 ans). Je viens de changer le cordon d'alimentation interne, l'ancien ayant un défaut. et j'ai repris bien sûr tout ce qui est pâte et pad thermique au niveau processeur et carte graphique.

Donc quand ça se produit, je suis obligé de débrancher le cordon d'alimentation secteur (pas de batterie --> fonctionnement sur secteur en permanence), d'appuyer sur le bouton d'allumage du PC et de le maintenir, tout en remettant le cordon secteur, et là après quelques secondes ça redémarre. Si ça tient tant mieux, si ça ne tient pas je recommence l'opération jusqu'à ce que ça fonctionne.

Bref je table sur un problème d'origine matérielle au niveau de la carte mère mais je voudrais quand même avoir vos avis pour ceux qui s'y connaissent un peu en problèmes matériels.
J'ai l'impression que le pc est vraiment vers sa fin de vie, et ça m'embête surtout car en ce moment même je suis dans une telle situation que je n'ai vraiment pas les moyens de m'en racheter un autre, même d'occasion en guise de remplacement temporaire.

Une autre chose qui m'interpelle, j'ai donc repris comme dit plus haut tout ce qui est conduction thermique et pourtant mon ventilo est tout le temps en marche, certes il n'est pas à fond mais il est audible même en idle. Donc je suis allé voir du côté de "sensors", et effectivement la température de la puce graphique est de 51°C en idle. Je trouve ça chaud, de mémoire elle était avant à 40-45°C en idle. Côté processeur je suis bien, il est à 32-35°C en idle.
Je précise que j'ai repris la pâte thermique par deux fois sur les deux éléments, hier et aujourd'hui, pensant en avoir mis trop, et je n'arrive toujours pas à faire descendre la température côté puce graphique.

Peut-être que c'est relié avec le problème d'extinction?

Merci d'avance à toutes celles et ceux qui se pencheront sur ma question.
Une précision : il faut appuyer le bouton de démarrage avant de rebrancher l'alimentation ?
Si oui, cela veut dire qu'il faut vider les condensateurs qui maintiennent un état foireux, donc sans doute un problème sur l'alimentation...
fgland wrote:Une précision : il faut appuyer le bouton de démarrage avant de rebrancher l'alimentation ?
Si oui, cela veut dire qu'il faut vider les condensateurs qui maintiennent un état foireux, donc sans doute un problème sur l'alimentation...
Bonsoir fgland,

Ça dépend en fait, parfois oui, parfois non.

Je veux dire par là, des fois quand il s'éteint, je peux le redémarrer directement au bouton de démarrage sans débrancher l'alimentation, et des fois non. je suis obligé de retirer la fiche d'alimentation côté PC, appuyer sur le bouton d'allumage et rebrancher l'alimentation tout en tenant le bouton. Parfois je débranche et rebranche la fiche d'alimentation et j'appuie sur le bouton après.
Le problème est là, c'est tellement aléatoire que je suis incapable de suivre une procédure donnée pour diagnostiquer le problème...

En ce qui concerne l'alimentation j'y ai pensé aussi, mais je doute que ça vienne de là, elle est aussi neuve que la batterie, c'est à dire deux ans. Après tu me diras, ça veut rien dire, elle peut très bien être en fin de vie également.

EDIT : mais la chose qui m'emmerde c'est que je n'arrive pas à faire descendre cette température de puce graphique, en idle elle a la même température actuellement qu'elle a en général lorsque je regarder une vidéo en 1080p par exemple.
Je me demande si le caloduc ne serait pas HS... Ça fonctionne un peu comme un circuit de clim ce truc là, et il y a deux caloducs qui mènent au ventilateur, un pour le processeur et l'autre pour la puce graphique. Du coup si la puce chauffe trop et que la température retournée par la sond est fausse, le système interne pourrait se mettre en sécurité et couper le PC. J'en sais rien, j'évoque des hypothèses...
Est-ce que la pile mémoire est encore bonne ? Ce qui pourrait induire un mauvais paramétrage de ton BIOS.

Le ventilateur est propre ? Ce qui pourrait engendrer un mauvais refroidissement.
Pas de paramètres particuliers pour la gestion de la CG dans le BIOS ?
Nicosss wrote:Est-ce que la pile mémoire est encore bonne ? Ce qui pourrait induire un mauvais paramétrage de ton BIOS.

Le ventilateur est propre ? Ce qui pourrait engendrer un mauvais refroidissement.
Pas de paramètres particuliers pour la gestion de la CG dans le BIOS ?
Bonsoir Nicosss,

En ce qui concerne la pile CMOS je n'en ai aucune idée, qu'est ce qui pourrait m'indiquer comme symptôme qu'elle est morte?

Ventilateur propre, comme je l'ai écrit plus haut, je m'y suis repris à deux fois, hier et aujourd'hui, à refaire la pâte thermique et les pads au niveau du processeur et de la puce graphique. J'en ai profité par la même occasion pour nettoyer le ventilateur et le radiateur, donc de ce côté là tout est propre.

En ce qui concerne le BIOS, c'est vraiment le plus basique du basique dans ce PC, à part configurer la date et l'heure, les mots de passe BIOS et disque dur, et choisir sur quoi le PC va booter au démarrage, il n'y a rien d'autre...
Si elle est morte alors ta configuration ne sera pas retenue et tu auras à chaque fois le paramétrage par défaut comme après un Clear CMOS.

Pour moi tu n'as pas précisé pour le ventilateur mais uniquement la pâte thermique donc ma question pour pouvait laisser sous-entendre la mauvaise circulation du flux d'air.

Si le BIOS est très restreint alors ça ne vient pas de là. A voir s'il n'y a pas une mise à jour dispo en cas quand même.

Pas de souci avec la RAM, un memtest a été réalisé ?

Quel pilote est utilisé avec la CG ?
Nicosss wrote:Si elle est morte alors ta configuration ne sera pas retenue et tu auras à chaque fois le paramétrage par défaut comme après un Clear CMOS.
Ok alors je n'ai pas de soucis de ce côté là. En même temps vu le nombre d'options qu'il y a dans le BIOS... :-D
Nicosss wrote:Pour moi tu n'as pas précisé pour le ventilateur mais uniquement la pâte thermique donc ma question pour pouvait laisser sous-entendre la mauvaise circulation du flux d'air.
Au temps pour moi, quand je fais cette opération je fais le nettoyage complet + pâte thermique donc c'était sous-entendu, mais bon je conçois que derrière un écran ce n'est pas forcément une évidence pour tout le monde.
Nicosss wrote:Si le BIOS est très restreint alors ça ne vient pas de là. A voir s'il n'y a pas une mise à jour dispo en cas quand même.
La dernière mise à jour de ce BIOS date d'une bonne dizaine d'années, il n'y en a plus eu depuis.
Nicosss wrote:Pas de souci avec la RAM, un memtest a été réalisé ?
Alors je n'ai pas de soucis avec la RAM, cela dit je me souviens avoir fait un memtest il y a quelque temps pour un autre souci (genre il y a 6 mois peut-être un peu plus), et le memtest ne commençait même pas.
Il y avait une erreur au niveau du CPU, après j'ai abandonné le test en lui même et le souci était de toute façon rentré dans l'ordre. Le PC fonctionne d'ailleurs sans problème de ce côté là.
Nicosss wrote:Quel pilote est utilisé avec la CG ?
J'utilise le pilote nouveau, impossible d'utiliser le pilote nVidia avec ce PC, enfin c'est possible mais plus d'emmerde à la maintenance que de gains réels par rapport au pilote nouveau.
Bon il y a clairement un problème de chauffe au niveau du GPU intégré.

J'ai repris encore une fois la pâte thermique aujourd'hui (eh oui j'ai un peu de mal avec la notion "grain de riz") dans le doute, mais ça ne change pas grand chose.
En idle, le processeur double coeur est à 30-35°C, en activité à environ 50-60°C, et il redescend assez vite à la température idle.

Par contre le GPU dès le démarrage il monte à 50°C en idle, et même sur des tâches légères (video youtube en 720p par exemple), il peut monter jusqu'à 65-70 °C...
Donc soit le GPU est entrain de se faire la malle, soit le caloduc qui y est associé est mort.

Est-ce que ce problème est lié au fait que le PC s'éteigne inopinément, je me pose la question...
La protection par surchauffe entrainant une extinction est en effet un fonctionnement que l'on retrouve sur les machines. Après qu'elle soit réelle ou fictive ton ventilateur devrait être asservi et donc tourner plus vite. Est-ce le cas ?

As-tu la possibilité d'ajouter un radiateur passif à cet endroit (portable ouvert) et surveiller les températures ?
$ watch -n 1 sensors
Salut Nicosss
Nicosss wrote:La protection par surchauffe entrainant une extinction est en effet un fonctionnement que l'on retrouve sur les machines. Après qu'elle soit réelle ou fictive ton ventilateur devrait être asservi et donc tourner plus vite. Est-ce le cas ?
Oui effectivement, ça aussi j'ai oublié de le préciser comme l'histoire du nettoyage du ventilateur hier.
Le ventilo pour sa part tourne en adéquation avec les températures, c'est d'ailleurs comme ça que je me suis rendu compte que quelque chose ne tournait pas rond... Il mouline presque comme si j'étais entrain de compiler sur la machine.

Mais je ne saurais pas dire si cette surchauffe entraîne l'extinction, car le phénomène d'extinction est apparu environ une dizaine voire quinzaine auparavant, à compter d'aujourd'hui.
Nicosss wrote:As-tu la possibilité d'ajouter un radiateur passif à cet endroit (portable ouvert) et surveiller les températures ?
$ watch -n 1 sensors
Non malheureusement, la place est restreinte et surtout le bloc caloducs-ventilo est fait de telle manière que pour poser un radiateur passif il faudrait simplement virer la pièce d'origine complète, ce qui implique d'en mettre un également sur le processeur, et là c'est galère pour ne pas dire pas faisable.
Peut être des condos qui sont HS. Cela arrive surtout avec les condensateurs chimique.
Bonsoir VINDICATORs
VINDICATORs wrote:Peut être des condos qui sont HS. Cela arrive surtout avec les condensateurs chimique.
Effectivement et c'est bien ça qui me fait peur...
Si c'est un composant sur la CM qui se fait la malle, ça ne va qu'empirer avec le temps et bien sûr c'est irréparable.
Pourvu qu'il tienne le temps que je puisse en racheter un autre.
GOGI wrote:Bonsoir VINDICATORs
VINDICATORs wrote:Peut être des condos qui sont HS. Cela arrive surtout avec les condensateurs chimique.
Effectivement et c'est bien ça qui me fait peur...
Si c'est un composant sur la CM qui se fait la malle, ça ne va qu'empirer avec le temps et bien sûr c'est irréparable.
Pourvu qu'il tienne le temps que je puisse en racheter un autre.
En général les condensateurs ont tendance à gonfler, ce qui est plus visible sur une CM de fixe à proximité du CPU, ou sécher, ce qui est beaucoup moins visible par contre.

Que retourne sensors car celle-ci récupère aussi les différentes tensions.
Nicosss wrote:En général les condensateurs ont tendance à gonfler, ce qui est plus visible sur une CM de fixe à proximité du CPU, ou sécher, ce qui est beaucoup moins visible par contre.
Oui je vois très bien, je suis un peu dans le métier, pas directement dans l'éléctronique pure, mais je fais souvent face à des cartes éléctroniques. Mais ici il n'y a rien de visible, en tous cas pas ce genre de condos qui gonflent et prêts à exploser. À vue d'oeil la CM est en bon état.
Nicosss wrote:Que retourne sensors car celle-ci récupère aussi les différentes tensions.
Alors c'est pas très bavard au niveau tensions, mais c'est dans la plage :
Every 1,0s: sensors                                                                fedora.home: Fri Nov 18 18:48:41 2022

nouveau-pci-0100
Adapter: PCI adapter
GPU core:    900.00 mV (min =  +0.83 V, max =  +0.95 V)
temp1:        +55.0°C  (high = +95.0°C, hyst =  +3.0°C)
                       (crit = +105.0°C, hyst =  +5.0°C)
                       (emerg = +135.0°C, hyst =  +5.0°C)

coretemp-isa-0000
Adapter: ISA adapter
Core 0:       +38.0°C  (high = +95.0°C, crit = +105.0°C)
Core 2:       +35.0°C  (high = +95.0°C, crit = +105.0°C)

acpitz-acpi-0
Adapter: ACPI interface
temp1:        +36.0°C  (crit = +100.0°C)
temp2:        +36.0°C  (crit = +100.0°C)
Là c'est en idle avec quatre onglets ouverts dans Firefox, et thunderbird en arrière plan sur un autre bureau.

Et ça c'est le retour de la commande suivante :
$ ps aux --sort pcpu

gogi        3584  0.7  2.0 2761792 169848 ?      Sl   15:40   1:30 /usr/lib64/firefox/firefox -contentproc -childID 6 -isForBrowser -prefsLen 41177 -prefMapSize 236634 -jsInitLen 246704 -parentBuild
root        6772  0.7  0.0      0     0 ?        I    18:08   0:19 [kworker/u16:44-btrfs-endio-write]
root        7111  0.9  0.0      0     0 ?        D    18:13   0:20 [kworker/u16:0+events_unbound]
gogi        3440  1.2  3.2 2961484 266764 ?      Sl   15:40   2:21 /usr/lib64/firefox/firefox -contentproc -childID 4 -isForBrowser -prefsLen 36640 -prefMapSize 236634 -jsInitLen 246704 -parentBuild
gogi        3734  1.4  0.8 502956 70232 ?        Sl   15:40   2:45 /usr/lib64/firefox/firefox -contentproc -parentBuildID 20221104095936 -prefsLen 41268 -prefMapSize 236634 -appDir /usr/lib64/firefo
gogi        3543  1.5  3.1 24324752 257024 ?     Sl   15:40   2:54 /usr/lib64/firefox/firefox -contentproc -childID 5 -isForBrowser -prefsLen 41153 -prefMapSize 236634 -jsInitLen 246704 -parentBuild
gogi        2280  3.2  3.1 5024144 251632 ?      Ssl  15:37   6:10 /usr/bin/gnome-shell
gogi        5579  5.1  4.4 3178256 365072 ?      Sl   15:58   8:50 /usr/lib64/firefox/firefox -contentproc -childID 26 -isForBrowser -prefsLen 41414 -prefMapSize 236634 -jsInitLen 246704 -parentBuil
gogi        3279 10.5  7.0 3846364 575384 ?      Sl   15:40  20:02 /usr/lib64/firefox/firefox
Je n'ai copié-collé que les dernières lignes, le reste n'est pas relevant au niveau utilisation CPU.
Je précise que l'on voit ici 10% pour Firefox mais c'est à répartir sur 2 coeurs et 2 threads, mais bon même quand je ferme Firefox ça ne change rien au niveau des températures.