craniumbasher
Bonjour,
j'ai actuellement un problème avec Fedora et ma carte graphique Vega 56.
Lorsque la carte graphique est en charge (lancement de jeu qui exploite pas mal la carte graphique), fedora reboote sans motif apparent.
J'ai regardé dans le journal de log mais je ne vois rien concernant un crash ayant un lien avec la partie graphique.
Après avoir écarté un potentiel problème matériel, j'ai décidé d'essayé de lancer les mêmes jeux sur Windows avec les mêmes options graphiques et là, je ne rencontre aucun reboot.
J'utilise le pilote libre AMDGPU (version à jour) et j'ai tendance à croire que le problème vient de celui-ci.
Est ce quelqu'un a déjà rencontré ce problème et trouvé la solution pour y palier ?
merci d'avance pour votre support
madko
Bonjour,
juste pour clarifier, c'est un reboot électrique ? Genre gros plantage ? Ce n'est pas Fedora qui lance la séquence de reboot, en arrêtant proprement les programmes ?
Si possible il faudrait surveiller les températures.
craniumbasher
Bonjour Madko,
les températures n'ont rien d'anormales, le GPU plafonne à 75°C et le processeur à 40-45°C.
En fait, dès qu'un jeux (assez gourmand) se charge, il y a reboot instantané comme un reboot électrique.
Ce qui me fait penser que cela vient de Fedora ou du pilote AMDGPU est que le soucis n'apparaissait pas quelques semaines auparavant.
De plus pourquoi ne pas avoir le problème sur Windows.
Je suis un peu perdu sur comment trouver la solution à ce problème.
madko
Comme les pilotes entre windows et linux ne sont pas les mêmes, la gestion des ventillo diffère, d'où une différence de température possible et un crash lié à cela. Mais si les températures sont identiques et que ça crash que sous Linux en effet le problème est bien là. Tu as tenté de booter sur un vieux kernel ? Sur d'autres thread il y a des soucis a priori avec le kernel 5.2.x et amdgpu.
VINDICATORs
Cela n'a rien à voir avec le pilote libre/non libre.
Il faudrait voir les logs, cela ressemble au problème de réglage de base du ventilo. Ce n'est pas parce que la température du gpu est correct que la température d'un autre point chaud de la carte graphique ne soit pas trop élevé (mémoire, VRM, ...).
Il est possible de gérer la vitesse avec pwmconfig et fancontrol. Une petite augmentation par défaut permet souvent de corriger ce genre de chose.
Il pourait aussi y avoir un lien avec le problème que j'ai actuellement avec la série des noyaux 5.2, mais chez moi cela provoque des blocages et pas de reboot.
https://forums.fedora-fr.org/viewtopic.php?id=69702
craniumbasher
Je n'ai pas pensé à booter sur un ancien kernel.
Je vais essayé ça au plus vite en espérant que le problème vienne effectivement du kernel 5.2.x et AMDGPU.
En tout cas merci pour ton aide Madko.
craniumbasher
Bonjour,
j'ai essayé de modifier fancontrol.
Voici ce que j'obtiens quand j'essaie de lancer fancontrol.
[craniumbasher@Host-001 ~]$ fancontrol
Loading configuration from /etc/fancontrol ...
Common settings:
INTERVAL=10
Settings for :
Depends on hwmon1/temp1_input
Controls
MINTEMP=20
MAXTEMP=65
MINSTART=150
MINSTOP=48
MINPWM=48
MAXPWM=255
/usr/sbin/fancontrol: Invalid path to sensors
VINDICATORs
Perso j'ai cela :
MINTEMP=45
MAXTEMP=85
MINSTART=35
MINSTOP=55
MINPWM=50
MAXPWM=255
Lance le service fancontrol :
systemctl start fancontrol
Si c'est bon (regarde la différence de retour de la commande "sensors") tu peux le mettre sur enable pour le lancer au démarrage :
systemctl enable fancontrol
Après il y a une astuce pour qu'il garde ce démarrage forcé même si tu le met en veille (par exemple) :
https://forums.fedora-fr.org/viewtopic.php?pid=598817#p598817
Encore plus simple :
https://forums.fedora-fr.org/viewtopic.php?pid=598820#p598820
craniumbasher
merci Vindicators pour ton support.
J'ai modifier mon fichier en mettant les mêmes paramètres que toi.
J'ai remis la carte en charge après avoir lancer le service fancontrol.... pas d'évolution.
Je suis d'accord avec toi sur le fait que le problème vient de la température donc de la vitesse de rotation de la turbine (mon GPU est un modèle à turbine) car quand je lance des benchmarks, ca ne plante pas.
craniumbasher
Bon je pense avoir trouvé le problème.
A vérifier sur un laps de temps plus grand mais il semblerait que ce soit le fait de mettre l'anti aliasing à fond qui fait rebooter.
Je viens de refaire un test sur 2 jeux qui provoquaient un reboot, en baissant ce paramètre je n'ai pas eu de reboot jusqu'à présent.
En tout cas merci à vous deux Madko et Vindicators, j'aurai appris des choses sur la gestion des ventilateurs 🙂
VINDICATORs
Mes réglages sont adaptés à mes expériences avec ma carte graphique. Il faut les adapter pour soit, mais c'était une bonne base.
A mon avis comme je l'ai dit tu dois avoir un composant qui surchauffe, regarde en forçant MINSTART avec une valeur plus haute (50, voir 80). C'est bruyant, mais bon.
Après oui les turbines c'est pas le pied en refroidissement. Si tu trouve prend quelque chose de plus solide style Artic cooling Xtrem III ou IV par exemple.
C'est/était le plus gros défaut des AMD radeon. Mais comme je l'ai dit il est possible que ce soit un composant qui est mal refroidit.
Pense à change la pâte thermique, elle a tendance à sécher avec le temps. Voir dépoussière bien.
craniumbasher
OK je vais essayé en modifiant les réglages et je ferai un retour sur le forum.
craniumbasher
Bon ca n'a été qu'une victoire de courte durée. Le problème n'est absolument pas réglé.
Je vais attendre une mise à jour de kernel ou bien une réinstall complète sans mise à jour du kernel voir si ca change quelque chose.
VINDICATORs
Repasse sur un noyau 5.1 en attendant :
https://koji.fedoraproject.org/koji/packageinfo?packageID=8
Cela corrige beaucoup de problèmes.
craniumbasher
J'ai essayé de réinstaller les rpms 1 par 1 sauf que certains ne veulent pas s'installer. En rebootant je suis bien sur le kernel que je viens d'installer mais avec un affichage par défaut et non modifiable.
Est ce qu'il y a une manip particulière pour installer les rpms en incluant d'éventuelles dépendances ?
craniumbasher
En fait le soucis est que maintenant ma carte graphique n'est plus reconnue.
J'ai fait un "modinfo -p amdgpu" mais ca me répond :
"modinfo: ERROR: Module amdgpu not found."
VINDICATORs
Il faut le charger au boot, ce doit être par défaut dans les 5.2, mais pas 5.1. Voir la doc dans la section documentation.
Pour les rpm il faut telecharger tout ceux que tu avait
dnf list kernel*
Et installer avec :
sudo dnf update kernel*.rpm
Dans le répertoire où tu les as téléchargé.
craniumbasher
OK merci pour l'info, je n'ai jamais fait la manipulation de revenir sur un kernel antérieur ca me permet d'apprendre en même temps.
Je ferai un retour ce soir après avoir tester.
craniumbasher
Bon j'ai résolu mon problème de module ADMGPU qui n'était pas chargé. L’exécution d'un des rpms avait échoué.
Après désinstallation puis réinstallation de tous les rpms lié au kernel 5.1.20, l'affichage se fait correctement.
Maintenant je vais tester la stabilité sur ce kernel, voir si ca arrange mes problèmes de reboot.
VINDICATORs
C'est pour cela que je te disais de faire la liste de ce qui est déjà présent.