Bonjour,
Ma Fedora 33 ne boote plus depuis 2 jours et mon analyse semble montrer que cela vient du driver propriétaire NVidia qui ne se charge plus correctement pour une raison qui m'échappe.
Les symptomes :
- au boot, le menu grub apparait
- je sélectionne la dernière entrée du noyau et la sequence de boot démarre
- j'obtiens d'abord un écran noir avec juste un " - " dnas le coin haut-gauche
- puis s'affiche un écran gris avec 3 points corrés alignés horizontalement au centre de l'écran
- puis plus rien ne bouge (j'ai attendu plus de 30mn)
- Appuyer sur Esc (ou autres combinaisons de touches comme ctrl-alt-Fx) ne donne rien => pas de switch vers la console
Log du boot journalctl -b -1
[/b]
avril 24 12:25:26 moria akmods[760]: Building and installing nvidia-kmod[ OK ]
avril 24 12:25:26 moria systemd-udevd[493]: Configuration file /etc/udev/rules.d/64-smfp_hp.rules is marked executable. Please remove executabl>
avril 24 12:25:26 moria kernel: nvidia: loading out-of-tree module taints kernel.
avril 24 12:25:26 moria kernel: nvidia: module license 'NVIDIA' taints kernel.
avril 24 12:25:26 moria kernel: Disabling lock debugging due to kernel taint
avril 24 12:25:26 moria kernel: nvidia: module verification failed: signature and/or required key missing - tainting kernel
avril 24 12:25:26 moria kernel: nvidia-nvlink: Nvlink Core is being initialized, major device number 237
avril 24 12:25:26 moria kernel:
avril 24 12:25:26 moria kernel: nvidia 0000:01:00.0: vgaarb: changed VGA decodes: olddecodes=io+mem,decodes=none:owns=io+mem
avril 24 12:25:27 moria kernel: NVRM: loading NVIDIA UNIX x86_64 Kernel Module 465.24.02 Thu Apr 8 17:55:47 UTC 2021
avril 24 12:25:27 moria kernel: nvidia-modeset: Loading NVIDIA Kernel Mode Setting Driver for UNIX platforms 465.24.02 Thu Apr 8 17:50:51 UT>
avril 24 12:25:27 moria kernel: [drm] [nvidia-drm] [GPU ID 0x00000100] Loading driver
avril 24 12:25:27 moria systemd-udevd[8449]: nvidia: Process '/usr/bin/bash -c '/usr/bin/mknod -Z -m 666 /dev/nvidiactl c 195 255'' failed with>
avril 24 12:25:27 moria kernel: resource sanity check: requesting [mem 0x000e0000-0x000fffff], which spans more than PCI Bus 0000:00 [mem 0x000>
avril 24 12:25:27 moria kernel: caller _nv032851rm+0x2d/0x60 [nvidia] mapping multiple BARs
avril 24 12:25:27 moria kernel: resource sanity check: requesting [mem 0x000c0000-0x000fffff], which spans more than PCI Bus 0000:00 [mem 0x000>
avril 24 12:25:27 moria kernel: caller _nv000712rm+0x1af/0x200 [nvidia] mapping multiple BARs
avril 24 12:25:28 moria kernel: BUG: unable to handle page fault for address: ffff8e5d0642d000
avril 24 12:25:28 moria kernel: #PF: supervisor write access in kernel mode
avril 24 12:25:28 moria kernel: #PF: error_code(0x0003) - permissions violation
avril 24 12:25:28 moria kernel: PGD 3f4a01067 P4D 3f4a01067 PUD 1460fa063 PMD 1460fb063 PTE 800000014642d161
avril 24 12:25:28 moria kernel: Oops: 0003 [#1] SMP PTI
...
...
...
...
avril 24 12:28:27 moria systemd-udevd[493]: nvidia: Worker [8451] processing SEQNUM=3931 killed
avril 24 12:28:27 moria systemd-udevd[8449]: nvidia: Spawned process '/usr/bin/bash -c 'for i in $(cat /proc/driver/nvidia/gpus/*/information |>
avril 24 12:28:27 moria systemd-udevd[8449]: nvidia: Process '/usr/bin/bash -c 'for i in $(cat /proc/driver/nvidia/gpus/*/information | grep Mi>
avril 24 12:28:27 moria systemd-udevd[8449]: nvidia: Failed to wait for spawned command '/usr/bin/bash -c 'for i in $(cat /proc/driver/nvidia/g>
avril 24 12:28:27 moria systemd-udevd[8449]: nvidia: Failed to execute '/usr/bin/bash -c 'for i in $(cat /proc/driver/nvidia/gpus/*/information>
avril 24 12:28:27 moria systemd-udevd[493]: nvidia: Worker [8449] processing SEQNUM=3932 killed
avril 24 12:28:27 moria systemd-udevd[493]: Worker [8451] terminated by signal 9 (KILL)
avril 24 12:28:27 moria systemd-udevd[493]: nvidia: Worker [8451] failed
avril 24 12:28:27 moria systemd-udevd[493]: Worker [8449] terminated by signal 9 (KILL)
avril 24 12:28:27 moria kernel: usb 3-9: new low-speed USB device number 10 using xhci_hcd
avril 24 12:28:27 moria kernel: usb 3-9: New USB device found, idVendor=17ef, idProduct=600e, bcdDevice= 1.00
avril 24 12:28:27 moria kernel: usb 3-9: New USB device strings: Mfr=0, Product=2, SerialNumber=0
avril 24 12:28:27 moria kernel: usb 3-9: Product: Lenovo Optical Mouse
avril 24 12:28:27 moria kernel: input: Lenovo Optical Mouse as /devices/pci0000:00/0000:00:14.0/usb3/3-9/3-9:1.0/0003:17EF:600E.000A/input/inpu>
avril 24 12:28:27 moria kernel: hid-generic 0003:17EF:600E.000A: input,hidraw2: USB HID v1.11 Mouse [Lenovo Optical Mouse] on usb-0000:00:14.0->
avril 24 12:28:27 moria mtp-probe[8526]: checking bus 3, device 10: "/sys/devices/pci0000:00/0000:00:14.0/usb3/3-9"
avril 24 12:28:27 moria mtp-probe[8526]: bus: 3, device: 10 was not an MTP device
avril 24 12:28:27 moria mtp-probe[8540]: checking bus 3, device 10: "/sys/devices/pci0000:00/0000:00:14.0/usb3/3-9"
avril 24 12:28:27 moria mtp-probe[8540]: bus: 3, device: 10 was not an MTP device
avril 24 12:29:27 moria kernel: usb 3-9: USB disconnect, device number 10
avril 24 12:29:29 moria kernel: usb 3-9: new low-speed USB device number 11 using xhci_hcd
avril 24 12:29:29 moria kernel: usb 3-9: New USB device found, idVendor=17ef, idProduct=600e, bcdDevice= 1.00
avril 24 12:29:29 moria kernel: usb 3-9: New USB device strings: Mfr=0, Product=2, SerialNumber=0
avril 24 12:29:29 moria kernel: usb 3-9: Product: Lenovo Optical Mouse
avril 24 12:29:29 moria kernel: input: Lenovo Optical Mouse as /devices/pci0000:00/0000:00:14.0/usb3/3-9/3-9:1.0/0003:17EF:600E.000B/input/inpu>
avril 24 12:29:29 moria kernel: hid-generic 0003:17EF:600E.000B: input,hidraw2: USB HID v1.11 Mouse [Lenovo Optical Mouse] on usb-0000:00:14.0->
avril 24 12:29:29 moria mtp-probe[8549]: checking bus 3, device 11: "/sys/devices/pci0000:00/0000:00:14.0/usb3/3-9"
avril 24 12:29:29 moria mtp-probe[8549]: bus: 3, device: 11 was not an MTP device
avril 24 12:29:29 moria mtp-probe[8564]: checking bus 3, device 11: "/sys/devices/pci0000:00/0000:00:14.0/usb3/3-9"
avril 24 12:29:29 moria mtp-probe[8564]: bus: 3, device: 11 was not an MTP device
Ma machine
- PC fixe
- dual boot avec grub : Windows 10 + Linux Fedora 33
- NVidia GeForce GTX 960 graphical card.
- Dernier noyau installé (up-to-date) : 5.11.15-200.fc33.x86_64
- Gnome Shell desktop environment (3.38.5)
- Distrib installée depuis 2 ans avec des updates hebdo sans pb (je fais "dnf update" au moins une fois par mois)
- première fois que j'ai ce pb
Driver :
- J'utilise le driver propriétaire de NVdia (plutôt que le driver opern-source nouveau) parce que nouveau ne me donne pas les perfs dont j'ai besoin. J'utilise une appli (FoundryVTT) qui fait une très forte utilisation de GL. Avec le driver proprio j'ai mes 60 fps, avec nouveau j'ai à peine 10 fps.
- J'ai installé le driver nvidia depuis rpmfusion avec la commande suivante
dnf install akmod-nvidia
- le dernier rpm de rpmfusion a été installé il y a 2 jours (en même temps que la dernière maj du noyau)
- le driver nvidia installé (d'après la commande
dnf info akmod-nvidia
) :
Version : 465.24.02
Publication : 1.fc33
Architecture : x86_64
Source : nvidia-kmod-465.24.02-1.fc33.src.rpm
DNF update history
Je vois dans l'historique de DNF qu'il y a bien eu des maj il y a 2 jours concernant le driver nvidia :
2021-04-23T01:48:09+0200 SUBDEBUG Installed: kmod-nvidia-5.11.15-200.fc33.x86_64-3:465.24.02-1.fc33.x86_64
2021-04-23T01:48:26+0200 SUBDEBUG Installed: kmod-VirtualBox-5.11.15-200.fc33.x86_64-6.1.18-1.fc33.x86_64
2021-04-23T01:49:25+0200 SUBDEBUG Upgrade: kmod-nvidia-5.11.11-200.fc33.x86_64-3:465.24.02-1.fc33.x86_64
2021-04-23T01:49:30+0200 SUBDEBUG Upgraded: kmod-nvidia-5.11.11-200.fc33.x86_64-3:460.67-1.fc33.x86_64
Grub :
Voici la ligne de mon fichier de config /etc/default/grub :
GRUB_CMDLINE_LINUX="resume=UUID=8b9522ee-191f-4fa9-ab29-cf8a76a0bf60 rhgb quiet rd.driver.blacklist=nouveau modprobe.blacklist=nouveau nvidia-drm.modeset=1"
Et je génère le boot grub avec la commande
grub2-mkconfig -o /boot/grub2/grub.cfg
Ce que j'ai essayé :
- Désinstaller / reinstaller akmod_nvidia => ça n'a rien changé
- Retirer le parametre
nvidia-drm.modeset=1
de la ligne du noyau dans grub => ça n'a rien changé
Notes :
- Je n'ai aucun pb sur mon Windows : la carte ggraphique nvidia est bien pris en charge normalement (driver 27.21.14.6611)
- Je peux booter avec la ligne grub "rescue", ce qui me permet d'analyser ma config mais je me retrouve dans une session sans driver video évolué
- j'ai testé avec les versions précédentes du noyau (autres lignes de Fedora dans le menu grub)
Des personnes anglophones ont essayé de m'aider sur le Reddit Fedora mais sans succès jusqu'ici.
https://www.reddit.com/r/Fedora/comments/mx9cnv/fedora_33_not_booting_due_to_recent_nvidia_driver/
Si vous avez une idée, je suis preneur et je vous en remercie d'avance 🙂