Salut,

Ma Fedora installée depuis une semaine en architecture x86_64 reboote occasionnellement, sans que je n'ai rien demandé.

Ca se passe surtout au démarrage, quand la barre bleue foncée vient de se remplir à 100%, quelquefois peu après le démarrage de GNOME (~5-10 secondes), et parfois n'importe quand (mais relativement souvent quand je me sers intensivement de ma carte graphique NVidia avec Wine).

La dernière fois que ça s'est produit, j'ai eu une notification "Kernel failure" qui m'a donné le rapport suivant (mais ça ne faisait pas ce message avant, je n'avais rien).
Kernel failure message 1:
------------[ cut here ]------------
WARNING: at lib/list_debug.c:30 __list_add+0x6e/0x87()
list_add corruption. prev->next should be next (ffffffffa0044620), but was 0000000000000000. (prev=ffff88013b1234f8).
Modules linked in: snd_hda_intel(+) snd_seq_dummy snd_seq_oss snd_seq_midi_event snd_seq snd_seq_device snd_pcm_oss snd_mixer_oss snd_pcm snd_timer snd_page_alloc snd_hwdep snd pata_acpi(+) iTCO_wdt iTCO_vendor_support soundcore i82975x_edac(+) nvidia(P+) edac_core firewire_ohci(+) firewire_core crc_itu_t pcspkr pata_jmicron i2c_i801 i2c_core serio_raw sky2 shpchp [last unloaded: scsi_wait_scan]
Pid: 1101, comm: modprobe Tainted: P        W 2.6.27.9-159.fc10.x86_64 #1
Dec 28 17:29:13 Tempest kernel: Call Trace:
[<ffffffff81041673>] warn_slowpath+0x8c/0xb5
[<ffffffff81094d17>] ? __alloc_pages_internal+0xfe/0x457
[<ffffffff8117110f>] __list_add+0x6e/0x87
[<ffffffffa003c73e>] fw_card_add+0x56/0x78 [firewire_core]
[<ffffffffa004c05e>] pci_probe+0x300/0x4a2 [firewire_ohci]
[<ffffffff81179c3f>] pci_device_probe+0xb9/0x110
[<ffffffff8110df0d>] ? sysfs_create_link+0xe/0x11
[<ffffffff811f4b0c>] driver_probe_device+0xc0/0x16e
[<ffffffff811f4c09>] __driver_attach+0x4f/0x79
[<ffffffff811f4bba>] ? __driver_attach+0x0/0x79
[<ffffffff811f439f>] bus_for_each_dev+0x4f/0x89
[<ffffffff811f4957>] driver_attach+0x1c/0x1e
[<ffffffff811f3cbf>] bus_add_driver+0xb7/0x201
[<ffffffff811f4df8>] driver_register+0xa8/0x128
[<ffffffffa0032000>] ? fw_ohci_init+0x0/0x20 [firewire_ohci]
[<ffffffff81179ed1>] __pci_register_driver+0x66/0xa1
[<ffffffffa0032000>] ? fw_ohci_init+0x0/0x20 [firewire_ohci]
[<ffffffffa003201e>] fw_ohci_init+0x1e/0x20 [firewire_ohci]
[<ffffffff8100a047>] do_one_initcall+0x47/0x12e
[<ffffffff81065c2d>] sys_init_module+0xa9/0x1b6
[<ffffffff8101024a>] system_call_fastpath+0x16/0x1b
Dec 28 17:29:13 Tempest kernel: ---[ end trace 5baeadcf9dffe69c ]---


Kernel failure message 2:
------------[ cut here ]------------
WARNING: at lib/list_debug.c:30 __list_add+0x6e/0x87()
list_add corruption. prev->next should be next (ffffffffa0044620), but was 0000000000000000. (prev=ffff88013b1234f8).
Modules linked in: snd_hda_intel(+) snd_seq_dummy snd_seq_oss snd_seq_midi_event snd_seq snd_seq_device snd_pcm_oss snd_mixer_oss snd_pcm snd_timer snd_page_alloc snd_hwdep snd pata_acpi(+) iTCO_wdt iTCO_vendor_support soundcore i82975x_edac(+) nvidia(P+) edac_core firewire_ohci(+) firewire_core crc_itu_t pcspkr pata_jmicron i2c_i801 i2c_core serio_raw sky2 shpchp [last unloaded: scsi_wait_scan]
Pid: 1101, comm: modprobe Tainted: P          2.6.27.9-159.fc10.x86_64 #1
Dec 28 17:29:13 Tempest kernel: Call Trace:
[<ffffffff81041673>] warn_slowpath+0x8c/0xb5
[<ffffffff81094d17>] ? __alloc_pages_internal+0xfe/0x457
[<ffffffff8117110f>] __list_add+0x6e/0x87
[<ffffffffa003c73e>] fw_card_add+0x56/0x78 [firewire_core]
[<ffffffffa004c05e>] pci_probe+0x300/0x4a2 [firewire_ohci]
[<ffffffff81179c3f>] pci_device_probe+0xb9/0x110
[<ffffffff8110df0d>] ? sysfs_create_link+0xe/0x11
[<ffffffff811f4b0c>] driver_probe_device+0xc0/0x16e
[<ffffffff811f4c09>] __driver_attach+0x4f/0x79
[<ffffffff811f4bba>] ? __driver_attach+0x0/0x79
[<ffffffff811f439f>] bus_for_each_dev+0x4f/0x89
[<ffffffff811f4957>] driver_attach+0x1c/0x1e
[<ffffffff811f3cbf>] bus_add_driver+0xb7/0x201
[<ffffffff811f4df8>] driver_register+0xa8/0x128
[<ffffffffa0032000>] ? fw_ohci_init+0x0/0x20 [firewire_ohci]
[<ffffffff81179ed1>] __pci_register_driver+0x66/0xa1
[<ffffffffa0032000>] ? fw_ohci_init+0x0/0x20 [firewire_ohci]
[<ffffffffa003201e>] fw_ohci_init+0x1e/0x20 [firewire_ohci]
[<ffffffff8100a047>] do_one_initcall+0x47/0x12e
[<ffffffff81065c2d>] sys_init_module+0xa9/0x1b6
[<ffffffff8101024a>] system_call_fastpath+0x16/0x1b
Dec 28 17:29:13 Tempest kernel: ---[ end trace 5baeadcf9dffe69c ]---
Question : pourquoi ces redémarrages intempestifs, quelle est la source du problème et comment avoir un kernel stable ?
Salut.
[<ffffffffa003c73e>] fw_card_add+0x56/0x78 [firewire_core]
[<ffffffffa004c05e>] pci_probe+0x300/0x4a2 [firewire_ohci]
Tu as qq chose sur le Firewire ?

++
eddy33 wrote:Salut.
[<ffffffffa003c73e>] fw_card_add+0x56/0x78 [firewire_core]
[<ffffffffa004c05e>] pci_probe+0x300/0x4a2 [firewire_ohci]
Tu as qq chose sur le Firewire ?

++
Non, rien du tout.

Je n'ai de branché que ma souris et mon clavier USB, mon écran et un casque.
Bonsoir,

Tu n'aurais pas un problème de surchauffe ?

Mais ça devrait apparaitre dans les logs si c'était le cas non ?

J'ai eu ce même problème sur mon portable, c'était les sondes thermiques qui coupaient.
Que te renvoie :
# lsmod
++
@eddy33 :
Module                  Size  Used by
fuse                   60992  2 
nfsd                  252904  17 
lockd                  72160  1 nfsd
nfs_acl                11264  1 nfsd
auth_rpcgss            46096  1 nfsd
exportfs               12672  1 nfsd
sunrpc                191208  12 nfsd,lockd,nfs_acl,auth_rpcgss
ip6t_REJECT            12160  2 
nf_conntrack_ipv6      22984  2 
ip6table_filter        11136  1 
ip6_tables             26128  1 ip6table_filter
ipv6                  287272  74 ip6t_REJECT,nf_conntrack_ipv6
dm_multipath           23704  0 
uinput                 16128  1 
snd_hda_intel         533412  5 
snd_seq_dummy          11396  0 
snd_seq_oss            39104  0 
snd_seq_midi_event     14848  1 snd_seq_oss
snd_seq                61712  5 snd_seq_dummy,snd_seq_oss,snd_seq_midi_event
snd_seq_device         15252  3 snd_seq_dummy,snd_seq_oss,snd_seq
snd_pcm_oss            51200  0 
snd_mixer_oss          23168  1 snd_pcm_oss
snd_pcm                84360  3 snd_hda_intel,snd_pcm_oss
i2c_i801               17820  0 
snd_timer              30224  2 snd_seq,snd_pcm
snd_page_alloc         16784  2 snd_hda_intel,snd_pcm
snd_hwdep              16264  1 snd_hda_intel
ata_generic            14084  0 
snd                    70392  19 snd_hda_intel,snd_seq_dummy,snd_seq_oss,snd_seq,snd_seq_device,snd_pcm_oss,snd_mixer_oss,snd_pcm,snd_timer,snd_hwdep
soundcore              14992  1 snd
i82975x_edac           13064  0 
iTCO_wdt               20176  0 
iTCO_vendor_support    11652  1 iTCO_wdt
pata_acpi              13184  0 
edac_core              48576  1 i82975x_edac
nvidia               7807896  26 
i2c_core               29216  2 i2c_i801,nvidia
sky2                   54020  0 
pata_jmicron           12032  0 
serio_raw              14084  0 
pcspkr                 11008  0 
shpchp                 38044  0
@nours féroce : c'est possible, mais ça m'étonnerait. J'ai une sonde sur le CPU et un aircooling de monstre, par contre au niveau de la carte graphique ça se pourrait :-?
Mais ça se traduit comment dans les logs ? C'est vraiment chaud de trouver un truc utile dans les tonnes de trucs inutiles dans /var/log/messages.
Arg.

Tu n'as même pas les modules firewire activés...

Tu as essayé avec une version Fedora 32 bits ?

++
eddy33 wrote:Arg.

Tu n'as même pas les modules firewire activés...

Tu as essayé avec une version Fedora 32 bits ?

++
Je ne préférerais pas, tout simplement parce que j'ai 4 GiO de RAM 🙂
Qu'as tu installé avec le driver intel ? Utilises tu l'économiseur d'énergie de ce dernier ou watchdog ? Bref ce serait ce dernier qui ferait rebooter. Peux lors du reboot deja passer sur ton bios (en 4ieme vitesse) pour vérifier les températures et voir si elles sont bonnes.
Une fois que tu t'es assuré que ta carte mère va bien, regarde la configuration de l'utilitaire d'économie.
Refuznik wrote:Qu'as tu installé avec le driver intel ? Utilises tu l'économiseur d'énergie de ce dernier ou watchdog ? Bref ce serait ce dernier qui ferait rebooter. Peux lors du reboot deja passer sur ton bios (en 4ieme vitesse) pour vérifier les températures et voir si elles sont bonnes.
Une fois que tu t'es assuré que ta carte mère va bien, regarde la configuration de l'utilitaire d'économie.
Non, je n'utilise rien de ce type. Au prochain reboot, je regarderai les températures.
ok...
En 32 bits, tu peux toujours utiliser un noyau PÄE pour voir les 4 Go 😉

++
eddy33 wrote:ok...
En 32 bits, tu peux toujours utiliser un noyau PAE pour voir les 4 Go 😉

++
En effet. Mais j'ai besoin d'allouer plus de 2 go de ram à une JVM, ce qui n'est pas possible avec une JVM 32 bits.
OK...

Essaye de faire un test en mode vesa au lieu d'utiliser le driver nvidia...

++
Tu utilise une carte son intégré ou tu en as une à part ? Si tu en as une à part désactive celle intégré pour voir.
Refuznik wrote:Tu utilise une carte son intégré ou tu en as une à part ? Si tu en as une à part désactive celle intégré pour voir.
C'est une Realtek HDA Intel intégrée, et je n'en ai pas d'autre.

Quant à essayer en mode vesa, ok mais ça sera difficile de dire si c'est ça ou pas : pas de reboot peut-être dû à la chance.