- Modifié
Et c'est maintenant que je suis dans la merde, ou comme une poule avec un couteau. Je vais devoir approfondir crash et encore plus le kernel... mais ça fonctionne.
PANIC: "sysrq: SysRq : Trigger a crash", mais dans ce dump, il doit se trouver l'état du kernel, du serveur X et bien plus.
D'autre part, comme il est possible d'utiliser SysReq (alt+sysreq(prntscr)+r-e-i-s-u-b), il devrait être possible d'arrêter X, de faire un sync (préserver les systèmes de fichier), un reboot propre, etc.
Il n'y aura peut-être rien dans ces dumps, mais il existe encore d'autres façons ou outils pour diagnostiquer l'état du kernel, et surtout de la RAM (pas de panic, c'est donc peut être un problème de RAM, de pointeurs qui vont écrire massivement n'importe où). Je vais continuer à creuser ces sujets.
Edit: "Command, Firefox"? Ce SysReq a interrompu Firefox? Firefox était actif, sur 3 vidéos Youtube, et ça a freezé...
PANIC: "sysrq: SysRq : Trigger a crash", mais dans ce dump, il doit se trouver l'état du kernel, du serveur X et bien plus.
D'autre part, comme il est possible d'utiliser SysReq (alt+sysreq(prntscr)+r-e-i-s-u-b), il devrait être possible d'arrêter X, de faire un sync (préserver les systèmes de fichier), un reboot propre, etc.
Il n'y aura peut-être rien dans ces dumps, mais il existe encore d'autres façons ou outils pour diagnostiquer l'état du kernel, et surtout de la RAM (pas de panic, c'est donc peut être un problème de RAM, de pointeurs qui vont écrire massivement n'importe où). Je vais continuer à creuser ces sujets.
Edit: "Command, Firefox"? Ce SysReq a interrompu Firefox? Firefox était actif, sur 3 vidéos Youtube, et ça a freezé...
# crash /mnt/kernels/linux-4.3.5/vmlinux vmcore
crash 7.1.3-1.fc23
Copyright (C) 2002-2014 Red Hat, Inc.
Copyright (C) 2004, 2005, 2006, 2010 IBM Corporation
Copyright (C) 1999-2006 Hewlett-Packard Co
Copyright (C) 2005, 2006, 2011, 2012 Fujitsu Limited
Copyright (C) 2006, 2007 VA Linux Systems Japan K.K.
Copyright (C) 2005, 2011 NEC Corporation
Copyright (C) 1999, 2002, 2007 Silicon Graphics, Inc.
Copyright (C) 1999, 2000, 2001, 2002 Mission Critical Linux, Inc.
This program is free software, covered by the GNU General Public License,
and you are welcome to change it and/or distribute copies of it under
certain conditions. Enter "help copying" to see the conditions.
This program has absolutely no warranty. Enter "help warranty" for details.
GNU gdb (GDB) 7.6
Copyright (C) 2013 Free Software Foundation, Inc.
License GPLv3+: GNU GPL version 3 or later <http://gnu.org/licenses/gpl.html>
This is free software: you are free to change and redistribute it.
There is NO WARRANTY, to the extent permitted by law. Type "show copying"
and "show warranty" for details.
This GDB was configured as "x86_64-unknown-linux-gnu"...
KERNEL: /mnt/kernels/linux-4.3.5/vmlinux
DUMPFILE: vmcore [PARTIAL DUMP]
CPUS: 4
DATE: Wed Feb 10 19:20:39 2016
UPTIME: 09:38:43
LOAD AVERAGE: 0.25, 0.25, 0.23
TASKS: 433
NODENAME: ***
RELEASE: 4.3.5-own
VERSION: #1 SMP Tue Feb 9 23:49:29 CET 2016
MACHINE: x86_64 (1996 Mhz)
MEMORY: 7.9 GB
PANIC: "sysrq: SysRq : Trigger a crash"
PID: 2913
COMMAND: "firefox"
TASK: ffff8800b7bd0000 [THREAD_INFO: ffff8802322e8000]
CPU: 0
STATE: TASK_RUNNING (SYSRQ)
crash>
D'après crash, il y a bien ce "0" inséré dans le log des messages du kernel, étrange...crash> log
[ 0.000000] Initializing cgroup subsys cpuset
[ 0.000000] Initializing cgroup subsys cpu
[ 0.000000] Initializing cgroup subsys cpuacct
[ 0.000000] Linux version 4.3.5-own (***@***) (gcc version 5.3.1 20151207 (Red Hat 5.3.1-2) (GCC) ) #1 SMP Tue Feb 9 23:49:29 CET 2016
[ 0.000000] Command line: BOOT_IMAGE=/vmlinuz-4.3.5-own root=/dev/mapper/fedora_***-root ro rd.lvm.lv=fedora_***/root rhgb quiet crashkernel=256M
[ 0.000000] x86/fpu: Legacy x87 FPU detected.
[ 0.000000] x86/fpu: Using 'lazy' FPU context switches.
[ 0.000000] e820: BIOS-provided physical RAM map:
...
[ 6476.243690] perf interrupt took too long (11570 > 9615), lowering kernel.perf_event_max_sample_rate to 13000
0
[34792.558816] sysrq: SysRq : Trigger a crash
Il faudra que je compare à un autre crash dump, d'un système sain. kworker, pas de RAM? Ce sont les process système... des extraits: PID PPID CPU TASK ST %MEM VSZ RSS COMM
1728 1640 1 ffff88003fa70000 IN 0.6 480916 58588 Xorg
1779 1640 2 ffff8802302db800 IN 0.6 480916 58588 Xorg
1780 1640 3 ffff8802302dd400 IN 0.6 480916 58588 Xorg
1781 1640 0 ffff8802302d9c00 IN 0.6 480916 58588 Xorg
4576 2 1 ffff8800a5615400 IN 0.0 0 0 [kworker/1:0]
5156 2 0 ffff8800b1135400 IN 0.0 0 0 [kworker/0:2]
5158 2 1 ffff880230835400 IN 0.0 0 0 [kworker/1:1]
5342 2 3 ffff880232e00000 IN 0.0 0 0 [kworker/3:1]
5522 2 3 ffff88021530b800 IN 0.0 0 0 [kworker/3:0]
5524 2 0 ffff88021530d400 IN 0.0 0 0 [kworker/0:1]
5578 2 0 ffff8802316c3800 IN 0.0 0 0 [kworker/u8:1]
5606 2 2 ffff88021756b800 IN 0.0 0 0 [kworker/2:1]
5616 2 1 ffff880232378000 IN 0.0 0 0 [kworker/u8:0]
5620 2 0 ffff88003ec21c00 IN 0.0 0 0 [kworker/u8:2]
Etrange encore. La boite était freezed (bloquée). Une CPU s'occupe avec Firefox et les 3 autres CPU avec swapper (idle task...)?crash> runq
CPU 0 RUNQUEUE: ffff88023fc16c80
CURRENT: PID: 2913 TASK: ffff8800b7bd0000 COMMAND: "firefox"
RT PRIO_ARRAY: ffff88023fc16e30
[no tasks queued]
CFS RB_ROOT: ffff88023fc16d20
[no tasks queued]
CPU 1 RUNQUEUE: ffff88023fc96c80
CURRENT: PID: 0 TASK: ffff880236270000 COMMAND: "swapper/1"
RT PRIO_ARRAY: ffff88023fc96e30
[no tasks queued]
CFS RB_ROOT: ffff88023fc96d20
[no tasks queued]
CPU 2 RUNQUEUE: ffff88023fd16c80
CURRENT: PID: 0 TASK: ffff880236271c00 COMMAND: "swapper/2"
RT PRIO_ARRAY: ffff88023fd16e30
[no tasks queued]
CFS RB_ROOT: ffff88023fd16d20
[no tasks queued]
CPU 3 RUNQUEUE: ffff88023fd96c80
CURRENT: PID: 0 TASK: ffff880236273800 COMMAND: "swapper/3"
RT PRIO_ARRAY: ffff88023fd96e30
[no tasks queued]
CFS RB_ROOT: ffff88023fd96d20
[no tasks queued]