Re: Problema kernel panic durante shutdown o reboot con raid

To: debian-italian <debian-italian@lists.debian.org>
Subject: Re: Problema kernel panic durante shutdown o reboot con raid
From: Alessandro Baggi <alessandro.baggi@gmail.com>
Date: Fri, 4 Apr 2025 12:08:43 +0200
Message-id: <[🔎] 1a749d1e-cbbc-4d04-a24f-20fd47d3e9aa@gmail.com>
In-reply-to: <[🔎] E1u01m1-0000000CmbG-46Es@tucano.isti.cnr.it>
References: <396cdbe0-c0b8-45e2-854d-5f056f14966b@gmail.com> <CALcbchB1tZNmjFPH5FA090Z1Ax4+D1u3XLZUdhrnKsngnHdFbg@mail.gmail.com> <0714f171-0b73-4d33-9b37-3d123d40cee5@gmail.com> <4678768e-14d7-44f6-a0e6-67d19e4d4c65@unibo.it> <6d7d6ce3-ba30-4810-8cf5-f3f54771aa42@gmail.com> <e9330657-1e0f-4978-bcdd-35ea505a2681@gmail.com> <[🔎] Z-uBVhwEhWWR_nM4@marco-TUXEDO-Pulse-15-Gen2> <[🔎] b46babbc-876a-4b1f-a1c4-4c5bcb3b2193@gmail.com> <[🔎] 6a771105-07cc-420a-9146-f63cb54b4eec@gmail.com> <[🔎] E1tzyXt-0000000Cd9Y-02Ij@tucano.isti.cnr.it> <[🔎] 3b5f8731-3507-4ffb-bd81-008ea86af487@gmail.com> <[🔎] E1u01m1-0000000CmbG-46Es@tucano.isti.cnr.it>

Buongiorno Francesco,

Il 02/04/25 19:21, Francesco Potortì ha scritto:

Qualche idea di seguito.  Le idee non vanno eseguite nell'ordine, fai prima quella che ti ispira di più

# Idea 1

Il sospetto è che questo avvenga durante un check automatico.  Quindi disabilita i check prima di fermare la macchina:
# /usr/share/mdadm/checkarray -sa
# /usr/share/mdadm/checkarray -x --all
# /usr/share/mdadm/checkarray -sa
# halt

Il primo di dà lo stato attaule dei check.  Il secondo dovrebbe cancellare un eventuale check in programma.  Il terzo dovrebbe darti la certezza che non ne stanno girando al momento.  Uso il condizionale perché penso di aver capito come funziona la coda di comandi di mdadm, ma non ne ho completa certezza.

Se non cambia nulla, forse il problema non è quello.

Ho eseguito un controllo del sistema e non sono riuscito a trovare loscript checkarray richiamato da un service disystemd/timer/script/cronjob. Ho comunque fatto una prova, lanciando ilcheckarray praticamente avvia un check sui device mdadm (una specie diresync) ma riavviando durante il check non ricevo kernel panic. Invecesubito dopo l'installazione fresca di una debian 12.10 senza nessundevice md in sync/check (ho controllato prima di avviare lo shutdown) eil kernel panic è avvenuto.

# Idea 2

Siccome con la testing è peggio, proverei ad andare sia aventi che indietro.  Installa una unstable.  Nonostante il nome, generalmente funziona.  E comunque stai facendo una prova, non può succedfere niente di grave.  Poi prova con la oldstable.  E con la oldoldstable.

Dopo queste prove, se cambia qualcosa, bisognerebbe capire se il problema è nel pacchetto linux-image o nel pacchetto mdadm.

Ora le prove le sto facendo sulla Z890-F e usare laoldastable/oldoldstable avrei problemi con driver. Ora sono con unastable 12.10 + kernel backports

# Idea 3

Ora mdadm non usa cron, ma systemd.  Questo probabilmente non è vero con la oldstable, e molto probabilmente non è vero con la oldoldstable.

Nel mio sistema vedo questi:

mdadm: /usr/lib/systemd/system/mdadm-grow-continue@.service
mdadm: /usr/lib/systemd/system/mdadm-last-resort@.service
mdadm: /usr/lib/systemd/system/mdadm-last-resort@.timer
mdadm: /usr/lib/systemd/system/mdcheck_continue.service
mdadm: /usr/lib/systemd/system/mdcheck_continue.timer
mdadm: /usr/lib/systemd/system/mdcheck_start.service
mdadm: /usr/lib/systemd/system/mdcheck_start.timer
mdadm: /usr/lib/systemd/system/mdmon@.service
mdadm: /usr/lib/systemd/system/mdmonitor-oneshot.service
mdadm: /usr/lib/systemd/system/mdmonitor-oneshot.timer
mdadm: /usr/lib/systemd/system/mdmonitor.service
mdadm: /usr/lib/systemd/system-shutdown/mdadm.shutdown

Cerca di capire cosa fanno.  In particolare, l'ultimo contiene un comando che viene dato allo shutdown.  Magari prova a disabilitarlo.

Ho anche io tutti gli stessi unit/timer (ps: con quale comando haiottenuto questa lista?). Li ho visionati uno per uno, e ho notato che icheck sono avviati durante ore notturne. mdadm.shutdown fa qualcosa conl'initramfs che non ho capito bene.

Ho fatto un'altra prova. Ho reinstallato la 12.10 cancellando lapartition table dei device per rootfs/swap/EFI (pensando che potesseesserci qualche problema con i device creati con fedora) ma nulla. Primoriavvio primo kernel panic.

A questo punto mi viene il dubbio che ci sia una qualche incompatibilitàcon i device M.2 (NVME & SATA) che si manifestano quando sono in RAID.Non so che pensare.

Tornando agli esperimenti con la testing (13) ho lanciato qualche repairsu qualche device MD e se provo a dare il reboot, systemd mi bloccadicendomi che l'operazione è in corso (ci sta un lock) e che per forzarelo shutdown devo lanciare un altro comando. Quindi per i problemirelativi ai panic di testing a questo punto escluderei che accadanodurante un resync.

NOTA: tempo fa (2022) se non ricordo male avevo un problema simile conun'AlmaLinux 9.1, ovvero al reboot/shutdown della macchina rimanevaappesa con un messaggio che diceva:


"Not all MD devices stopped, 1 left
Stopping MD Devices
Stoppind /dev/md125(9:125)"

Feci notare il problema a quelli di Almalinux e altri riportavano ilproblema. Se non ricordo male avevo aperto un bug su bugzilla di rhel(che non riesco a trovare).Cmq con la release della 9.2 il bug era sparito. Forse è lo stesso bugma con il kernel 6.1/6.12 viene gestito in maniera diversa generando unpanic? Non so che pensare.


Grazie comunque per il tuo aiuto.

Saluti, Alessandro.

Reply to:

Follow-Ups:
- Re: Problema kernel panic durante shutdown o reboot con raid
  - From: Francesco Potortì <Potorti@isti.cnr.it>

References:
- Re: Problema kernel panic durante shutdown o reboot con raid
  - From: Marco Ciampa <ciampix@posteo.net>
- Re: Problema kernel panic durante shutdown o reboot con raid
  - From: Alessandro Baggi <alessandro.baggi@gmail.com>
- Re: Problema kernel panic durante shutdown o reboot con raid
  - From: Alessandro Baggi <alessandro.baggi@gmail.com>
- Re: Problema kernel panic durante shutdown o reboot con raid
  - From: Francesco Potortì <Potorti@isti.cnr.it>
- Re: Problema kernel panic durante shutdown o reboot con raid
  - From: Alessandro Baggi <alessandro.baggi@gmail.com>
- Re: Problema kernel panic durante shutdown o reboot con raid
  - From: Francesco Potortì <Potorti@isti.cnr.it>

Prev by Date: Re: [OT] Popcon e pacchetti "datati"
Next by Date: Re: Problema kernel panic durante shutdown o reboot con raid
Previous by thread: Re: Problema kernel panic durante shutdown o reboot con raid
Next by thread: Re: Problema kernel panic durante shutdown o reboot con raid
Index(es):
- Date
- Thread