Un saluto a tutta la lista,
ho un problema che mi affligge da quando ho installato Debian 12 su
diversi host con installazione su raid mdadm. Il problema si manifesta
con uno 'shutdown -h now' o un 'reboot' o spegnendo da XFCE. Avevo
scritto in lista in passato con oggetto "Debian 12.4 Kernel Panic
durante spegnimeto"
Qui di seguito riporto l'errore del kernel panic:
https://postimg.cc/D4GDHgDf
(non ho allegato l'immagine in lista per non creare problemi. Il link
sarà valido per 30 gg)
NOTA: in ogni kernel panic i codice di errore sono sempre gli stessi
anche se le macchine sono diverse e il RIP di md_notify_reboot() si
presenta su tutti gli host, quindi credo ci sia un problema con i raid.
Avendo diversi dischi in RAID1 su Debian pensavo fosse un problema di
alimentazione, poi di cavi, poi di scheda madre, poi ho notato che
scollegando tutti i dischi accadeva con dischi NVME collegati. Pensavo
di aver trovato l'arcano e credevo ci fosse un problema con i dischi
NVME ma dopo qualche test il problema non sono i dischi NVME.
Per tagliare la testa al toro, ho installato due diverse distribuzioni e
le ho usate per qualche mese (AlmaLinux 9 e Fedora 40) e il problema non
si è mai manifestato. Non sono riuscito a provare Ubuntu LTS.
Ho installato anche un kernel BackPort e Debian Testing (La futura 13)
ma ho sempre lo stesso problema.
Ho effettuato altri test che riporto di seguito:
Configurazione RAID: raid1 su swap e root configurato dall'installer,
partizione EFI su singolo disco o configurata in raid1 mdadm (ho provato
entrambe le configurazioni)
Test dove il problema si è manifestato:
Asus Prime Z390-A + i7 8700k -> due SSD da 2.5 SATA
Asus Prime Z390-A + i7 8700k -> due SSD SATA (uno da 2.5 e uno M.2) (ho
provato a mischiare le tipologie di device)
Asus Prime Z490-A + i9 10850k -> due NMVE M.2
Asus Prime Z490-A + i9 10850k -> due SSD da 2.5 SATA
Asus ROG Strix Z890-F + Core Ultra 9 285k -> due NVME M.2
Macchina virtuale (kvm) con emulazione EUFI, due dischi virtuali con
raid configurato tramite l'installer
Per completare i test ho installato anche su due dischi da 3.5 e non
sono riuscito a riprodurre il problema.
Ho cercato in rete per molto tempo non trovando nulla, fino ad oggi:
https://lore.kernel.org/lkml/ad286d5c-fd60-682f-bd89-710a79a710a0@huaweicloud.com/T/
Qualcuno sa come risolvere?
Grazie a tutti e buon fine settimana.
Alessandro.