[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Failed to start Proxmox VE replication runner



On 07/11/22 10:49, Diego Zuccato wrote:
Il 07/11/2022 08:23, Piviul ha scritto:

Corosync non ha problemi, l'ho riavviato su tutti e 3 i nodi e non ha dato problemi. Questo è l'output di pvecm status:
Lo hai riavviato ma *ha* problemi.
Infatti un nodo non viene visto.

più che altro vedeva solo se stesso


Nov  4 23:38:26 pve02 corosync[1703]: [KNET  ] link: host: 3 link: 0 is down
Questa è un'ottima ragione.
Per caso hai cambiato una scheda di rete o modificato la configurazione? O anche solo fatto un aggiornamento del kernel?

no, era lo switch che si era incasinato, spegnendolo e riaccendendolo è tutto tornato a posto.


Cercando in rete ho visto che non sono il solo ad avere questo problema e tutti indirizzano ad impostare il quorum a uno con pvecm expected 1 ma sono un po' preoccupato prima di fare qualunque cosa vorrei esserne ipercerto non avendo nemmeno il backup delle macchine virtuali!
Portare a 1 il quorum in un cluster è lo step appena prima del riformattare e reinstallare... Intendiamoci, puoi farlo *sul solo nodo problematico* e solo per il tempo minimo necessario a fare un backup delle VM (spente, su supporto esterno). Poi IMO ti conviene reinstallare da capo il nodo (con delnode da uno degli altri, poi ricordati di rimuovere le chiavi ssh in /etc/ssh/ssh_known_hosts).

avevo immaginato... più che riformattare pensavo poi di dover rimouvere ogni songolo nodo dal cluster per poi riaggiungerlo....

Mille grazie, tutto è bene ciò che finisce bene

Piviul



Reply to: