[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Failed to start Proxmox VE replication runner



Il 07/11/2022 08:23, Piviul ha scritto:

Corosync non ha problemi, l'ho riavviato su tutti e 3 i nodi e non ha dato problemi. Questo è l'output di pvecm status:
Lo hai riavviato ma *ha* problemi.
Infatti un nodo non viene visto.

Nov  4 23:38:26 pve02 corosync[1703]:   [KNET  ] link: host: 3 link: 0 is down
Questa è un'ottima ragione.
Per caso hai cambiato una scheda di rete o modificato la configurazione? O anche solo fatto un aggiornamento del kernel?

Cercando in rete ho visto che non sono il solo ad avere questo problema e tutti indirizzano ad impostare il quorum a uno con pvecm expected 1 ma sono un po' preoccupato prima di fare qualunque cosa vorrei esserne ipercerto non avendo nemmeno il backup delle macchine virtuali!
Portare a 1 il quorum in un cluster è lo step appena prima del riformattare e reinstallare... Intendiamoci, puoi farlo *sul solo nodo problematico* e solo per il tempo minimo necessario a fare un backup delle VM (spente, su supporto esterno). Poi IMO ti conviene reinstallare da capo il nodo (con delnode da uno degli altri, poi ricordati di rimuovere le chiavi ssh in /etc/ssh/ssh_known_hosts).

--
Diego Zuccato
DIFA - Dip. di Fisica e Astronomia
Servizi Informatici
Alma Mater Studiorum - Università di Bologna
V.le Berti-Pichat 6/2 - 40127 Bologna - Italy
tel.: +39 051 20 95786


Reply to: