[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Failed to start Proxmox VE replication runner



Ciao,

Il 07/11/22 11:56, Piviul ha scritto:
On 07/11/22 10:49, Diego Zuccato wrote:
Il 07/11/2022 08:23, Piviul ha scritto:

Corosync non ha problemi, l'ho riavviato su tutti e 3 i nodi e non ha dato problemi. Questo è l'output di pvecm status:
Lo hai riavviato ma *ha* problemi.
Infatti un nodo non viene visto.

più che altro vedeva solo se stesso


Nov  4 23:38:26 pve02 corosync[1703]: [KNET  ] link: host: 3 link: 0 is down
Questa è un'ottima ragione.
Per caso hai cambiato una scheda di rete o modificato la configurazione? O anche solo fatto un aggiornamento del kernel?

no, era lo switch che si era incasinato, spegnendolo e riaccendendolo è tutto tornato a posto.

Non è un buon segno onestamente, se posso darti 3 consigli:

- Magari non lo fai, ma evita di far girare traffico "pesante" sugli switch in cui comunica il cluster, tipo il traffico verso gli storage. Idealmente dovrebbe girarci solo il traffico del cluster

- Considera la possibilità di ridondare la rete di cluster: https://pve.proxmox.com/wiki/Separate_Cluster_Network

- Aggiungi un 4° nodo al cluster, cosi da non perdere il quorum nel caso un nodo avesse un problema, ma anche banalmente per fare manutenzione/aggiornamenti senza fretta

[cut]


Piviul


Ciao
Daniele


Reply to: