[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Failed to start Proxmox VE replication runner



Ciao.

IMO i nodi devono essere (o "è meglio che siano") in numero dispari, per evitare possibili split-brain (con 2) e non perdere funzionalità inutilmente.

Con 3 nodi, puoi averne uno guasto senza problemi: gli altri mantengono il quorum (2) e possono lavorare normalmente. Con 4 nodi il quorum passa a 3, ma se perdi 2 nodi non puoi fare nulla (senza ridurlo). Con 5 nodi il quorum rimane 3 e puoi perdere 2 nodi continuando a lavorare sui rimanenti.

La rete del cluster puoi ridondarla senza particolari problemi. Io normalmente faccio girare tutto il traffico su un bond ALB di almeno 2 interfacce. Il vantaggio è che le due interfacce possono essere collegate a switch diversi e anche a switch unmanaged.

Diego

Il 07/11/2022 16:29, Piviul ha scritto:
On 07/11/22 15:44, Daniele Piccoli wrote:
Ciao,
[...]
Non è un buon segno onestamente, se posso darti 3 consigli:

 - Magari non lo fai, ma evita di far girare traffico "pesante" sugli switch in cui comunica il cluster, tipo il traffico verso gli storage. Idealmente dovrebbe girarci solo il traffico del cluster

 - Considera la possibilità di ridondare la rete di cluster: https://pve.proxmox.com/wiki/Separate_Cluster_Network

ho già configurato proxmox in questo modo: ho uno switch e una rete per tutto il traffico PVE separato dal traffico LAN e dal traffico CEPH che ha un altro switch da 10Gb dedicato.


  - Aggiungi un 4° nodo al cluster, cosi da non perdere il quorum nel caso un nodo avesse un problema, ma anche banalmente per fare manutenzione/aggiornamenti senza fretta

Probabilmente i primi mesi del prossimo anno riuscirò ad aggiungere anche il 4° nodo anche se in questo caso non sarebbe cambiato nulla perché appunto è stato lo switch ad andare in zampanella quindi anche con un nodo in più avrebbe continuato a non dialogare essendo la rete di comunicazione dei PVE non funzionante.

Invece mi chiedevo: non sarebbe meglio ridondare gli switch? Si può fare? Non penso tanto a quello usato dalla rete di comunicazione del cluster proxmox che a quanto pare se smette di funzionare, certamente il cluster non funziona ma tutti i guests hosts e il traffico LAN continua a funzionare; penso soprattutto allo switch della rete ceph che se muore mi muoiono contemporaneamente tutti gli hosts virtuali...

Grazie Daniele!

Piviul


--
Diego Zuccato
DIFA - Dip. di Fisica e Astronomia
Servizi Informatici
Alma Mater Studiorum - Università di Bologna
V.le Berti-Pichat 6/2 - 40127 Bologna - Italy
tel.: +39 051 20 95786


Reply to: