[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Sostituire disco LVM con GlusterFS





Il giorno mer 22 ago 2018 alle ore 11:03 Alessandro Baggi <alessandro.baggi@gmail.com> ha scritto:
Il 20/08/2018 13:11, Marco Bertorello ha scritto:
> Buongiorno a tutti,
>
> ho due macchine identiche, rispettivamente con 1 disco SSD per OS e
> cache di LVM e 2 dischi da 3TB.
>
> Ho un solo VG, formato dai 2 dischi da 3TB e da una partizione dell'SSD :
>
> └─sda4                      8:4    0 45.9G  0 part
>    ├─VG01-LV01_cache_meta  253:0    0    8M  0 lvm
>    ├─VG01-LV01_cache_cdata 253:3    0   40M  0 lvm
>    │ └─VG01-LV01           253:6    0  5.5T  0 lvm  /gluster/replicated
>    └─VG01-LV01_cache_cmeta 253:4    0    8M  0 lvm
>      └─VG01-LV01           253:6    0  5.5T  0 lvm  /gluster/replicated
> sdb                         8:16   0  2.7T  0 disk
> └─sdb1                      8:17   0  2.7T  0 part
>    └─VG01-LV01_corig       253:5    0  5.5T  0 lvm
>      └─VG01-LV01           253:6    0  5.5T  0 lvm  /gluster/replicated
> sdc                         8:32   0  2.7T  0 disk
> └─sdc1                      8:33   0  2.7T  0 part
>    └─VG01-LV01_corig       253:5    0  5.5T  0 lvm
>      └─VG01-LV01           253:6    0  5.5T  0 lvm  /gluster/replicated
>
> Utilizzo GlusterFS per replicare (replica 3 con arbiter; l'arbiter è un
> raspberry) il volume tra i due nodi.
>
> Su una macchina, un disco (sdc) sta cominciando a dare errori SMARTe
> vorrei sostituirlo.
> Qual'è secondo voi la procedura migliore per evitare di perdere dati (va
> benissimo ricostruire dal nodo sano di gluster)?
>
> grazie molte,
>
> --
> Marco Bertorello
> System Administrator
>

Buongiorno Marco,
premetto che non ho mai avuto una problematica del genere.
Da quanto hai scritto non ci sono dischi in raid. Con il raid
probabilmente avresti avuto meno problemi.

Corretto, in fase di setup ho pensato di sfruttare i lo spazio disco il più possibile affidando la ridondanza a gluster
 

Non avendo mai usato gluster in produzione ma solo in ambiente di test
non mi ritengo un esperto. Nella tua configurazione hai un 2 + 1
(arbiter) quindi lo split-brain non avviene ed è un punto a tuo favore.
Potresti degradare (scollegare dalla rete credo basti) il nodo (brick)
di gluster dove hai il problema, sostituire il disco danneggiato (magari
se hai abbastanza spazio sposta i dati sul disco rimanente del volume
LVM) e poi ricollegare il brick a gluster in modo tale che il nodo
master risincronizzi quello appena collegato. Durante questa operazione
gluster dovrebbe comunque funzionare e garantire l'accesso ai dati.

Ho spento il nodo problematico e tutto è rimasto in piedi, il punto è proprio questo: come sostituisco il disco.
Mi spiego meglio: devo distruggere il brick, i LV e il VG?
Come scollego il brick morto dall'altro nodo? 
Dopo aver ricreato VG e LV, come ricollego il brick al cluster?
 
Penso che questo servizio sia funzionante in un'azienda per cui non
stopperei tutte e due le macchine primo perche con gluster non avrebbe
senso, se ha un problema su un host disattivare tutti gli host equivale
ad avere solo un host. In secondo luogo lo eviterei per evitare, nel

In realtà si tratta di un laboratorio, niente di critico. 
Comunque vorrei sperimentare come comportarmi in questo caso in una situazione reale
 
momento in cui riavvii gluster e nel caso in cui il primo brick sia
desincronizzato rispetto al secondo, che si generino dei problemi nel
mantenere i brick sincronizzati magari prende il brick meno aggiornato
come master e rischi di perdere qualcosa.


Prima di fare tutto, oltre al solito backup dei dati, magari fa qualche
prova su macchine virtuali onde evitare disastri.


Magari qualche utente con più esperienza potrà fornirti maggiori
indicazioni.

Un saluto.


Grazie! 


--
Marco Bertorello
System Administrator
http://bertorello.ns0.it

Reply to: