[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

RE: heartbeat et drbd



>> Salut la liste,
>
> Salut
>
>>
>> je cherche à mettre en place une redondance HA sous
>> sarge
>> master = mail1 (10.1.4.2)
>> slave = nfs2 (10.1.4.4)
>
> Qu'est ce que tu veux dire par la la machine d'adresse
> IP 10.1.4.2 est le maitre et qu'il founit le service
> mail1 ?
> Et nfs2 est un service offert par slave ?
>
> Je comprends pas trop ce que tu veux dire ?
master HA = mail1 (10.1.4.2)
slave HA = nfs2 (10.1.4.4)
IP HA virtuelle 10.1.4.1

> De mon coté je l'utilise pour mysql et ldap
>
>> Les fichiers heartbeat sont identiques sur les 2
>> machines, drbd marche
>> bien et ce n'est pas la première fois que j'utilise
>> HA.
>
> Peux tu nous fournir le fichier de conf de heartbeat
> et de drbd, vérifie  que les 2 fichiers sont identique
> avec un diff
# ha.cf
# =====
keepalive 1
deadtime 10
warntime 5
initdead 30
bcast   eth1
node    mail1
node    nfs2
logfile /var/log/heartbeat/log
auto_failback   off

# drbd.conf
#
resource r0 {

        protocol C;

        incon-degr-cmd "echo '!DRBD! pri on incon-degr' | wall ; sleep 120
; halt -f";

        startup {
                degr-wfc-timeout 120;    # 2 minutes.
        }

        disk {
                on-io-error   detach;
        }

        syncer {
                rate 10M;
                group 1;
                al-extents 257;
        }

        on mail1 {
                device     /dev/drbd0;
                disk       /dev/mapper/home_vpopmail-home_vpopmail;
                address    10.1.4.2:7788;
                meta-disk  internal;
        }

        on nfs2 {
                device    /dev/drbd0;
                disk      /dev/sda3;
                address   10.1.4.4:7788;
                meta-disk internal;
        }
}

>> Le but est de remonter /home/vpopmail qui est en
>> drbd mais je me retrouve
>> avec plein d'erreurs dans les logs.
>>
>> Si quelqu'un a eu ce même soucis, je suis preneur de
>> la solution
>>
>> # haresources
>> # ===========
>> mail1 10.1.4.1 drbddisk::r0
>> mail1 10.1.4.1
>> Filesystem::/dev/drbd0::/home/vpopmail::reiserfs
>
> Ok en voila un bout. Ok je commence à comprendre :
> mail1 s'est le nom de ta machine qui va etre master et
> qui va utiliser la partition /home/vpopmail sur une
> partition drbd0. L'adresse IP aliasé sera 10.1.4.1
>
> [..]
>
>> heartbeat: 2005/09/26_17:06:22 WARN: node nfs2: is
>> dead
>
> Il semble que le slave (de nom nfs2 ne soit pas
> joignable.
> Utilises-tu un cable serie ou un cable ethernet ou
> toute autre chose qui puisse faire le dialogue entre
> les deux noeuds (Si c'est un fourchette ça marchera
> pas :-))

normal, pour les tests, NFS2 était HS, je voulais déjà résoudre les soucis
avec mail1

>> heartbeat: 2005/09/26_17:06:22 info: Local status
>> now set to: 'active'
>> heartbeat: 2005/09/26_17:06:22 WARN: No STONITH
>> device configured.
>> heartbeat: 2005/09/26_17:06:22 WARN: Shared disks
>> are not protected.
>> heartbeat: 2005/09/26_17:06:22 info: Resources being
>> acquired from nfs2.
>> heartbeat: 2005/09/26_17:06:22 info: Running
>> /etc/ha.d/rc.d/status status
>> heartbeat: 2005/09/26_17:06:22 info:
>> /usr/lib/heartbeat/mach_down:
>> nice_failback: foreign resources acquired
>> heartbeat: 2005/09/26_17:06:22 info: Initial
>> resource acquisition complete
>> (T_RESOURCES(us))
>> heartbeat: 2005/09/26_17:06:22 info: mach_down
>> takeover complete.
>> heartbeat: 2005/09/26_17:06:22 info: mach_down
>> takeover complete for node
>> nfs2.
>> heartbeat: 2005/09/26_17:06:22 info: Local Resource
>> acquisition completed.
>> heartbeat: 2005/09/26_17:06:22 info: Running
>> /etc/ha.d/rc.d/ip-request-resp ip-request-resp
>> heartbeat: 2005/09/26_17:06:22 received
>> ip-request-resp 10.1.4.1 OK yes
>> heartbeat: 2005/09/26_17:06:23 info: Acquiring
>> resource group: mail1
>> 10.1.4.1 drbddisk::r0 mail1 10.1.4.1
>> Filesystem::/dev/drbd0::/home/vpopmail::reiserfs
>
> Attention on dirait que ton fichier de conf à un pb
> car heartbeat essaie de lancer le script "10.1.4.1
> drbddisk::r0 mail1 10.1.4.1" comme si il n'avait pas
> vu  qu'il y avait un fin de ligne

Oui, j'ai vu cela. La version de heartbeat est celle de sarge par défaut.
Si je configure haressources avec webmin ou à la mano, le soucis est le
meme, on dirait qu'il ne voit qu'une ligne :(

>> heartbeat: 2005/09/26_17:06:23 info: Running
>> /etc/ha.d/resource.d/IPaddr
>> 10.1.4.1 start
>> heartbeat: 2005/09/26_17:06:23 info: /sbin/ifconfig
>> eth1:1 10.1.4.1
>> netmask 255.0.0.0   broadcast 10.255.255.255
>> heartbeat: 2005/09/26_17:06:23 info: Sending
>> Gratuitous Arp for 10.1.4.1
>> on eth1:1 [eth1]
>> heartbeat: 2005/09/26_17:06:23
>> /usr/lib/heartbeat/send_arp -i 1010 -r 5 -p
>> /var/lib/heartbeat/rsctmp/send_arp/send_arp-10.1.4.1
>> eth1 10.1.4.1 auto
>> 10.1.4.1
>> heartbeat: 2005/09/26_17:06:23 info: Running
>> /etc/ha.d/resource.d/drbddisk
>> r0 start
>
> la il lance r0 ce qui est normal
>
>
>> heartbeat: 2005/09/26_17:06:23 ERROR: Cannot locate
>> resource script mail1
>
> Et la il essaye de lancer le mail1

oui, alors que c'est le nom du master HA

>> heartbeat: 2005/09/26_17:06:23 ERROR: Cannot locate
>> resource script mail1
>> heartbeat: 2005/09/26_17:06:23 ERROR: Cannot locate
>> resource script mail1
>> heartbeat: 2005/09/26_17:06:23 info: Running
>> /etc/ha.d/resource.d/Filesystem /dev/drbd0
>> /home/vpopmail reiserfs start
>> heartbeat: 2005/09/26_17:06:26 info: Running
>> /etc/ha.d/rc.d/ip-request-resp ip-request-resp
>> heartbeat: 2005/09/26_17:06:26 received
>> ip-request-resp 10.1.4.1 OK yes
>> heartbeat: 2005/09/26_17:06:26 info: Acquiring
>> resource group: mail1
>> 10.1.4.1 drbddisk::r0 mail1 10.1.4.1
>> Filesystem::/dev/drbd0::/home/vpopmail::reiserfs
>> heartbeat: 2005/09/26_17:06:26 ERROR: Cannot locate
>> resource script mail1
>> heartbeat: 2005/09/26_17:06:26 ERROR: Cannot locate
>> resource script mail1
>> heartbeat: 2005/09/26_17:06:26 ERROR: Cannot locate
>> resource script mail1
>> heartbeat: 2005/09/26_17:06:33 info: Local Resource
>> acquisition completed.
>> (none)
>> heartbeat: 2005/09/26_17:06:33 info: local resource
>> transition completed.
>> ###########
>>
>> y'a des erreurs mais c'est monté
>
> Voila ce que je pense.

Je vais faire un test avec des services "classiques" style mysql et qmail
et non avec drbd et des partitions

Merci

Franck
-- 
http://www.linuxpourtous.com



Reply to: