[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

DRBD crash



Hallo zusammen,

ich habe im Moment ein größeres Problem mit DRBD Version 8.3.7 im aktuellen Debian 6.0.2

/etc/init.d/drbd status
drbd driver loaded OK; device status:
version: 8.3.7 (api:88/proto:86-91)
srcversion: EE47D8BF18AC166BE219757

Ich nutze folgenden Kernel:
uname -r
2.6.32-5-openvz-amd64

Problem:
Sobald ich eine Resource syncronisieren möchte Crash der Server welche die secondary resource verwaltet.

Die gleiche DRBD Config habe ich schon auf anderer Hardware erfolgreich eingesetzt. Deshalb gehe ich davon aus das die Konfigurationen erstmal OK sind.

Ich würde gerne den Kernel dazu bewegen mir ein paar Hinweise zu geben was ich falsch gemacht habe, ob etwas fehlt? Wie kann ich das System dazu bringen mehr Fehlermeldungen zu schreiben. Auf der quelle werden keine interessante Fehler geloggt. Auf dem Ziel ist nach dem Crash nichts zu sehen. Man sieht hier nur einen Verbindungsaufbau und dann ein Netzwerkfehler.
(Logisch der zweite knoten ist gecrasht und somit nicht mehr erreichbar)

Qulle drbd0
Aug 15 16:47:08 lvzs101a kernel: [ 3991.169041] block drbd0: Handshake successful: Agreed network protocol version 91
Aug 15 16:47:08 lvzs101a kernel: [ 3991.169051] block drbd0: conn( WFConnection -> WFReportParams )
Aug 15 16:47:08 lvzs101a kernel: [ 3991.169066] block drbd0: Starting asender thread (from drbd0_receiver [6894])
Aug 15 16:47:08 lvzs101a kernel: [ 3991.169333] block drbd0: data-integrity-alg: <not-used>
Aug 15 16:47:08 lvzs101a kernel: [ 3991.169409] block drbd0: drbd_sync_handshake:
Aug 15 16:47:08 lvzs101a kernel: [ 3991.169413] block drbd0: self 5D4DADEBE7233DF1:A12250E96763C398:0000000000000004:0000000000000000 bits:59469635 flags:0
Aug 15 16:47:08 lvzs101a kernel: [ 3991.169418] block drbd0: peer 0000000000000004:0000000000000000:0000000000000000:0000000000000000 bits:59569339 flags:0
Aug 15 16:47:08 lvzs101a kernel: [ 3991.169423] block drbd0: uuid_compare()=2 by rule 30
Aug 15 16:47:08 lvzs101a kernel: [ 3991.169425] block drbd0: Becoming sync source due to disk states.
Aug 15 16:47:08 lvzs101a kernel: [ 3991.169428] block drbd0: Writing the whole bitmap, full sync required after drbd_sync_handshake.
Aug 15 16:47:09 lvzs101a kernel: [ 3991.454493] block drbd0: 227 GB (59569339 bits) marked out-of-sync by on disk bit-map.
Aug 15 16:47:09 lvzs101a kernel: [ 3991.475170] block drbd0: peer( Unknown -> Secondary ) conn( WFReportParams -> WFBitMapS )
Aug 15 16:47:10 lvzs101a kernel: [ 3992.744027] block drbd0: conn( WFBitMapS -> SyncSource )
Aug 15 16:47:10 lvzs101a kernel: [ 3992.744039] block drbd0: Began resync as SyncSource (will sync 238277356 KB [59569339 bits set]).
Aug 15 16:47:57 lvzs101a kernel: [ 4039.880030] block drbd0: PingAck did not arrive in time.
Aug 15 16:47:57 lvzs101a kernel: [ 4039.979337] block drbd0: peer( Secondary -> Unknown ) conn( SyncSource -> NetworkFailure )
Aug 15 16:47:57 lvzs101a kernel: [ 4039.979348] block drbd0: asender terminated
Aug 15 16:47:57 lvzs101a kernel: [ 4039.979351] block drbd0: Terminating drbd0_asender
Aug 15 16:47:57 lvzs101a kernel: [ 4039.979437] block drbd0: drbd_pp_alloc interrupted!
Aug 15 16:47:57 lvzs101a kernel: [ 4039.979439] block drbd0: alloc_ee: Allocation of a page failed
Aug 15 16:47:57 lvzs101a kernel: [ 4040.088151] block drbd0: error receiving RSDataRequest, l: 24!
Aug 15 16:48:05 lvzs101a kernel: [ 4047.348039] block drbd0: drbd_send_block() failed
Aug 15 16:48:05 lvzs101a kernel: [ 4047.435041] block drbd0: md_sync_timer expired! Worker calls drbd_md_sync().
Aug 15 16:48:05 lvzs101a kernel: [ 4047.538471] block drbd0: Connection closed
Aug 15 16:48:05 lvzs101a kernel: [ 4047.538481] block drbd0: conn( NetworkFailure -> Unconnected )
Aug 15 16:48:05 lvzs101a kernel: [ 4047.538490] block drbd0: receiver terminated
Aug 15 16:48:05 lvzs101a kernel: [ 4047.538493] block drbd0: Restarting drbd0_receiver
Aug 15 16:48:05 lvzs101a kernel: [ 4047.538496] block drbd0: receiver (re)started
Aug 15 16:48:05 lvzs101a kernel: [ 4047.538501] block drbd0: conn( Unconnected -> WFConnection )







Reply to: