[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Debian 6 kernel bug o cosa?: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.



Ciao a tutta la lista,
mi capita, preparando dei server, solo su Debian6 una cosa molto strana.
La cosa capita indistintamente su più piattaforme hardware di marche e
caratteristiche completamente differenti:

L'errore nel dmesg è il seguente:

[145920.736091] INFO: task bonnie++:1485 blocked for more than 120 seconds.
[145920.736107] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs"
disables this message.
[145920.736122] bonnie++      D 0000000000000002     0  1485      1 0x00000000
[145920.736129]  ffff880036083170 0000000000000082 0000000000000001
ffff880035670560
[145920.736135]  00007fffd9bb1d80 ffffffff810bc0c2 000000000000f9e0
ffff880012d47fd8
[145920.736141]  0000000000015780 0000000000015780 ffff880036975bd0
ffff880036975ec8
[145920.736146] Call Trace:
[145920.736158]  [<ffffffff810bc0c2>] ? pagevec_lookup_tag+0x1a/0x21
[145920.736166]  [<ffffffff811082b3>] ? bdi_sched_wait+0x0/0xe
[145920.736172]  [<ffffffff811082bc>] ? bdi_sched_wait+0x9/0xe
[145920.736177]  [<ffffffff812fb767>] ? __wait_on_bit+0x41/0x70
[145920.736183]  [<ffffffff811082b3>] ? bdi_sched_wait+0x0/0xe
[145920.736187]  [<ffffffff812fb801>] ? out_of_line_wait_on_bit+0x6b/0x77
[145920.736193]  [<ffffffff81064f48>] ? wake_bit_function+0x0/0x23
[145920.736199]  [<ffffffff81108334>] ? sync_inodes_sb+0x73/0x12a
[145920.736204]  [<ffffffff8110bee9>] ? __sync_filesystem+0x4b/0x70
[145920.736208]  [<ffffffff8110bfa8>] ? sync_filesystems+0x9a/0xe3
[145920.736213]  [<ffffffff8110c036>] ? sys_sync+0x1c/0x2e
[145920.736218]  [<ffffffff81010b42>] ? system_call_fastpath+0x16/0x1b
[147840.740086] INFO: task bonnie++:1485 blocked for more than 120 seconds.
[147840.740141] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs"
disables this message.
[147840.740192] bonnie++      D ffff88000180fb30     0  1485      1 0x00000000
[147840.740199]  ffff880036083170 0000000000000082 ffff880012d47db8
ffff880012d47db4
[147840.740206]  00007fffd9bb1f00 ffffffff810bc0c2 000000000000f9e0
ffff880012d47fd8
[147840.740212]  0000000000015780 0000000000015780 ffff880036975bd0
ffff880036975ec8
[147840.740217] Call Trace:
[147840.740229]  [<ffffffff810bc0c2>] ? pagevec_lookup_tag+0x1a/0x21
[147840.740237]  [<ffffffff811082b3>] ? bdi_sched_wait+0x0/0xe
[147840.740243]  [<ffffffff811082bc>] ? bdi_sched_wait+0x9/0xe
[147840.740249]  [<ffffffff812fb767>] ? __wait_on_bit+0x41/0x70
[147840.740254]  [<ffffffff811082b3>] ? bdi_sched_wait+0x0/0xe
[147840.740259]  [<ffffffff812fb801>] ? out_of_line_wait_on_bit+0x6b/0x77
[147840.740265]  [<ffffffff81064f48>] ? wake_bit_function+0x0/0x23
[147840.740270]  [<ffffffff81108334>] ? sync_inodes_sb+0x73/0x12a
[147840.740276]  [<ffffffff8110bee9>] ? __sync_filesystem+0x4b/0x70
[147840.740280]  [<ffffffff8110bfa8>] ? sync_filesystems+0x9a/0xe3
[147840.740284]  [<ffffffff8110c036>] ? sys_sync+0x1c/0x2e
[147840.740290]  [<ffffffff81010b42>] ? system_call_fastpath+0x16/0x1b
[147960.740096] INFO: task bonnie++:1485 blocked for more than 120 seconds.
[147960.740147] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs"
disables this message.
[147960.740197] bonnie++      D ffff88000180fb30     0  1485      1 0x00000000
[147960.740204]  ffff880036083170 0000000000000082 ffff880012d47db8
ffff880012d47db4
[147960.740210]  00007fffd9bb1f00 ffffffff810bc0c2 000000000000f9e0
ffff880012d47fd8
[147960.740216]  0000000000015780 0000000000015780 ffff880036975bd0
ffff880036975ec8
[147960.740221] Call Trace:
[147960.740232]  [<ffffffff810bc0c2>] ? pagevec_lookup_tag+0x1a/0x21
[147960.740240]  [<ffffffff811082b3>] ? bdi_sched_wait+0x0/0xe
[147960.740246]  [<ffffffff811082bc>] ? bdi_sched_wait+0x9/0xe
[147960.740251]  [<ffffffff812fb767>] ? __wait_on_bit+0x41/0x70
[147960.740257]  [<ffffffff811082b3>] ? bdi_sched_wait+0x0/0xe
[147960.740262]  [<ffffffff812fb801>] ? out_of_line_wait_on_bit+0x6b/0x77
[147960.740267]  [<ffffffff81064f48>] ? wake_bit_function+0x0/0x23
[147960.740273]  [<ffffffff81108334>] ? sync_inodes_sb+0x73/0x12a
[147960.740278]  [<ffffffff8110bee9>] ? __sync_filesystem+0x4b/0x70
[147960.740283]  [<ffffffff8110bfa8>] ? sync_filesystems+0x9a/0xe3
[147960.740287]  [<ffffffff8110c036>] ? sys_sync+0x1c/0x2e
[147960.740292]  [<ffffffff81010b42>] ? system_call_fastpath+0x16/0x1b

Questo capita durante la fase di preparazione dei server ed
esattamente durante gli stress test di disco o altro.
In questo caso il "problema" è stato causato da bonnie++, ma la cosa
capita anche con VmWare Server sempre durante la fase di stress.
La conseguenza è che il sistema diventa talmente lento da non poter
più utilizzare neppure più la consol...
Molto strano... su Debian5 facevo gli stessi test con hardware
praticamente identico... ma questo errore non l'ho mai visto.
Googlando ho trovato molta gente che parla di kernel bug su Redhat,
Ubuntu, ecc... ma nessuno trova la soluzione (che magari ancora non
esiste :-) ).
Mi chiedo se qualcuno di voi è incappato nello stesso problema, anche
perchè da qul che vedo Debian6 ormai è usato in ambienti di produzione
ed i test che faccio io non sono nulla di particolare... ergo perchè
nessuno ne parla?
Mi sto perdendo qualcosa? :-)

Qualcuno ha esperienza in merito?

cioe e grazie

Alex


Reply to: