[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: INFO: task apache2:5389 blocked for more than 120 seconds



El 26/09/11 09:08, Sergio Villalba escribió:
> Muy buenas a todos,
>
> Este fin de semana he tenido caídas en el servicio Web y la verdad que
> este mañana nos hemos dado cuenta del problema....(será necesario
> configurar bien el Pandora FMS).
>
> El servidor Apache estaba detenido y en los logs del kernel aparecen
> estos mensajes:
>
> Sep 24 03:27:10 web kernel: [5160670.759468] INFO: task apache2:5429
> blocked for more than 120 seconds.
>
> Sep 24 03:27:10 web kernel: [5160670.761501] "echo 0 >
> /proc/sys/kernel/hung_task_timeout_secs" disables this message.
>
> Sep 24 03:27:10 web kernel: [5160670.761796] apache2       D f6461e0c
>    0  5429   6529 0x00000000
>
> Sep 24 03:27:10 web kernel: [5160670.761995]  f04ab740 00200082
> f6461ccc f6461e0c f6461e10 c1419100 c1419100 c14146ac
>
> Sep 24 03:27:10 web kernel: [5160670.762078]  f04ab8fc c2a08100
> 00000001 0000048a 00000041 c13b13c0 c108af35 00001d36
>
> Sep 24 03:27:10 web kernel: [5160670.762088]  c2a036ac f04ab8fc
> 4cf68992 00000000 0d4bcc4a 00000000 00000000 00000000
>
> Sep 24 03:27:10 web kernel: [5160670.762163] Call Trace:
>
> Sep 24 03:27:10 web kernel: [5160670.763072]  [<c108af35>] ?
> zone_watermark_ok+0x16/0x99
>
> Sep 24 03:27:10 web kernel: [5160670.763104]  [<c126d54a>] ?
> io_schedule+0x5f/0x98
>
> Sep 24 03:27:10 web kernel: [5160670.763700]  [<f839b6ba>] ?
> nfs_wait_bit_uninterruptible+0x5/0x8 [nfs]
>
> Sep 24 03:27:10 web kernel: [5160670.763710]  [<c126d9d1>] ?
> __wait_on_bit+0x33/0x58
>
> Sep 24 03:27:10 web kernel: [5160670.763731]  [<f839b6b5>] ?
> nfs_wait_bit_uninterruptible+0x0/0x8 [nfs]
>
> Sep 24 03:27:10 web kernel: [5160670.763738]  [<c126daab>] ?
> out_of_line_wait_on_bit+0xb5/0xbd
>
> Sep 24 03:27:10 web kernel: [5160670.763755]  [<f839b6b5>] ?
> nfs_wait_bit_uninterruptible+0x0/0x8 [nfs]
>
> Sep 24 03:27:10 web kernel: [5160670.763770]  [<c1044067>] ?
> wake_bit_function+0x0/0x3c
>
> Sep 24 03:27:10 web kernel: [5160670.763788]  [<f839b6af>] ?
> nfs_wait_on_request+0x19/0x1f [nfs]
>
> Sep 24 03:27:10 web kernel: [5160670.763805]  [<f839f26f>] ?
> nfs_updatepage+0x1a0/0x4b1 [nfs]
>
> Sep 24 03:27:10 web kernel: [5160670.763821]  [<f839f5ae>] ?
> nfs_flush_incompatible+0x2e/0x4a [nfs]
>
> Sep 24 03:27:10 web kernel: [5160670.763836]  [<f83937c9>] ?
> nfs_write_end+0x104/0x12d [nfs]
>
> Sep 24 03:27:10 web kernel: [5160670.763856]  [<c108841e>] ?
> generic_file_buffered_write+0x12f/0x21d
>
> Sep 24 03:27:10 web kernel: [5160670.763864]  [<c1088909>] ?
> __generic_file_aio_write+0x265/0x28d
>
> Sep 24 03:27:10 web kernel: [5160670.763875]  [<c11ceb27>] ?
> sock_common_recvmsg+0x2f/0x45
>
> Sep 24 03:27:10 web kernel: [5160670.763881]  [<c11ccef0>] ?
> __sock_recvmsg+0x50/0x58
>
> Sep 24 03:27:10 web kernel: [5160670.763945]  [<c1088982>] ?
> generic_file_aio_write+0x51/0x93
>
> Sep 24 03:27:10 web kernel: [5160670.763968]  [<f83941f3>] ?
> nfs_file_write+0xf5/0x159 [nfs]
>
> Sep 24 03:27:10 web kernel: [5160670.763984]  [<c10b314e>] ?
> do_sync_write+0xc0/0x107
>
> Sep 24 03:27:10 web kernel: [5160670.763997]  [<c104403a>] ?
> autoremove_wake_function+0x0/0x2d
>
> Sep 24 03:27:10 web kernel: [5160670.764014]  [<c1033d67>] ?
> do_setitimer+0x1be/0x1d0
>
> Sep 24 03:27:10 web kernel: [5160670.764030]  [<c11027e0>] ?
> security_file_permission+0xc/0xd
>
> Sep 24 03:27:10 web kernel: [5160670.764041]  [<c10b308e>] ?
> do_sync_write+0x0/0x107
>
> Sep 24 03:27:10 web kernel: [5160670.764051]  [<c10b3a58>] ? vfs_write+0x7e/0xd6
>
> Sep 24 03:27:10 web kernel: [5160670.764061]  [<c10b3b48>] ? sys_write+0x3c/0x63
>
> Sep 24 03:27:10 web kernel: [5160670.764073]  [<c10030fb>] ?
> sysenter_do_call+0x12/0x28
>
> Datos:
>
> Debian  6.0.2
>
> uname -a
> Linux web 2.6.32-5-686 #1 SMP Mon Jun 13 04:13:06 UTC 2011 i686 GNU/Linux
>
> Los logs de Apache son almacenado en un servidor NFS en nuestra red
> local, ¿estos mensajes están relacionado con eso?
>
> La configuración de Apache es la siguiente:
>
> Timeout 1800
>
> KeepAlive On
>
> MaxKeepAliveRequests 1000
>
> DumpIOInput On
> DumpIOLogLevel debug
>
> <IfModule mpm_prefork_module>
>     StartServers         20
>     MinSpareServers      10
>     MaxSpareServers      10
>     MaxClients          150
>     MaxRequestsPerChild   10000
> </IfModule>
>
> <IfModule mpm_event_module>
>     StartServers          2
>     MaxClients          150
>     MinSpareThreads      25
>     MaxSpareThreads      75
>     ThreadLimit          64
>     ThreadsPerChild      25
>     MaxRequestsPerChild   0
> </IfModule>
>
> User ${APACHE_RUN_USER}
> Group ${APACHE_RUN_GROUP}
>
> ¿Alguien me puede dar alguna pista?
>
> Ahora mismo tengo el servicio funcionando porque he reiniciado el Apache.
>
> Gracias, un saludo.
>
>

Hola,

Pues tiene toda la pinta, parece que tienes un problema con NFS y el
hilo se bloquea al no poder escribir el archivo de log. Podrías escribir
los log a local y programar el volcado a NFS o bien usar rsync. De este
modo un problema con NFS no te fastidiaría apache.

Un saludo.


Reply to: