[ERA: ram - memoria occupata effettivamente] crash per troppa ram mangiata
On 27/12/2011 20:53, Davide Prina wrote:
cosa intendi per "differenti"?
Puoi stampare il risultato di:
$ free -m
e indicare quanto vedi in htop, indicando quale riga leggi
non lo farò. NN_il_confusionario mi ha dato un ovvio suggerimento,
facedomi sentire un deficiente. Funzionano benissimo ovviamente. Grazie
NN...
Questi dati mi servivano per capire cos'è accaduto ad un computer
dell'università: il 23 lo abbiamo montato, e vi abbiamo avviato dei
processi molto pesanti. Pesanti al punto che la memoria swappata
sembrava via via esaurirsi. La ram penso fosse finita da un po'. Il 24,
dal file kern.log, la memoria swap si è esaurita, ed il kernel ha
cominciato a killare a ripetizione processi come exim, metacity, gnome,
avahi, bonobo, apache, bash. Vi posto delle righe di esempio:
<[RIGHE DA KERN.LOG]>
Dec 24 11:51:10 pcpiva3 kernel: [932892.304272] Out of memory: kill
process 1619 (avahi-daemon) score 580 or a child
Dec 24 11:51:10 pcpiva3 kernel: [932892.304275] Killed process 1619
(avahi-daemon)
Dec 24 11:51:10 pcpiva3 kernel: [932893.087625] Out of memory: kill
process 1574 (winbindd) score 527 or a child
Dec 24 11:51:10 pcpiva3 kernel: [932893.087628] Killed process 1580
(winbindd)
Dec 24 11:51:10 pcpiva3 kernel: [932895.826370] __ratelimit: 3 callbacks
suppressed
Dec 24 11:51:10 pcpiva3 kernel: [932895.826375] sshd invoked oom-killer:
gfp_mask=0x201da, order=0, oom_adj=-17
Dec 24 11:51:10 pcpiva3 kernel: [932895.826379] sshd cpuset=/ mems_allowed=0
Dec 24 11:51:10 pcpiva3 kernel: [932895.826383] Pid: 16903, comm: sshd
Tainted: P 2.6.32-5-amd64 #1
Dec 24 11:51:10 pcpiva3 kernel: [932895.826385] Call Trace:
Dec 24 11:51:10 pcpiva3 kernel: [932895.826394] [<ffffffff810b6324>] ?
oom_kill_process+0x7f/0x23f
Dec 24 11:51:10 pcpiva3 kernel: [932895.826398] [<ffffffff810b6848>] ?
__out_of_memory+0x12a/0x141
Dec 24 11:51:10 pcpiva3 kernel: [932895.826402] [<ffffffff810b699f>] ?
out_of_memory+0x140/0x172
Dec 24 11:51:10 pcpiva3 kernel: [932895.826407] [<ffffffff810c8660>] ?
congestion_wait+0x74/0x80
Dec 24 11:51:10 pcpiva3 kernel: [932895.826412] [<ffffffff81064f92>] ?
autoremove_wake_function+0x0/0x2e
Dec 24 11:51:10 pcpiva3 kernel: [932895.826416] [<ffffffff810ba704>] ?
__alloc_pages_nodemask+0x4ec/0x5fc
Dec 24 11:51:10 pcpiva3 kernel: [932895.826421] [<ffffffff812fb47a>] ?
io_schedule+0x93/0xb7
Dec 24 11:51:10 pcpiva3 kernel: [932895.826426] [<ffffffff810bbc69>] ?
__do_page_cache_readahead+0x9b/0x1b4
Dec 24 11:51:10 pcpiva3 kernel: [932895.826429] [<ffffffff81064fc0>] ?
wake_bit_function+0x0/0x23
Dec 24 11:51:10 pcpiva3 kernel: [932895.826433] [<ffffffff810bbd9e>] ?
ra_submit+0x1c/0x20
Dec 24 11:51:10 pcpiva3 kernel: [932895.826438] [<ffffffff810b4a72>] ?
filemap_fault+0x17d/0x2f6
Dec 24 11:51:10 pcpiva3 kernel: [932895.826442] [<ffffffff810ca9e2>] ?
__do_fault+0x54/0x3c3
Dec 24 11:51:10 pcpiva3 kernel: [932895.826447] [<ffffffff810eed05>] ?
do_sync_read+0xce/0x113
Dec 24 11:51:10 pcpiva3 kernel: [932895.826452] [<ffffffff810ccd36>] ?
handle_mm_fault+0x3b8/0x80f
Dec 24 11:51:10 pcpiva3 kernel: [932895.826457] [<ffffffff812febf6>] ?
do_page_fault+0x2e0/0x2fc
Dec 24 11:51:10 pcpiva3 kernel: [932895.826461] [<ffffffff812fca95>] ?
page_fault+0x25/0x30
</[RIGHE DA KERN.LOG]>
dopo le 11.51.10 il silenzio. Per 3 giorni. Il pc era inaccessibile, sia
via ssh che tramite l'interfaccia grafica. Colpevolmente non abbiamo
provato ad aprire un'altro tty, ma sappiamo che non si riusciva a fare
niente. Per 3 giorni il pc è stato acceso, dal 24 al 27, senza loggare
nulla. Ma cos'è successo secondo voi?
io ho questa idea: i processi ingordi hanno mangiato ram&swap, il kernel
ha iniziato a killare tutto, Xorg sshd e rsyslogd compresi, rendendo il
pc "chiuso in se stesso". È una spiegazione fessa o possibile?
grazie a tutti
Reply to: