Forse Z o X dopo tutti i kill che ha dato, fosse stato D sarebbe stato
nella condizione che descrivi sopra, R dovrebbe essere regolarmente "killabile":
D uninterruptible sleep (usually IO)
R running or runnable (on run queue)
S interruptible sleep (waiting for an event to complete)
T stopped by job control signal
t stopped by debugger during the tracing
W paging (not valid since the 2.6.xx kernel)
X dead (should never be seen)
Z defunct ("zombie") process, terminated but not reaped by its parent
Sarebbe interessante vedere il contenuto dello script
E' in stato R, dal 21 agosto. A meno che `ps` non menta :P
e guardando cosa combina con `strace` non esce nulla.... quindi l'ipotesi che sia una syscall che appesa è verosimile.
Per il contenuto dello script mi spiace ma non posso mostrarlo perchè non ne ho l'accesso neanche io.
Gira su una macchina in produzione per $FamosaMultinazionale dove un'amica fa consulenza con la maglietta di $GrandeAziendaDiConsulenza e
non credo sia appropriato (tanto più che non è codice suo ed io non collaboro con nessuno degli attori).
So solo che:
- c'è un qualcosa che controlla che non sia già attivo
- sincronizza dei dati attraverso SOAP o sFTP
- gira da CLI con cron (niente apache)
- e su una macchina con altre decine di processi di sincronizzazione
- per fare il reboot devi fare una mail con troppi destinatari
Mi incuriosiva che un SIGKILL da root non facesse nulla... proprio perchè, come dici tu, R "dovrebbe" essere killabile.