[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Plantage général du système



Bonjour,

hier soir, gros souci d'un coup sur mon serveur Sarge. D'abord je remarque que 
toutes mes connexions ssh sont mortes et impossible de se reconnecter. 
Ensuite, mes connexions wifi (driver madwifi) ne fonctionne plus. Puis je 
vais voir sur le serveur lui-même et X a planté, plus d'accès à la machine, 
le clavier ne répond plus. Donc je suis obligé d'éteindre sauvagement. 
Reboot, ça marche mais plus de wifi. Un iwconfig me dit :

Warning: Driver for device ath0 has been compiled with version 18
of Wireless Extension, while this program supports up to version 17.
Some things may be broken...

Jamais vu ça auparavant...

Je vais voir dans syslog :

Nov 23 08:40:20 machine kernel: CPU:    0
Nov 23 08:40:20 machine kernel: EIP:    0060:[pg0+956415535/1069782016]    
Tainted: P      VLI
Nov 23 08:40:20 machine kernel: EFLAGS: 00013286   (2.6.13-arkamons.1)
Nov 23 08:40:20 machine kernel: EIP is at _nv001477rm+0x33/0x94 [nvidia]
Nov 23 08:40:20 machine kernel: eax: f510a800   ebx: f5169120   ecx: ea60f50f   
edx: f5169120
Nov 23 08:40:20 machine kernel: esi: f97437a0   edi: 00000007   ebp: f55a5d6c   
esp: f55a5d44
Nov 23 08:40:20 machine kernel: ds: 007b   es: 007b   ss: 0068
Nov 23 08:40:20 machine kernel: Process XFree86 (pid: 4579, 
threadinfo=f55a4000 task=f57a3570)
Nov 23 08:40:20 machine kernel: Stack: f7433c00 00000004 00000000 f97437a0 
00000000 f97437a0 00000000 f55a5da0
Nov 23 08:40:20 machine kernel:        f93e1a66 f7265800 f55a5d9c f93e0c14 
f97437a0 c1d00005 00000007 00000000
Nov 23 08:40:20 machine kernel:        f9743580 00000002 f50fea60 f97437b4 
f97437cc f95e145a f55a5dcc f93e0d52
Nov 23 08:40:20 machine kernel: Call Trace:
Nov 23 08:40:20 machine kernel:  [pg0+956418662/1069782016] 
rm_disable_interrupts+0x42/0x54 [nvidia]
Nov 23 08:40:20 machine kernel:  [pg0+956414996/1069782016] 
_nv004752rm+0x38/0x58 [nvidia]
Nov 23 08:40:20 machine kernel:  [pg0+958514266/1069782016] 
os_pci_read_dword+0x3d/0x45 [nvidia]
Nov 23 08:40:20 machine kernel:  [pg0+956415314/1069782016] 
_nv001472rm+0x8a/0x94 [nvidia]
Nov 23 08:40:20 machine kernel:  [pg0+956391690/1069782016] 
_nv002123rm+0x12/0x18 [nvidia]
Nov 23 08:40:20 machine kernel:  [pg0+956419934/1069782016] 
rm_free_unused_clients+0x2e/0x88 [nvidia]
Nov 23 08:40:20 machine kernel:  [pg0+956419989/1069782016] 
rm_free_unused_clients+0x65/0x88 [nvidia]
Nov 23 08:40:20 machine kernel:  [pg0+956419969/1069782016] 
rm_free_unused_clients+0x51/0x88 [nvidia]
Nov 23 08:40:20 machine kernel:  [pg0+958498188/1069782016] 
nv_kern_close+0x7d/0x135 [nvidia]
Nov 23 08:40:20 machine kernel:  [__fput+398/416] __fput+0x18e/0x1a0
Nov 23 08:40:20 machine kernel:  [filp_close+77/128] filp_close+0x4d/0x80
Nov 23 08:40:20 machine kernel:  [put_files_struct+86/192] 
put_files_struct+0x56/0xc0
Nov 23 08:40:20 machine kernel:  [do_exit+249/896] do_exit+0xf9/0x380
Nov 23 08:40:20 machine kernel:  [do_group_exit+52/112] 
do_group_exit+0x34/0x70
Nov 23 08:40:20 machine kernel:  [get_signal_to_deliver+473/688] 
get_signal_to_deliver+0x1d9/0x2b0
Nov 23 08:40:20 machine kernel:  [do_signal+145/288] do_signal+0x91/0x120
Nov 23 08:40:20 machine kernel:  [sys_tgkill+245/256] sys_tgkill+0xf5/0x100
Nov 23 08:40:20 machine kernel:  [dput+398/416] dput+0x18e/0x1a0
Nov 23 08:40:20 machine kernel:  [__fput+298/416] __fput+0x12a/0x1a0
Nov 23 08:40:20 machine kernel:  [sigprocmask+72/176] sigprocmask+0x48/0xb0
Nov 23 08:40:20 machine kernel:  [sys_rt_sigprocmask+130/224] 
sys_rt_sigprocmask+0x82/0xe0
Nov 23 08:40:20 machine kernel:  [do_notify_resume+53/56] 
do_notify_resume+0x35/0x38
Nov 23 08:40:20 machine kernel:  [work_notifysig+19/21] 
work_notifysig+0x13/0x15
Nov 23 08:40:20 machine kernel: Code: 53 8b 75 08 8b 7d 10 83 c4 fc a1 44 b0 
65 f9 6a 00 6a 04 50 8b 40 18 ff d0 8b 9e 88 0
0 00 00 89 da 00 c4 10 eb 0b 8d b6 00 00 00 <00> 89 da 8b 5b 18 85 db 74 48 39 
7b 14 75 f2 8b 45 0c 39 03 75
Nov 23 08:40:20 machine kernel:  <1>Fixing recursive fault but reboot is 
needed!

La carte graphique est une nvidia GeForce FX 5200, qui marchait très bien avec 
le driver proprio 7676.

Pas d'autre message inquiétant dans ce fichier. Au démarrage (et 
dans /var/log/boot) , je lis :

Tue Aug 30 11:35:31 2005: Cleaning /tmpfind: ./1038349296: Input/output error
Tue Aug 30 11:35:31 2005: find: ./ssh-kzaxng4226: Input/output error
Tue Aug 30 11:35:31 2005: find: ./ssh-WFZtfq4226: Input/output error
Tue Aug 30 11:35:31 2005: find: ./1038349296: Input/output error
Tue Aug 30 11:35:31 2005: find: ./ssh-kzaxng4226: Input/output error
Tue Aug 30 11:35:32 2005: find: ./ssh-WFZtfq4226: Input/output error

Remarquez la date: 30 août ! on dirait que ce fichier n'a pas été actualisé 
alors que j'ai redémarré ce matin !

Les machines tournent sur un noyau 2.6.13 compilé par mes soins, sont toutes 
en Sarge, et je n'ai rien touché concernant le noyau avant ce plantage. Tout 
marchait nikel jusque là (uptime d'une 30aine de jours sur le serveur). La 
dernière mise à jour (celle de hier) :

[MIS A JOUR] libnetpbm10 2:10.0-8sarge1 -> 2:10.0-8sarge2
[MIS A JOUR] libnetpbm9 2:10.0-8sarge1 -> 2:10.0-8sarge2
[MIS A JOUR] netpbm 2:10.0-8sarge1 -> 2:10.0-8sarge2



Voilà où j'en suis. J'ai cherché un peu partout dans les logs, et rien qui ne 
me met la puce à l'oreille. Je continue mes recherches, mais si vous avez une 
idée, je suis très preneur.


Merci d'avance.


Steve - très perplexe...



Reply to: