[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: [OT] Raid por hardware



El Thu, 08 Jan 2015 21:52:42 +0100, José Miguel (sio2) escribió:

> El Thu, 08 de Jan de 2015, a las 03:06:54PM +0000, Camaleón dijo:
> 
>> > Y de la opción 21 (RAID options) no dice nada de nada.
>> 
>> Te dice que sirve para obtener información del RAID y de las opciones
>> que permite, que son varias, la verdad.
> 
> Cierto, pero es que esas opciones... son las que ya se ven si se ejecuta
> el programa.

Correcto, pero añaden alguna cosilla más que nunca está de más para los 
comandos que son menos obvios.

> [...]
> 
>>> Le he pasado el test "short" y el "conveyance" a ambos discos. Ambos
>>> sin problemas. Puedo intentar pasarle el "long" a lo largo de la noche
>>> a ver sí dice algo más.
>> 
>> Pásale el test extendido, merece la pena y así te quedas más tranquilo.
> 
> Los discos parecen estar bien,

Si le has pasado el test largo y no te ha detectado ningún error, 
perfecto.

>> > Otro problema que tengo es que físicamente no sé cuál es cuál.
> 
>> Las controladoras RAID suelen tener una opción para identificar los
>> discos cuando están en una cabina extraíble (a través de un comando que
>> los "ilumina"), no sé si será tu caso.
> 
> Vi en un manual de oracle para un servidor que tiene una controladora
> LSI cómo hacerlo desde su BIOS. Probé, pero no me pareció que
> funcionara.

¿El manual de Oracle? :-? 

Conviene que consultes siempre el manual de la versión de tu 
controladora, aunque nunca está de más ver lo que dicen otros fabricantes 
porque te pueden poner ejemplos de uso ten en cuenta que las opciones y 
parámetros pueden variar.

>> Si no tienes acceso externo a los discos, usa el nº de serie para
>> identificarlos ("show PD" debería darte datos de los discos, tamaño, nº
>> de serie...).
> 
> Sí, vi que smartctl me mostraba ese número de serie. El problema es que
> no vi que ese número de serie me lo proporcionara ni lsiutil ni la BIOS
> de la controladora. Así que por un lado podía identificar los discos,
> pero no cuál estaba desincronizado y, por otro, podía saber cuál está
> desincronizado pero no identificarlo físicamente.

lsiutil debe decírtelo... espera que lo consulto desde el pdf que 
enviaste... vale, creo que debe ser el menú 21 / opción 2 ("show physical 
disks") a lo que deberás pasar el número de la controladora (suele ser 1 
salvo que tengas varias) para que te muestre todos los datos de los 
discos que tienes conectados.

> Al final, como tengo backups de los datos realmente importantes y el
> servidor pelado instalado en un disco virtual, decidí probar fortuna y
> deshice el raid por hardware.

Yeeech. Con un par :-S

> Pero esto no soluciona el problema. El servidor sigue yendo anormalmente
> lento y creo que ese es el problema del que se derivan todos (quizás
> incluso el de la eterna resincronización del RAID).
> 
> Ya desecho el RAID, arranqué con un disco y probé a hacer una
> actualización de los paquetes actualizados en wheezy. La descarga de los
> paquetes se hace a velocidad normal; sin embargo, el desempaquetado,
> sustitución y configuración de los paquetes nuevos es anormalmente
> lento.

Pero ¿con deshacer el raid ya es suficiente? Supongo que habrás tenido 
que desactivar la controladora raid desde la bios, ponerlo en modo ahci y 
volcar los datos/particiones de nuevo ¿no? Porque de lo contrario 
seguirás usando el mismo módulo del kernel (mtp*) y si no quieres raid 
por harwdare convendría que usaras el driver abierto achi que te dará 
menos problemas.

> Tengo otro servidor en otro sitio para comparar, aunque no tienen el
> mismo hardware, y no hay color: el servidor que me da problemas puede
> tardar como 10 veces más en hacer las mismas operaciones triviales.
> Ambos están practicamente sin trabajo, así que no es un problema de
> sobrecarga. Tampoco parece un problema de lectura y escritura en disco,
> porque hice algunas pruebas con dd y hdparm y los resultados eran
> normales.
> 
> No sé. En ocasiones el servidor se queda como pillado con un comando y
> al poco reacciona. Por ejemplo, al instalar hdparm escribí:
> 
> # aptitude installq hdparm
> 
> me di cuenta del error nada más pulsar Enter e instintivamente escribí
> ^C. Sin embargo, el programa no respondía al ^C aunque lo escribí varias
> veces. Así estuvo como veinte segundos, hasta que finalmente reaccionó y
> se abortó.
> 
> :/

MIra a ver si sigue cargado el controlador de la tarjeta (mtp*) o estás 
usando el driver ahci (lsmod)

Saludos,

-- 
Camaleón


Reply to: