[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: TESTE DE INTEGRIDADE SSD



Anderson, boa tarde!

Eu não entendi bem a sua dúvida, mas sobre a partição /boot eu consegui contornar isso.
Você não precisa adicionar a partição /boot ao RAID... Algo que você pode fazer é reconfigurar o grub para que, quando ele atualizar, o sistema identifica que existem duas partições /boot e irá atualizar as duas. Sendo assim, se em algum momento o disco 1 (principal) parar de funcionar, o segundo disco terá o /boot atualizado e irá conseguir iniciar corretamente.
PORÉM, existe um segundo pulo do gato que envolve o /boot e o fstab... É meio complicado descrever o problema, mas se trata do seguinte:
Após
 você rodar o reconfigure pros grubs/boot, você conseguirá adicionar a lista do fstab quais são os seus /boot (UUID). O que acontece é que, se o disco principal falhar, durante a inicialização do sistema, o sistema vai ler a primeira linha de /boot que será o UUID do /boot do disco principal que neste caso está fora, e por conta disso não conseguirá iniciar. OK, você até vai conseguir acessar a máquina e modificar o fstab para o segundo UUID de /boot passar a ser o principal, mas o intuito é isso ser invisível. Para este caso, você pode adicionar um mesmo LABEL para as partições /boot.
Logo, na identificação do fstab, ao invés de ter um UUID diferente para cada /boot, você irá identificar o label para montar no /boot. Neste caso, como as duas partições /boot dos dois discos possuem o mesmo LABEL, caso um /boot pare de funcionar (disco fora), ele irá iniciar pelo outro /boot do segundo disco.
Irei descrever abaixo os comandos:

Reconfigurar e identificar os /boot que serão atualizados em conjunto.
PS: É sempre indicado que os HDs sejam de mesma marca e capacidade, para que no momento da formatação do disco, o /boot secundário ficar identico ao principal.
# dpkg-reconfigure grub-efi-amd64


Adicionar LABEL aos /boot.
# dosfslabel /dev/boot1 "nome-label"
# dosfslabel /dev/boot2 "nome-label"


Modificar no fstab a linha que diz respeito ao /boot , trocando o UUID por LABEL.
LABEL=nome-label /boot ....



Pra testar, já sabe... Desativa um HD, depois tenta iniciar pelo outro. Depois desativa o atual, e reinicia pelo que estava parado.
Interessante é que o RAID ainda irá funcionar lindamente, e nunca te dará dor de cabeça. :)
Espero ter ajudado!





Best,

On Mar 4 2024, at 1:10 pm, Anderson Rodrigues <andersonrodrigues1979@gmail.com> wrote:
Por falar em Raid tem um problema que eu ainda não consegui contornar, fazendo Raid em Software temos um problema para instalar o /Boot no Raid por exemplo "md0/boot" o Grub não consegue ver esse diretório durante a instalação uma forma de contornar isso é criar uma partição no disco somente para o /boot, porém se esse disco for o que apresentar o problema perdemos o acesso ao sistema, uma pergunta RAID em software é recomendado apenas para máquinas desktops e não servidores, ou temos alguma forma de deixar o /boot com grub em todos os discos de forma a não parar a máquina?
Muito Obrigado a todos e um bom dia.

Em sáb., 2 de mar. de 2024 às 16:01, Rafael de Almeida <rafael.ipv6@gmail.com> escreveu:
Galera,
Quem quiser saber mais sobre SSD no Linux 

Em sáb., 2 de mar. de 2024 às 01:47, Leandro Cunha <leandrocunha016@gmail.com> escreveu:
João, é você que realiza o processo pra se retirar da lista.


Em qua., 28 de fev. de 2024, 14:37, João Pedro Nader Gervasoni <jngerva@hotmail.com> escreveu:
Me retire desta lista 

From: Jose Tavares <jaatavaresf@gmail.com>
Sent: Wednesday, February 28, 2024 2:02:14 AM
To: Yuri Musachio <yuri.musachio@gmail.com>
Cc: Rafael de Almeida <rafael.ipv6@gmail.com>; debian-user-portuguese <debian-user-portuguese@lists.debian.org>
Subject: Re: TESTE DE INTEGRIDADE SSD
 
Me lembrei de algo extra..

Se a máquina onde o SSD está ficar fazendo muito swap, e for colocado no SSD uma particao de swap muito pequena, alguns blocos do SSD serão super stressados com escrita e leitura, podendo danificar aquele espaco precocemente. A recomendacao é que o swap seja sempre 2x a quantidade de ram. Hoje em dia isto pode ser bastante de espaco desperdicado.

Lembrei disto pois já estourei SSD e nvme de laptops algumas vezes. lol ..
Deixa eu contar como aconteceu comigo o problema repetitivamente:
Se o cara ir atrás do MTBF dos modelos de SSD e ler quantos bytes eles aceitam de escrita antes de pifar, e então dividir os bytes pelo espaco de disco, se consegue saber quantas vezes um determinado bloco consegue aceitar escritas antes de estourar.

Depois o cara cria o swap 2x o tamanho da ram e passa a hibernar a máquina no trajeto pro office e no trajeto pra casa, o que seria uma boa prática. Dois hibernates por dia, duas escritas da ram no SSD, no mesmo espaco do swap, vezes uns 2 anos fazendo isto e plim, o SSD comeca a ficar lerdo quando se vai hibernar (realocando) e uma hora dá zebra. É só fazer os calculos, mas pelos 2 anos o problema acontece.

Jose Tavares


On Wed, Feb 28, 2024 at 1:44 AM Jose Tavares <jaatavaresf@gmail.com> wrote:
Alguns fabricantes de SSD tem produtos muito ruins.

Instala o pacote smartmontools, e usa o smartctl fazendo teste short e long .. Quando disparares o teste, verifica quanto tempo irá levar e depois de concluir o tempo, com o parâmetro -a consegues ver o resultado.

O smart roda em background, então não afeta a perf da máquina. Lê com atenção os resultados.

Uma tool simples que recomendo é o f3.
Foi escrita por um brasileiro.

Basicamente o que ela faz é escrever padrões em toda a memória flash e depois lê e compara os resultados. Com isto, dá para ver se há diferenças na escrita e depois leitura, o que indicaria erro no armazenamento. Serve para qualquer tipo de armazenamento.

Durante as operações, acompanhe os logs da máquina para ver se acontece resets nas controladoras de disco.

Sobre raid1, é uma opção, mas utilize preferivelmente 2 marcas de SSD diferentes, para contornar problemas de fabricantes e de modelos específicos. Outra opção é usar um SSD e um HDD, e então configurar write-mostly para que todas as leituras se dêem somente do SSD e as escritas em ambos para não ter perda de performance significativa.

Uma coisa que costumo sempre fazer antes de usar qualquer disco é rodar um dd if=<device> of=/dev/null
Desta forma fazendo uma leitura completa do disco antes de começar o seu uso. Nisto já se percebe se houver erros. É possível também fazer testes de escrita e leitura usando o fsck.ext4 com -cc caso o disco tenha sido configurado com ext4.. O comando shred também pode te ajudar fazendo passes no disco e vendo resultados.

Mas de todas opções, o f3 me parece o mais fácil e direto para os teus testes, e irá acusar problemas se houverem.

Ah, e execute todos os testes antes de colocar o disco em produção.

Espero ter ajudado.
Jose Tavares


On Wed, Feb 28, 2024 at 12:00 AM Yuri Musachio <yuri.musachio@gmail.com> wrote:
MUITO FÁCIL fazer o RAID1 (no Debian)… chega a ser ridículo! PORÉM, existem certos “pulo do gato” que eu penei pra encontrar soluções na internet, e que na real não encontrei solução pro meu problema. Eu mesmo “desenvolvi”/descobri uma solução. Rs
Outra solução também, bem simples, é deixar o sistema num HD e o /home colocar num segundo HD… Simples, fácil e invisível pro cliente, caso dê problema no HD do sistema.
Mas se for o caso de não haver um segundo slot de HD, acho que um programa (pode ser GUID mesmo) que faça backup num HD externo, pode ser também uma alternativa.





Best,

Em 27 de fev. de 2024, à(s) 21:47, Rafael de Almeida <rafael.ipv6@gmail.com> escreveu:


Cara é surreal o que estou passando aqui em Fortaleza CE , com tanto SSD dando problema . 
Parece que os bichos são descartáveis e o pior a gente tenta falar para o cliente fazer backup e é mesmo que nada . 
Peguei a sugestão do Eriberto o qual tenho grande admiração. De aconselhar a fazer RAID 1 .( espelhamento ) 


Rafael de Almeida Matias
Especialista em Segurança da Informação
Tecnólogo em Redes de Computadores
Técnico em Informática
Currículo Lattes: https://goo.gl/RqclG4



Em ter., 27 de fev. de 2024 às 16:47, Leandro Cunha <leandrocunha016@gmail.com> escreveu:
Este é um bom tópico pra se levantar, tendo em vista o aumento em uso de SSD.

Links sobre isso


--
Rafael de Almeida Matias
Especialista em Segurança da Informação
Tecnólogo em Redes de Computadores
Técnico em Informática
Currículo Lattes: https://goo.gl/RqclG4

Reply to: