Alguns fabricantes de SSD tem produtos muito ruins.
Instala o pacote smartmontools, e usa o smartctl fazendo teste short e long .. Quando disparares o teste, verifica quanto tempo irá levar e depois de concluir o tempo, com o parâmetro -a consegues ver o resultado.
O smart roda em background, então não afeta a perf da máquina. Lê com atenção os resultados.
Uma tool simples que recomendo é o f3.
https://fight-flash-fraud.readthedocs.io/en/latest/introduction.html
Foi escrita por um brasileiro.
Basicamente o que ela faz é escrever padrões em toda a memória flash e depois lê e compara os resultados. Com isto, dá para ver se há diferenças na escrita e depois leitura, o que indicaria erro no armazenamento. Serve para qualquer tipo de armazenamento.
Durante as operações, acompanhe os logs da máquina para ver se acontece resets nas controladoras de disco.
Sobre raid1, é uma opção, mas utilize preferivelmente 2 marcas de SSD diferentes, para contornar problemas de fabricantes e de modelos específicos. Outra opção é usar um SSD e um HDD, e então configurar write-mostly para que todas as leituras se dêem somente
do SSD e as escritas em ambos para não ter perda de performance significativa.
Uma coisa que costumo sempre fazer antes de usar qualquer disco é rodar um dd if=<device> of=/dev/null
Desta forma fazendo uma leitura completa do disco antes de começar o seu uso. Nisto já se percebe se houver erros. É possível também fazer testes de escrita e leitura usando o fsck.ext4 com -cc caso o disco tenha sido configurado com ext4.. O comando shred
também pode te ajudar fazendo passes no disco e vendo resultados.
Mas de todas opções, o f3 me parece o mais fácil e direto para os teus testes, e irá acusar problemas se houverem.
Ah, e execute todos os testes antes de colocar o disco em produção.
Espero ter ajudado.
Jose Tavares