[OT] Re: Qual a melhor solução para esse problema??
-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1
On 18-09-2007 11:50, Debian User wrote:
> Gostaria de uma opinião de vocês mestres do Linux.. =P
> Tenho uma situação na qual devo encontrar alguma solução para
> administra-la de uma forma melhor que a atual, porém não sei qual seria
> a solução adequada para este caso. A situação é a seguinte:
> Onde eu trabalho nós recebemos muitos e-mails (média de uns 500 por dia)
Ok, vamos colocar as coisas em perspectiva, se você assina
a LKML e a d-u-p, 500 e-mails por dia não são "muitos e-mails", é
uma quantidade razoável de e-mails, há pessoas que sozinhas lidam
com mais do que isso.
> e todos esses e-mails devem permanecer armazenados e permitir o acesso
> por varias pessoas.
Até aqui sem problemas, você pode fazer isso de várias
formas, dependendo do tipo de acesso que você quer permitir e do
nível técnico envolvido.
> Hoje ele é armazenado no proprio servidor IMAP, onde
> foi criado alguns diretorios identificados por ano/mes e a medida que os
> e-mails vao chegando os responsaveis vão movendo-os para esses diretórios.
Você pode usar um servidor de IMAP que suporte contas
compartilhadas, ou seja, a mesma conta é compartilhada por
várias pessoas, você pode usar uma abordagem similar a listas
de discussão. Você pode usar filtros, no próprio MTA, para
melhor dividir e classificar a entrega, sem precisar fazer
isso manualmente.
> O problema é que o volume de e-mails está crescendo muito rapidamente,
> hoje temos pouco mais de 10GB de e-mails armazenados.
Esse é o tipo de afirmação que acende a luz vermelha no
painel pra dizer que há algo _muito_ errado. Tradicionalmente,
mensagens de e-mail são texto puro, 10GB de e-mail quer dizer
duas coisas: (1) não são só mensagens de e-mail ou (2) não são
só 500 mensagens por dia.
No primeiro caso, o problema não é o armazenamento do
e-mail mas do que está anexo, e nesse caso, você precisa de algo
na linha de Gestão Eletrônica de Documentos (GED) e não uma
solução para gerenciamento e armazenamento de e-mail.
> Portanto, além de
> essa maneira não ser a mais correta, daqui a alguns anos vai ficar
> inviavel o armazenamento desses e-mails desta maneira, pois além da
> segurança dos dados (os dados contidos nesses e-mails tem muita
> importancia para a organização), acredito que por se tratar de emails, a
> indexação de 20 ou 30GB de e-mails não deve ser nada rapido.
Com a afirmação "os dados contidos nesses e-mails tem
muita importância para a organização", eu diria que é muito
importante que a "organização" tome consciência o mais rápido
possível que armazenar dados muito importantes em e-mails
(testo puro com encode64) é uma *péssima* idéia, especialmente
a longo prazo.
Então, esses "dados" deveriam ser extraídos e armazenados
de forma correta, provavelmente um robô que opere no e-mail seja
capaz de fazer isso sem grandes problemas, assim você pode separar
texto e anexos e criar uma forma mais inteligente de armazenar,
estrutura e indexar toda essa massa de dados.
Sobre indexar 20GB, se fosse de texto, até que não dá
muito trabalho se você tiver os recursos físicos e lógicos para
fazer isso.
> Então fica a minha dúvida: Qual seria uma maneira melhor de armazenar
> esses dados, tal que permita o acesso a qualquer momento ao conteúdo
> desses e-mails por meio de pesquisas, etc??
> Agradeço muito a ajuda de todos voces!
A melhor maneira é saber o que é essa massa de dados,
como ela cresce e porque ela está vinculado ao e-mail, e daí
pensar numa estratégia para endereçar o problema de forma
consistente.
Abraço,
- --
Felipe Augusto van de Wiel (faw)
"Debian. Freedom to code. Code to freedom!"
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.6 (GNU/Linux)
Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org
iD8DBQFG80eECjAO0JDlykYRAuwTAJ9xkGI+K8pLJIR5/sxkWig40x7sHgCfY6M0
nwDOSK2SZLrInxHVhejwB9k=
=KzrU
-----END PGP SIGNATURE-----
Reply to: