[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: procmail e caracteres acentuados



On Wed, Mar 09, 2005 at 10:20:46AM -0300, Marcio de Araujo Benedito wrote:
> * mandioca@mighty.co.za (mandioca@mighty.co.za) wrote:
> 
> > Pelo que disse, suponho que essas máquinas rodam Microsoft Windows
> > ("C:\"). Se este for o caso, o problema provavelemente decorre de
> > incompatibilidade de codificação de carecteres (charset ou encoding)
> > entre este sistema operacional e o Debian. Se não me engano, a
> > algum tempo, o Windows adota UCS-2 como codificação para nomes de
> > arquivos. O UCS-2 parece ser ANSI compatível mas não ISO8859-1. Por
> > isso a acentuação aparece de modo incorreto. Eu não conheço o
> > problema em si, mas conheço o assunto... :-) verifique se você possui
> > o "convmv" e use-o para converter a codificação (de UCS-2 para
> > ISO8859-1). Retorne o resultado.
> 
> Obrigado pela resposta, pois ainda não tenho a solução para o problema.
> As máquinas aqui tem de tudo, gnu/linux, windows NT, windows 2000, aix,
> solaris e até uma OS/2! MAs depois de sua mensagem fui testar sobre o
> tal UCS-2, e mandeu o mesmo arquivo com caracteres acentuados no nome e
> deu o mesmo erro, tanto das windows quanto das outras.
> 
> Na manpage do "convmv" explica o que ele faz, mas não encontrei como
> integrá-lo com o procmail e o script perl que desanexa os arquivos
> automaticamente das mensagens.
> 

Desculpe-me, Márcio. Parece que minha resposta foi mesmo "vaga".
Bem...
Retornando ao assunto, parece-me que o problema está na
incompatibilidade de codificação usada por esses sistemas operacionais
nos nomes de seus arquivos. Sendo assim, a primeira saída que vejo é
descobrir a codificação usada por cada sistema e adicionar um script que
identifique este sistema e faça a conversão usando "convmv". Eu não sei
a codificação usada pelo Solaris ou OS/2(e supunho que não estejam
ocorrendo problemas com arquivos vindos de tais máquinas, pois penso
serem bastante compatíveis...), mas acho que o Windows usa
UCS-2 para um sistema internacionalizado e cp850 para um sistema
localizado oeste europeu (mais comum em instalações brasileiras). Na
primeira mensagem, eu queria apenas identificar se esse era realmente o
problema. Portanto, rode um "convmv -f cp850 -t iso8859-1 _file_" num
destes arquivos mal acentuados que provenham de uma máquina win e veja o
resultado na tela. Se a acentuação aparecer correta, adicione um
"--notest" para efetivar a recodificação.

Algum "How to Answer Questions in The Smart Way"?  Acho que preciso de
um.. :-)

--
mandioca



Reply to: