[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: 如何处理即有gbk也有utf8编码的文件



vaccine <vaccine@hit.edu.cn> writes:

> <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
>
>
>   
>   
>
>
> Ji YongGang wrote:
>
>   Falls Huang mailto:bhuang@qubit-star.com writes:
>
>   
>   
>     Hello!
> 	现在有些文本文件,同时含有gbk和utf8编码的汉字, 如何将其全部转换为 utf8
> 编码呢?
>
> Regards
> Falls Huang
>
>     
>   
>   <!---->
> 在 LaTeX 输出 pdf 的时候,生成中文标签需要用到 gbk2uni 这个工具,
> 它是将一个 gbk 文件中的部分内容转换成 utf8。
>   
>
>  你可能理解错了,实际上,gbk2uni处理的不是*.tex文件,而是*.out文件
> *.out文件放的就是文档的基本结构层次
> pdf的中文标签是utf8格式,所有需要转换*.out文件
> *.tex不可能同时有两种编码的
>

对!
gbk2uni 处理的是 *.out 文件,见我修改的 d-i-manual build 脚本:
http://cvs.alioth.debian.org/cgi-bin/cvsweb.cgi/d-i-manual/build/buildone_ng.sh?rev=1.2&content-type=text/x-cvsweb-markup&cvsroot=chinese&only_with_tag=HEAD

在 create_newPDF 函数里面,pdflatex 需要处理 tex 文件三次,处理了两次之后调用 gbk2uni

if [ "$PASS" -eq 2 ] && [ "$cur_lang" == "zh_CN" ]; then
      gbk2uni install.${cur_lang}.new.out
fi

>   见:http://www.hooklee.com/tex.html
>
> 逆向过程要不要这么麻烦,我没试过,你可以参考一下 recode,看它能不能满足你的要求。
>
> -- Jungle
>   

Reply to: