Re: 如何处理即有gbk也有utf8编码的文件

To: debian-chinese-gb@lists.debian.org
Subject: Re: 如何处理即有gbk也有utf8编码的文件
From: Ji YongGang <jungle@soforge.com>
Date: Mon, 18 Apr 2005 19:46:11 +0800
Message-id: <[🔎] 87ll7g9ukc.fsf@jungle.softforge.3322.org>
In-reply-to: <4263824B.9040203@hit.edu.cn> (vaccine@hit.edu.cn's message of "Mon, 18 Apr 2005 17:47:55 +0800")
References: <[🔎] 4263200F.7040607@qubit-star.com> <[🔎] 877jj0bw4s.fsf@jungle.softforge.3322.org> <4263824B.9040203@hit.edu.cn>

vaccine <vaccine@hit.edu.cn> writes:

> <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
>
>
>   
>   
>
>
> Ji YongGang wrote:
>
>   Falls Huang mailto:bhuang@qubit-star.com writes:
>
>   
>   
>     Hello!
> 	现在有些文本文件，同时含有gbk和utf8编码的汉字， 如何将其全部转换为 utf8
> 编码呢？
>
> Regards
> Falls Huang
>
>     
>   
>   <!---->
> 在 LaTeX 输出 pdf 的时候，生成中文标签需要用到 gbk2uni 这个工具，
> 它是将一个 gbk 文件中的部分内容转换成 utf8。
>   
>
>  你可能理解错了，实际上，gbk2uni处理的不是*.tex文件，而是*.out文件
> *.out文件放的就是文档的基本结构层次
> pdf的中文标签是utf8格式，所有需要转换*.out文件
> *.tex不可能同时有两种编码的
>

对!
gbk2uni 处理的是 *.out 文件，见我修改的 d-i-manual build 脚本:
http://cvs.alioth.debian.org/cgi-bin/cvsweb.cgi/d-i-manual/build/buildone_ng.sh?rev=1.2&content-type=text/x-cvsweb-markup&cvsroot=chinese&only_with_tag=HEAD

在 create_newPDF 函数里面，pdflatex 需要处理 tex 文件三次，处理了两次之后调用 gbk2uni

if [ "$PASS" -eq 2 ] && [ "$cur_lang" == "zh_CN" ]; then
      gbk2uni install.${cur_lang}.new.out
fi

>   见：http://www.hooklee.com/tex.html
>
> 逆向过程要不要这么麻烦，我没试过，你可以参考一下 recode，看它能不能满足你的要求。
>
> -- Jungle
>

Reply to:

References:
- 如何处理即有gbk也有utf8编码的文件
  - From: Falls Huang <bhuang@qubit-star.com>
- Re: 如何处理即有gbk也有utf8编码的文件
  - From: Ji YongGang <jungle@soforge.com>

Prev by Date: Re: 如何处理即有gbk也有utf8编码的文件
Next by Date: 请教openq和gaim-openq的问题
Previous by thread: Re: 如何处理即有gbk也有utf8编码的文件
Next by thread: Re: 如何处理即有gbk也有utf8编码的文件
Index(es):
- Date
- Thread