[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Release announcement simplified Chinese translation update



on 四, 2009-02-19 at 09:06 +0800, Dongsheng Song wrote:
> 我不明白,为什么还死抱着 GB2312/Big5 不放手,直接使用 UTF-8 不好吗?
> sc <=> tc 应该只转换内容,不应该多此一举的转换到过时的编码。
> 

假设一个用户要对 index.wml 文件贡献一些翻译条目,例如 "Debian 是什麼",目前的
处理方式由于所提交的 index.wml 是 BIG5 编码的,通过 iconv 可以直接把 "Debian 
是什麼" 转换成 "Debian 是什么",那么简/繁各自的 HTML 文件都能正确显示。

如果把 index.wml 文件由 BIG5 编码转换成 UTF-8 编码,并且假设最终生成的 HTML 文
件也使用 UTF-8 编码,问题是如何在简体 HTML 文件中显示 "Debian 是什么",而在繁
体 HTML 文件中显示 "Debian 是什麼"。

另外考虑一下 UTF-8 编码格式的 index.wml 文件,如果简繁用户先后贡献了两条翻译条
目,并且他们所录入的文字,使用的都是各自习惯的文字系统(简体/繁体)。这时
index.wml 文件同时保存着简体中文和繁体中文两种系统的文字,如何把 wml 文件向
html 文件以正确的文字系统对应关系进行转换呢?

举例来说,一个简体用户在 index.wml 的第6行贡献了一个翻译条目 "<h2>Debian 是什
么</h2>",若干月之后一个繁体用户在 index.wml 的第23行贡献了一个条目 "<h2>現在
開始</h2>"。有什么办法可以实现:

* 将 index.wml 文件转换成 index.zh-cn.html 时,
  把第23行的内容转换成 "<h2>现在开始</h2>"。
  第6行的内容保持不变

* 将 index.wml 文件转换成 index.zh-tw.html/index.zh-hk.html 时,
  把第6行的内容转换成 "<h2>Debian 是什麼</h2>"。
  第23行的内容保持不变

解决了这个问题,就可以实现 wml 文件格式从 BIG5 向 UTF-8 迁移了。
-- 
Vern
2009-02-19

Attachment: signature.asc
Description: Digital signature


Reply to: