[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Re[4]: [I18n] Simple input methods for X11 available (fwd)



On Thu, 26 Oct 2000, hashao wrote:

> Hello gis88564,
> On Thursday, October 26, 2000, gis88564 wrote:
> 
> g>         另外,最近在思考内码转换的问题,国内一直有人在提倡 CCCII,
> g>         但是实际上台湾习惯用 big5,大陆习惯用 bgk,而厂商又喜欢用 Unicode
> g>         ,而日本,韩国也都有自己习惯的 charset,所以想到输入法何不
> g>         在启动时,根据外部的转换表格动态配置自己的 charset 来对映到
> g>         现存的 charset 呢? 也就是说,给一份 big5<=>unicode 的表格
> g>         ,载入后,便动态给 big5 和 unicode 的每一个字元一个输入法
> g>         自己看得懂的 32bit 编号,接下来,要载入输入法(像仓颉)表格
> g>         时,假设表格是用 big5 ,那便把 big5 各字元一个一个转成输入
> g>         法自己看的编号,这样输入法多透过一层的内码转换,不过却不用
> g>         被内码的问题绑死,将来做各 charset 互转时也会更方便些,什么
> g>         base on CCCII, big5, unicode, jis 都无所谓罗,反正只是个外
> g>         部的表格而已。
> 
> 不是太看得懂。不过印象中 xcin 现在使用 UCS4 作内部编码,输出时才
> 转换成别的编码(BIG5,GB)只是因为
> 目前X库不能实时转换国际化部分(也可以,麻烦),而 XIM 是不能做到
> 实时编码转换的,所以 xcin 需要为不同的 locale 分别开一个程序。
> 
> 如果有随便转换输入法的协议, xcin 直接支持输入输出编码转换应该不是什么
> 问题。 chinput 3 应该做到了这一点,不过我想应该有一些 hack ,不
> 是很标准。
> 
> IIIMP 应该可以解决这个问题。
> 

	我之前所提的简单的说,就是做各种内码的转换,之所以提出”输入法
	内部字元集”是因为,不论采用何种编码(UCS-4),都会遇到缺字的问题
	,也就是在 A 字元集有 aa,而 B 字元集却没有 aa,就算选择 UCS-4
	当内码也不是万灵丹,毕竟 UCS-4 没定的字,没有就是没有,所以一
	由另一套字元集转成 UCS-4 时,掉字是可想而知的,所以让使用者有
	选择自己喜欢的字元集当核心是比较好的,或者在做内码转换时, aa
	由 A => B => C 时,万一 B 缺了 aa 这个字,最后转到 C 时,只要
	C 定这 aa 这个字,也应该要能转换成功,或者,如果你假设 UCS-4 
	一定是各字元集的 superset ,那上述的问题也就不会发生罗。。:)

	呵~~~小弟作文能力实在不好,可能还是无法清楚的
	表达出自己的意思。。 :~~~

	不过我实在不欣赏 X 对 locale,字形,input method 的处理,
	感觉上 X 一直在硬撑~~~~~~~

-- 
| This message was re-posted from debian-chinese-big5@lists.debian.org
| and converted from big5 to gb2312 by an automatic gateway.



Reply to: