[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Re[4]: [I18n] Simple input methods for X11 available (fwd)




On Thu, 26 Oct 2000, hashao wrote:

> Hello gis88564,
> On Thursday, October 26, 2000, gis88564 wrote:
> 
> g>         另外,最近在思考內碼轉換的問題,國內一直有人在提倡 CCCII,
> g>         但是實際上台灣習慣用 big5,大陸習慣用 bgk,而廠商又喜歡用 Unicode
> g>         ,而日本,韓國也都有自己習慣的 charset,所以想到輸入法何不
> g>         在啟動時,根據外部的轉換表格動態配置自己的 charset 來對映到
> g>         現存的 charset 呢? 也就是說,給一份 big5<=>unicode 的表格
> g>         ,載入後,便動態給 big5 和 unicode 的每一個字元一個輸入法
> g>         自己看得懂的 32bit 編號,接下來,要載入輸入法(像倉頡)表格
> g>         時,假設表格是用 big5 ,那便把 big5 各字元一個一個轉成輸入
> g>         法自己看的編號,這樣輸入法多透過一層的內碼轉換,不過卻不用
> g>         被內碼的問題綁死,將來做各 charset 互轉時也會更方便些,什麼
> g>         base on CCCII, big5, unicode, jis 都無所謂羅,反正只是個外
> g>         部的表格而已。
> 
> 不是太看得懂。不過印象中 xcin 現在使用 UCS4 作內部編碼,輸出時才
> 轉換成別的編碼(BIG5,GB)只是因為
> 目前X庫不能實時轉換國際化部分(也可以,麻煩),而 XIM 是不能做到
> 實時編碼轉換的,所以 xcin 需要為不同的 locale 分別開一個程序。
> 
> 如果有隨便轉換輸入法的協議, xcin 直接支持輸入輸出編碼轉換應該不是什麼
> 問題。 chinput 3 應該做到了這一點,不過我想應該有一些 hack ,不
> 是很標準。
> 
> IIIMP 應該可以解決這個問題。
> 

	我之前所提的簡單的說,就是做各種內碼的轉換,之所以提出”輸入法
	內部字元集”是因為,不論採用何種編碼(UCS-4),都會遇到缺字的問題
	,也就是在 A 字元集有 aa,而 B 字元集卻沒有 aa,就算選擇 UCS-4
	當內碼也不是萬靈丹,畢竟 UCS-4 沒定的字,沒有就是沒有,所以一
	由另一套字元集轉成 UCS-4 時,掉字是可想而知的,所以讓使用者有
	選擇自己喜歡的字元集當核心是比較好的,或者在做內碼轉換時, aa
	由 A => B => C 時,萬一 B 缺了 aa 這個字,最後轉到 C 時,只要
	C 定這 aa 這個字,也應該要能轉換成功,或者,如果你假設 UCS-4 
	一定是各字元集的 superset ,那上述的問題也就不會發生囉。。:)

	呵~~~小弟作文能力實在不好,可能還是無法清楚的
	表達出自己的意思。。 :~~~

	不過我實在不欣賞 X 對 locale,字形,input method 的處理,
	感覺上 X 一直在硬撐~~~~~~~



Reply to: