[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: 關_中文locale中~字的排序



Hi hashao, nice to talk you again.
On Wed, Sep 13, 2000 at 06:45:00AM +0800, hashao wrote:
> 
> 我覺得這一點正是我們之間的分歧所在,我不知道我的觀點時否正確。我在
> 這裡說一下我的看法。
> 
> 我以為中文 collate 實際上是與中文程序無關的,它並不是給中文程序員來
> 用的,它是給不懂中文的程序員,或者說不懂外文的程序員用來寫國際化
> 程序來用的。中文程序員要想寫中文排序,大可以用一個拼音表,或者筆畫
> 表來做直接排序,根本不用 collation ,那麼我們豈不是根本不需要在 locale
> 裡有這麼一項了?因為程序員根本不用,同理, locale 中其他部分也並不
> 需要, CTYPE, MESSAGE 等等都可以直接嵌入程序而不依靠任何 locale or
> XLOCALE ,一樣可以寫成符合中文習慣的程序。
> 

locale的各個catogery被認為是反映文化習慣的基本方面. 但具體到各語言每個
catogery的重要性不盡相同. Collation 是 alphabetical語言特有的東西, 在那
些語言裡不遵尋某種特定的規則, 就是錯. 作為ideographical語言漢字本沒有內
在的順序, 從這個意義上來講, collation對中文地確可有可無.

似乎您設想的情形是有程序簡單的用strcoll將漢字排序再輸出. 您認為以拼音為序
輸出才符合中文習慣. 未必吧. 我覺得在這種簡單的情況下怎麼排序都無所謂. 說
實話, 我在日常生活中見過以姓氏筆畫排序的, 還真沒見過哪怕一次以拼音排序的.

如果這就是您牆(damn it, chinpu3裡沒那個字!)調使用拼音排序的原因, 恕我不敢苟同.

當我請教大家拼音排序是否有助于中文程序, 我心中想的是使用與拼音有關的輸入法
的中文輸入程序, 因為我個人覺得這是唯一拼音排序有可能有幫住的地方.

> 空口無憑,總是要個例子來說明拼音排序的問題。譬如我們使用的電郵
> 軟件,在目錄中的排序,如果以 subject 來進行,譬如在 mutt 下,
> 設定 LC_COLLATE = zh_CN.GB2312 ,如果使用部首筆畫排序,則需要
> 數筆畫,然後再從部首中判斷我們要找的條目。而程序不會告訴我們
> 目前所在位置的筆畫數是多少,比我們想要的數是多還是少,這裡,
> 我們又要數目前條目的筆畫。用拼音排序,基本上是一樣,只是用拼
> 音代替了數筆畫,而拼音是快很多了。這是從用戶角度,而從程序員

為什麼會快呢? 在我看來: 如果你的程序不提供檢索功能, 憑眼睛看, 兩者
應該沒什麼區別吧. 如果程序提供檢索, 輸入要檢索的以後, 快慢要看檢索
程序怎麼寫得了.

> 魚與熊掌,如何兼得?正如 saka 前面說過,我們可以利用不同
> 的 collate 環境來解決,如可以在使用拼音排序時用
> LC_COLLATE = zh_CN.GB2312,在筆畫排序時用 LC_COLLATE = iso10651.GB2312
> 既然 unicode 中漢字本身是筆畫排序,直接就用也沒
> 有什麼問題。啊,又多了一個 locale ,他們可能不接受。

hashao兄在說笑吧?

> 
> 鑒于目前沒有完整的拼音對照表,目前只能使用筆畫排序,我只是
> 提議對日後使用拼音排序加以考慮。因為中文化依靠的是國際化,
> 僅僅是純中文程序是不夠的。

"日後......加以考慮"?! 情況恐怕只會越來越懷. 現在有7000字無拼音, 等
SuperCJK出來大概會有50,000字沒拼音了. 我懷疑有些字連專家都不知道怎麼
念.

Regards,
Rigel

_________________________________________________________
Do You Yahoo!?
Get your free @yahoo.com address at http://mail.yahoo.com

-- 
| This message was re-posted from debian-chinese-gb@lists.debian.org
| and converted from gb2312 to big5 by an automatic gateway.



Reply to: