Re: 關¤_中文locale中º~字的排序

To: debian-chinese-big5@lists.debian.org
Subject: Re: 關¤_中文locale中º~字的排序
From: rigel <rigel863@yahoo.com>
Date: Wed, 13 Sep 2000 02:53:45 -0400
Message-id: <[🔎] 20000913025345.A1134@yahoo.com>
Mail-followup-to: debian-chinese-gb@lists.debian.org
Reply-to: rigel <rigel863@yahoo.com>
In-reply-to: <16769849828.20000913064500@china.com>; from hashao@china.com on Wed, Sep 13, 2000 at 06:45:00AM +0800
References: <[🔎] 20000911023132.A2847@yahoo.com> <OE39DrFjO0ybvQoG9Bv0000169b@hotmail.com> <[🔎] 20000912005159.B796@yahoo.com> <16769849828.20000913064500@china.com>

Hi hashao, nice to talk you again.
On Wed, Sep 13, 2000 at 06:45:00AM +0800, hashao wrote:
> 
> 我覺得這一點正是我們之間的分歧所在，我不知道我的觀點時否正確。我在
> 這裡說一下我的看法。
> 
> 我以為中文 collate 實際上是與中文程序無關的，它並不是給中文程序員來
> 用的，它是給不懂中文的程序員，或者說不懂外文的程序員用來寫國際化
> 程序來用的。中文程序員要想寫中文排序，大可以用一個拼音表，或者筆畫
> 表來做直接排序，根本不用 collation ，那麼我們豈不是根本不需要在 locale
> 裡有這麼一項了？因為程序員根本不用，同理， locale 中其他部分也並不
> 需要， CTYPE, MESSAGE 等等都可以直接嵌入程序而不依靠任何 locale or
> XLOCALE ，一樣可以寫成符合中文習慣的程序。
> 

locale的各個catogery被認為是反映文化習慣的基本方面. 但具體到各語言每個
catogery的重要性不盡相同. Collation 是 alphabetical語言特有的東西, 在那
些語言裡不遵尋某種特定的規則, 就是錯. 作為ideographical語言漢字本沒有內
在的順序, 從這個意義上來講, collation對中文地確可有可無.

似乎您設想的情形是有程序簡單的用strcoll將漢字排序再輸出. 您認為以拼音為序
輸出才符合中文習慣. 未必吧. 我覺得在這種簡單的情況下怎麼排序都無所謂. 說
實話, 我在日常生活中見過以姓氏筆畫排序的, 還真沒見過哪怕一次以拼音排序的.

如果這就是您牆(damn it, chinpu3裡沒那個字!)調使用拼音排序的原因, 恕我不敢苟同.

當我請教大家拼音排序是否有助于中文程序, 我心中想的是使用與拼音有關的輸入法
的中文輸入程序, 因為我個人覺得這是唯一拼音排序有可能有幫住的地方.

> 空口無憑，總是要個例子來說明拼音排序的問題。譬如我們使用的電郵
> 軟件，在目錄中的排序，如果以 subject 來進行，譬如在 mutt 下，
> 設定 LC_COLLATE = zh_CN.GB2312 ，如果使用部首筆畫排序，則需要
> 數筆畫，然後再從部首中判斷我們要找的條目。而程序不會告訴我們
> 目前所在位置的筆畫數是多少，比我們想要的數是多還是少，這裡，
> 我們又要數目前條目的筆畫。用拼音排序，基本上是一樣，只是用拼
> 音代替了數筆畫，而拼音是快很多了。這是從用戶角度，而從程序員

為什麼會快呢? 在我看來: 如果你的程序不提供檢索功能, 憑眼睛看, 兩者
應該沒什麼區別吧. 如果程序提供檢索, 輸入要檢索的以後, 快慢要看檢索
程序怎麼寫得了.

> 魚與熊掌，如何兼得？正如 saka 前面說過，我們可以利用不同
> 的 collate 環境來解決，如可以在使用拼音排序時用
> LC_COLLATE = zh_CN.GB2312，在筆畫排序時用 LC_COLLATE = iso10651.GB2312
> 既然 unicode 中漢字本身是筆畫排序，直接就用也沒
> 有什麼問題。啊，又多了一個 locale ，他們可能不接受。

hashao兄在說笑吧?

> 
> 鑒于目前沒有完整的拼音對照表，目前只能使用筆畫排序，我只是
> 提議對日後使用拼音排序加以考慮。因為中文化依靠的是國際化，
> 僅僅是純中文程序是不夠的。

"日後......加以考慮"?! 情況恐怕只會越來越懷. 現在有7000字無拼音, 等
SuperCJK出來大概會有50,000字沒拼音了. 我懷疑有些字連專家都不知道怎麼
念.

Regards,
Rigel

_________________________________________________________
Do You Yahoo!?
Get your free @yahoo.com address at http://mail.yahoo.com

-- 
| This message was re-posted from debian-chinese-gb@lists.debian.org
| and converted from gb2312 to big5 by an automatic gateway.

Reply to:

Follow-Ups:
- Re: 關¤_中文locale中º~字的排序
  - From: Thomas Chan <thomas@atlas.datexx.com>

References:
- 關¤_中文locale中º~字的排序
  - From: rigel <rigel863@yahoo.com>
- Re: 關¤_中文locale中º~字的排序
  - From: rigel <rigel863@yahoo.com>

Prev by Date: Re: 關¤_中文locale中º~字的排序
Next by Date: Re: [Draft] Writing i18n apps with glibc 2.2
Previous by thread: Re: 關¤_中文locale中º~字的排序
Next by thread: Re: 關¤_中文locale中º~字的排序
Index(es):
- Date
- Thread