Saturday, April 7, 2007

Unihan Variant Dictionary 1.2.0

異體字查詢軟體 Unihan Variant Dictionary 在上次改版為 Universal Binary 版本後,在 Intel Mac 上出現了一些問題,現在我們已經把它改正,遇到問題的朋友可以下載新的 1.2.0 版

之前的 Universal 版本之所以在 Intel 機器上會出問題,是 PowerPC 與 Intel 處理器的位元排列順序不同所致。過去的 Mac OS X 在 PowerPC 上運作,採用的是 big-endian,但到了 Intel 處理器上,就變成 little-endian, 例如,一個號碼 0A0B 的字元,若是由 0A 與 0B 兩個位元組成,big-endian 的排列是 0A0B,little-endian 的排列卻是 0B0A。我們在 Unihan Variant Dictionary 1.2.0 中特別處理了這個問題,所以現在不論用哪個平台都可以查詢到正確的結果。

另外,對於 Unicode 碼五位數以上的字元,現在也做了比較好的處理。例如圖中的兩個「形」字 ,上面那個 Unicode 碼是 2F899 ,下面的是一般常見的 5F62 ,你看出不同在哪裡了嗎?

本文同步刊登於符號工作站