Thursday, December 20, 2007

做了一個有農曆的萬年曆

我之前做了一個 Google 小工具 (gadget),是一個結合國曆跟農曆的萬年曆,除了兩種曆法的日期對照外,也可以顯示農曆節日與節氣, 也有干支紀年以及生肖。既然做了這個 gadget,我就順勢把它移植到了 Mac OS X 上,成為一個 Dashboard widget,如果有人覺得用得上的話,可以在此下載。 (已做了一點修改,Mac OS X 10.4 與 10.5 皆適用)

它的用法是:

  • 點左箭頭可顯示上一個月,點右箭頭可顯示下一個月。
  • 點左右箭頭之間文字,可回到目前的月份。
  • 將滑鼠游標移到日期數字上,可顯示農曆日期、節日、與節氣。
  • 按鍵盤的上鍵或下鍵可顯示前一年與後一年,按左或右鍵則是顯示上一個月或下一個月,按 home 可回到目前的月份。

農曆日期與節氣的計算,我是採用林洵賢先生的程式,可說是相當的準確,在此對他表示感謝。不過照例還是得聲明一下,若這個 widget 裡面的資訊有任何錯誤,請以政府公布的為準。

如果你沒有 Mac,也可以試試我之前做的 Google 小工具,不過外觀不一樣,而且沒有鍵盤的控制方式,所以 Mac 版應該是好用一點。如果大家有什麼意見,不妨留言讓我知道。

本文同步刊登於符號工作站

Friday, November 23, 2007

Leopard 的倉頡輸入法

Leopard 上市將近一個月,我也用了大概兩個禮拜,對於 Leopard 的倉頡輸入,我目前觀察到以下的狀況:

  1. 在過去,第三代與第五代倉頡混在一起,在 Leopard 中,則似乎只能用第五代了。這對我這個熟悉第三代的人來說有點不習慣,不過我還願意適應。現在「黃」這個字只能用「廿中田金」打出,而不能用「廿一田金」打出了,但是很奇怪的,「橫」這個字除了可用「木廿中金」打出,卻也可以用「木廿一金」打出,算是挺莫名其妙的。既然要統一用第五代,就全部改成第五代,怎麼會還留著部份別的拆碼方式,顯然這部份是沒有做好的。
  2. 雖然改成第五代倉頡,不過很多重複碼的字還是可以加X在前面打出。例如「濱」與「演」的碼都是「水十一金」,在 Leopard 中用「水十一金」時選字的視窗會跳出讓人在「濱」與「演」之中選擇一個,若不選則是「濱」,但用「X水十一金」則可打出「演」。但是還是有些重複碼字的第二個字無法加「X」打出,例如「宋」與「未」的碼相同,但「X十木」打不出字來。所以,這部份作法還是跟以前一樣亂七八糟,根本不統一。
  3. 有一項改進是,在 Tiger 中遇到重複碼而跳出選字視窗時,有的字非要按數字鍵選字不可,有的字卻在打下一個字時就會自動選取第一個字,讓人無所適從。Leopard 中的倉頡則比較統一,目前我所碰到的重複碼,都可以在打下一字時自動選取第一個字。
  4. Mac 的倉頡可以打出一一些外字集裡才有的香港字、異體字、或簡體字,不過現在多了一個選項,可以將此功能關閉,這樣就只會打出 Big5 收錄的字,這是相當不錯的改進。不過如果在 Leopard 中開啟此功能,雖然是列出了外字,但卻沒有用符號標示出外字以警告使用者,這個在 Tiger 裡有的功能不知為何不見了。
  5. 在倉頡輸入法狀態下,過去按空白鍵打出的是半形的空白,但如今在 Leopard 中打出的變成全形的空白。雖然這樣跟其他符號比較一致,但是平常我們打全形空白的機會遠少於半形空白,現在必須切回英文或按大寫鍵才能打出半形空白,實在相當地不方便。
  6. 過去的倉頡打 ~ 會出現「符」字,並讓使用者按其他鍵來輸入符號。在 Leopard 中打 ~ 仍會出現「符」字,但根本無法輸入符號,不知道按 ~ 出現「符」的意義何在?而且按兩次 ~ 不能打出全形的「~」,卻出現「}」,也是相當莫名其妙。
  7. 這是我的感覺:Leopard 倉頡的速度似乎比 Tiger 還要遲鈍,常常打完一組碼後還要等一下,才會看到字出現。
  8. 「並」字在 Leopard 中要用「廿廿一」才能打出,而不是「廿廿金」。第三代與第五代倉頡中,「並」都是「廿廿金」,不太清楚「廿廿一」是從何而來。而且「碰」這個字在 Leopard 中仍是「一口廿廿金」而非「一口廿廿一」。又是一個莫名其妙的問題。

總體看來,Leopard 的倉頡是有些改進,但仍有不少問題。Leopard 的上市距 Tiger 足足兩年多,問題的改善卻不是那麼顯著,這是令人失望的。

本文同步刊登於符號工作站

Thursday, November 8, 2007

iPod touch 不懂藏文

iPod touch 的 Safari 上的藏文我近日也弄來了一部 iPod touch。雖然之前看過許多 iPod touch 的介紹,但親自操作才感覺到它的神奇。由於 iPod touch 可算是一部沒有手機通訊功能的 iPhone,所以藉著它我也可以想像 iPhone 的迷人之處。目前還有人在為 iPhone 與 iPod touch 的中文輸入法努力,而我倒是想試試藏文的顯示能力,所以用 iPod touch 內建的 Safari 瀏覽器打開含有藏文的網頁,結果藏文都變成方框而無法正常顯示。

如果 iPhone 或 iPod touch 的系統有完整 的 Unicode 支援,再加上它與 Mac OS X 類似的系統結構,那應該只要裝上適當的字體,就應該能顯示藏文了吧?抱著這種想法,我試著將一個藏文字體裝到 iPod touch 的 /Applications/Library/Fonts 目錄裡。當然,要能夠存取 iPod touch 裡的檔案,還是得「越獄」一下,然後安裝 BSD Subsystem 與 OpenSSH。安裝完成後我將 Unicode 藏文字體放進去,再重新開機,沒想到那些方框還是沒變成藏文。

後來我發現,在 Fonts 目錄下還有一個 Cache 目錄,打開一看,裡面竟然有 STHeiti.ttf 這樣的簡體中文字形,看來和 Mac OS X 裡的是一樣的,拿出來測試後,也發現裡面有藏文字形。這樣看來,iPod touch 也算是內建藏文字體了。所以,iPod touch 不能顯示藏文,似乎不是因為缺少字體,而是因為它本身就未能完全支援所有的語文。只是我不太懂的是,為何 STHeiti.ttf 只出現在 Cache 目錄之中,卻沒有直接出現在 Fonts 目錄之下。

看來要再努力一下,才能讓 iPod touch 顯示藏文了。倒是新的 Mac OS X 10.5 (Leopard),已經能在 Safari 中顯示正常的藏文了。希望 iPhone 與 iPod touch 的文字顯示和輸入法能再加油。

寫到這裡,也藉機談談 iPod touch 本身吧。雖然 iPod touch 比起任何其他 iPod 都要先進,有多重觸控介面、有偵測機體傾斜方向的 accelerometer(可做出這樣的應用),還可無線上網,但其他 iPod 上已經出現很久的筆記、歌詞顯示等簡單而基本的功能,竟然都未出現在 iPod touch 上。在 iPhone 上原來有記事本,但到了 iPod touch 上就被蘋果拿掉了,而且 iPod 原來的筆記功能可加入歌曲的連結,在看文字時按下連結,即可播放某首音樂或聲音檔,但即使是 iPhone 的記事本,似乎也沒有這樣的功能。至於在 iTunes 存好的歌詞無法顯示,也讓人有退步的感覺。還有人會抱怨的,就是 iPod touch 不像其他 iPod 一樣附有遊戲。不過 iPod touch 上真正的操控按鈕只有一個,不像其他 iPod 上有幾個操控按鍵和轉盤,也許 iPod 上的遊戲有很多還沒辦法直接移植到 iPod touch 上運作。總之, iPod touch 拿掉了一些原來 iPhone 具有的應用程式,有些 iPod 舊功能卻也沒出現,難免讓人覺得有所欠缺。

另外,其他的 iPod 都可當外接硬碟或儲存裝置使用,而 iPod touch 具有 8GB 或 16GB 空間,卻不能直接用來儲存檔案資料,也使它的效用打了折扣。當然 iPod touch 與 iPhone 的介面才推出不久,而且目前蘋果對於系統安全性似乎還有些顧慮。未來它顯然會繼續更新,而且等到明年二月蘋果開放 iPhone 原生軟體的開發,狀況應該會大不相同了。

本文同步刊登於符號工作站

Wednesday, October 10, 2007

星光發音學:ㄉㄊ篇



Mandarin t.
中文的t

English t。超級星光大道常見的發音法
英語的t

最近歌唱比賽節目大行其道 ,其中某個最受歡迎的節目,有個客座評審說到,有人在唱「天」這個字時有洋腔洋調的問題。

不知道她想說的是不是 t(或ㄉ、ㄊ)這類音的發音方式。不管是不是,我們都還是可以在這裡藉機討論一下 t 的問題。英語裡 t 的發音位置與台灣人所發的ㄉ、ㄊ的確稍有不同。大致上,這些音是舌尖音,發音時是把舌尖頂到門牙後方到其上方的牙齦之間,只是舌尖放上面一點還是下面一點,就造成了英語發音與台灣人發音之間的差異。英語的 t,舌尖頂住位置比較「上」或比較「後」,幾乎都在牙齦的地方,而台灣人的發音通常比較靠近牙齒,所以也比較下面一點。 (請參考右邊的示意圖,請注意舌尖位置, 畫得不好請見諒。XD)

現在的確很多人在唱中文歌時,都會把 t(ㄉ)與 th(ㄊ)用比較後的部位發音,在比賽節目中就有一大票,已經成了一種不可忽視的現象。他們也許真的是有意無意間學習了英語的腔調,不知道歌唱上的發音是否有一天也會影響口語的發音,如果這是這樣,那倒是個很有趣的事情。不過既然有人對這類問題提出批評了,我想歌手雖然不一定就得要改掉或不改掉這個腔調,但至少有了一個機會去思考發音方式的問題,進而讓自己表現得更好更自然。

本文同步刊登於符號工作站

Tuesday, August 14, 2007

大家都是一樣的「台」


(以上標誌為各公司或組織所有)


米芾《惠柑帖》。(國立故宮博物院藏)

我們平常都會在各種媒體上看到一些商標、標語、或是標準字之類的文字,有些標誌還是用書法寫成的,只要寫得好,都應該能讓人賞心悅目,並且發揮很好的識別功能。但一段時間以來有一個現象讓我相當納悶,那就是有相當多的標誌都採用了一個外形完全相同的「台」字。右方圖中的範例來自不相關的單位,但是在表現「台」字時,都用了同一個書法字形。事實上這個「台」出現在更多的地方,只是有些實在沒有能記錄下來。

這個「台」字似乎是好看又好用,但是當它不斷地重複出現在不同的地方時,雖然不能說是抄襲,但顯然也有濫用的問題了,這樣一來,它識別的功能以及要傳達的意念可能都要打些折扣。拿出我的《二南堂法帖》查了一下,原來這個字是出現在米芾的《惠柑帖》之中,不知米芾地下有知會有什麼感想。

為何大家都對這個字情有獨鍾呢?我猜除了英雄所見略同外,就應該是這些設計者採用了同樣或類似的的資源,或是同一個設計者因循舊作,用一個字形打發不同的客戶所致。在這個電腦的時代,方便的工具讓大家得以便宜行事,而資源的普及和大量複製,也似乎削弱了很多東西的獨特性。我自己當初在買了一套二南堂法帖後,就曾經想過,如果以後需要書法的地方,都可以用這樣的工具來輕鬆地集字,那麼不知道會對設計工業與文字藝術產生什麼影響?

看看這個「台」字,還有一些把不同書體集在一起的荒謬設計。也許我們的內涵也該和工具一起進步。

本文同步刊登於符號工作站

Wednesday, July 4, 2007

猜猜「王力巨集」是誰

最近看到這個一段時間之前的網頁,有一個地方頗讓人覺得納悶,就是裡面有好幾個「王力巨集」這樣的詞。不過想一想就知道這是指「王力宏」,至於怎麼會變成「王力巨集」,恐怕就有點有趣了。

由於對岸都將電腦上的「macro」這個詞翻成「宏」,而在台灣是翻成「巨集」,這個網頁大概進行了某種兩岸用詞的替換,結果就把「宏」這個字換成了「巨集」,這樣一來,這位歌手的名字也就被竄改了。

把「macro」翻成「宏」,就可以衍生出「鍵盤宏」、「鼠標宏」這樣的詞。「Macro = 宏」似乎是對岸常見的直譯法的範例之一(macroscopic = 宏觀的,所以 macro = 宏?),就我的語感來說,實在很難認同,而之所以難認同,我猜大概是以下四個方面的因素:

  1. 「宏」這個字的語意與電腦術語「macro」的原意有一些差距。
  2. 「宏」只有一個音節,與現代漢語常見新詞的雙音節有所不同。
  3. 「宏」與許多古代留下的單音節詞一樣,在現代漢語中已經不可獨立使用,而通常是其他雙音節詞的一部份,例如:「 很宏偉」這三個字沒問題,但「很宏」就不通了。
  4. 「宏」原來的詞性(或說 grammatical category)似乎較少當名詞用。例如「宏偉」、「宏願」的「宏」較像形容詞,而「宏揚」的「宏」應該是修飾動詞,所以比較像個副詞。

看來對岸的翻法,似乎常常不理會包括音節數、詞性、語境(上下文)等因素,這竟然跟機器翻譯頗有相似之處。

至於前面說到的網頁之所以把人名中的「宏」換成「巨集」,大概就是為了處理詞彙差異,而用程式自動替換的結果,不過奇怪的是只有後面的「宏」被取代,不知是怎麼回事。

如果「王力巨集」、「王巨集恩」真的是程式自動取代所造成的,那麼我們只好等待聰明的人類能讓電腦變得夠聰明了。

本文同步刊登於符號工作站

Sunday, June 3, 2007

人名拼音中的鼻音尾

台灣有很多人在講話時沒有完全分清楚注音裡的ㄣ與ㄥ這兩個音,尤其是弄不清ㄧㄣ (in) 跟ㄧㄥ (ing) 的分別。有些人會把ㄧㄣ跟ㄧㄥ一律發成ㄧㄣ,有些人會一律發成ㄧㄥ。有一些中文名字的羅馬拼音會把 n 與 ng 搞錯,不知道是不是這種現象的反映。像王建民在美國大聯盟的官方資料裡,姓名的拼音是 Chien-Ming Wang,但是「民」這個字的拼音顯然是 min 才對。

另外注音中聲母直接加ㄥ或ㄣ的組合也常被混淆,比較常見的應該是都念成聲母+ㄣ,例如很多人會把「成」念成 ㄔㄣˊ (chén)。不過一位人類學界前輩臧振華,他用的姓名拼音是 Tsang Cheng-hwa,這倒是把「振」 的 n 拼成了 ng。

另外有點匪夷所思的是導演李安的名字 Ang Lee,照理說「安」應是 an,拼成 ang 不知只是個不小心的錯誤或是有什麼典故。有些漢語的確會把ㄢ跟ㄤ兩者合併成一類,在台灣有時也會聽說有人不容易發好這類的音、或一時不「輪轉」而把其中一種念成另外一種,不過應該還沒有到普遍地完全不區分ㄢ與ㄤ的地步。

歌手王力宏的名字 Leehom 則是個更特別的例子,如果這名字的確是來自「力宏」兩字的發音的話,那原應以 ng 結尾的「宏」會變成以 m 結尾,實在另人想不透。

當然這些拼音只要是本人固定使用的形式,別人就得照樣引用,畢竟這是他們自己的名字,拼音上的對錯倒成其次,不過其中也許透露出了一些有趣的語言現象。

本文同步刊登於符號工作站

Tuesday, May 8, 2007

談成語(下)

前面我們以語言學上 idiom 概念來檢驗中文的成語,不過事實上語言學的 idiom 與中文裡所說的成語恐怕還是有些差異,畢竟一個是學術名詞,一個則是約定俗成的名詞。中文的「成語」有一個特別的地方是,它們幾乎都是由四個字組成的,成語典收錄的童話故事和電影名稱有一些卻不是四個字,那麼非四字的組合可以算成語嗎?

就語言學的角度來看,不同音節數(在中文即為字數)的 idiom 並沒有各自在語言法則上有不同的表現,也就是三個字、四個字、或五個字的分別並未形成不同的有意義的類別,所以音節數自然不會成為判斷 idiom 成立與否的準備了。如果用這個角度來看,許多非四字的用語是可以被納入成語之中的。

可是如前所述,中文裡所說的成語並不是一個具有精確學術定義的概念,所以情況也可能不太一樣。我們可以看看教育部的成語典如何處理這個問題。只要在成語典裡搜尋一下,就可以在搜尋結果中發現許多超過四個字的「成語」,例如「山不轉路轉」、「畫虎不成反類犬」等等,甚至也有三字的成語,例如「東道主」。只是一方面這些非四字的成語還是少數,另一方面,這些非四字成語似乎大多被放在附錄而非一般成語,所以四字成語的傾向應該還是存在於成語典的。

雖然如前所述,成語的字數在語言學上沒有意義,但是「成語就該是四個字」的想法也不一定就不值一探。漢語既然有豐富的單音節語位,也就有條件把成語組成四個字的單位,在四字成語佔大多數的情況下,就形成了一種不可忽略的模式。而且超過四個字的用語有可能因為表達比較豐富或較為白話,而讓人更注意到其字面本身的意義,其用法也就不是那麼「成語」了。

另外,想在這裡提一下的是成語典的另一個問題:整個系統的設計。成語典主編者說他們並未將那些有爭議的部份當成成語,而且也很快地把它們移到了「參考語料」之中。如果我們相信主編者的說法,也就是相信他們原本就認定「三隻小豬」是附錄性質而非真正的成語的話,那麼成語典所出的問題顯然就是在前端的設計上。在建構資料庫與網頁介面時,操刀的人可能便宜行事,使得成語與參考語料的呈現方式沒有分別,等到鬧出事情後主事者才想者亡羊補牢,卻已經不可收拾了。看看成語典混亂而不易使用的介面,就不難想像它設計上的問題會如何減損它內容的價值。

我想「三隻小豬」的收錄除了爭議那一面之外,應該還是有其正面意義的,它代表成語典忠實地反映與記錄了這個時代的語言,只是提供的方式應該是要再精緻一些了。

寫在最後:成語典把「楚門的世界」原名寫成 The Trueman Show,第二個詞對照該電影的官方原文 Truman 多了一個 e,恐怕還是完全按照原文來寫會比較好。

本文同步刊登於符號工作站

Saturday, April 7, 2007

Unihan Variant Dictionary 1.2.0

異體字查詢軟體 Unihan Variant Dictionary 在上次改版為 Universal Binary 版本後,在 Intel Mac 上出現了一些問題,現在我們已經把它改正,遇到問題的朋友可以下載新的 1.2.0 版

之前的 Universal 版本之所以在 Intel 機器上會出問題,是 PowerPC 與 Intel 處理器的位元排列順序不同所致。過去的 Mac OS X 在 PowerPC 上運作,採用的是 big-endian,但到了 Intel 處理器上,就變成 little-endian, 例如,一個號碼 0A0B 的字元,若是由 0A 與 0B 兩個位元組成,big-endian 的排列是 0A0B,little-endian 的排列卻是 0B0A。我們在 Unihan Variant Dictionary 1.2.0 中特別處理了這個問題,所以現在不論用哪個平台都可以查詢到正確的結果。

另外,對於 Unicode 碼五位數以上的字元,現在也做了比較好的處理。例如圖中的兩個「形」字 ,上面那個 Unicode 碼是 2F899 ,下面的是一般常見的 5F62 ,你看出不同在哪裡了嗎?

本文同步刊登於符號工作站

Saturday, March 31, 2007

談成語(中)

教育部長說,成語會使人「思想懶惰」、「一知半解」,「成語一旦脫離情境,就會沒有意義」,「如果成語故事大家不熟悉,寫出來的成語、用出來的典故,就和生活以及要表達的感情無關或很淡泊」。我們在此也針對相關的問題來討論討論。

關於「思想懶惰」這件事,有的慣用語似乎是有可能將事情過度簡化。例如有些人聽到小道消息,大部份情況下會選擇相信,而理由呢?常常就是五個字:「無風不起浪」。其實傳言只要未經證實,當然都有某種機率是假的,但一句「無風不起浪」似乎就讓真偽之辨的討論空間變得很小了。

可是如果說成語的典故對現代人都沒意義、運用成語就得了解典故,所以使用成語是不好的,就有些不太對勁的地方了。其實,一般人能使用或理解成語,並不以了解典故為必要條件。如上篇文章所說,成語是以兩個以上詞為一個單位而被直接賦予意義,所以就像許多的詞一樣,它作為一個語意承載單位,有一個約定俗成的意義,說話者可以直接將成語與其語意連結起來,不一定要經過背後的典故。這也就是為什麼說話者對於一個成語的典故完全不了解,卻仍然可以正確地運用與理解這個成語。有些成語的現代語意與典故中的意義正好相反,如果一定要熟悉典故才能運用成語,那麼這一類的成語是不會存在的。

許多一般的詞也不能由字面來推敲出語意,使用者也不知道字面上的語意是怎麼發展到今天這樣,而語音與語意間的關係也是任意的 (arbitrary),但這些都無礙該詞的使用,這與成語是類似的。例如,現代人仍然使用「撥」一詞來稱呼輸入電話號碼或打電話的動作 (例如「請稍後再撥」、「撥號網路」等等),卻很少想到或了解到「撥」的典故:它來自舊時代的轉盤式電話。現代人(尤其是完全沒用過轉盤式電話的卻仍使用這個用法的人)在說「請你撥一通電話」的時候,恐怕早已將「撥」與打電話方面的語意直接連結起來,而沒有經過典故。另外,現代人很少用矛和盾兩種兵器,但「矛盾」一詞仍然被廣為使用,大概也很少人會認為這個詞不能用在現代,這也是因為它的引申義才是重點,背後的典故是另外一回事。

不過這衍生出一個問題:既然典故未知,這些詞與成語的運用是怎麼被正確地學會呢?「語境」是一個原因。說話者學得一個詞或成語不一定是去了解其典故或語意解釋,而是藉著其出現的環境或上下文來學會。

我不太贊成任何成語脫離典故就會沒意義的說法,尤其許多成語早已成為現代口語的一部份,我們很難也沒必要刻意迴避。當然,有些較為冷僻的成語,並沒有完全進入現代語言,使用它們反而無助於溝通,所以,什麼成語值得用、或該用在何時何地,可能才是大家該傷腦筋的。

本文同步刊登於符號工作站

Tuesday, February 6, 2007

談成語(上)

最近教育部的成語典引起了一些話題,因為這個網站把「三隻小豬」等童話故事與電影的名稱也列為成語,而在教育部長「力挺」還親自造句之後,該網站召集人卻說並沒有把這些用語當作成語,並改為連結到附錄網頁。其實我之前在使用這個成語典時,就曾發現「傑克與魔豆」等特別的「成語」,當時除了笑了一下,還「拍照留念」。

對於「成語」,似乎很少人可以提出一個很精確的定義,不過在語言學中有一個類似的概念,叫做「idiom」。在句法學上,「詞」(word) 可以構成詞組 (phrase) 進而形成句子,而每個詞都有其語意或功能。至於 idiom 也和詞類似,可以是句子的元素,也是一個承載語意的單位,它特別之處在於它是由多個詞組成,但是它本身的語意,卻不直接等於組成它的那些詞的語意的組合。例如,「青梅竹馬」並不是指青梅與竹馬兩種物品,而是指從小在一起的同伴。所以,idiom 本身構成一個獨特的單位,而不止是一些相鄰出現的詞,它的語意是約定俗成的直接加在這個單位上。

另外 idiom 本身也可能有自己的詞性,例如「見義勇為」看起來是動詞,但很多人會同意「他這個人很見義勇為」這句話是通的,這裡的「見義勇為」已經不像動詞而比較像形容詞了。另外,許多 idiom 內部的用詞也不能自由替換,即使語意上合乎邏輯也不行,例如「緣木求魚」若說成「緣木求蝦」、「緣木求蛤」都可能難以讓聽者理解。而中文的「成語」大體上是有著這些特性的。

在此我們就試著藉用以上特性,來檢視一下那些童話與電影名稱適不適合稱為成語。以「七年之癢」為例,成語典所列例句如下:

王先生最近都很晚回家,該不會是患了七年之癢吧?

這裡的「七年之癢」當然不是指誰真的在癢,也不一定要剛好結婚七年才能用,它的用法也是固定的,並不是結婚N年就都會講成N年之癢,所以它的確可以是 idiom 或成語,大可列為一般成語而非附錄。照同樣的標準,「國王的新衣」、「麻雀變鳳凰」也的確形成了 idiom。

可是「三隻小豬」呢?讓我們看看成語典的例句:

我們要記取三隻小豬的教訓,今天既然要建橋,就要建最堅固的橋。

在這句話中,三隻小豬可以指涉該童話故事,或指涉故事中那三隻豬,不論是前者或後者,「三隻小豬」這四個字整體來看與個別來看都得到同樣的意義,它並沒有自成一個單位而被賦予另外的意義或用法 ,所以,它只是一般的名詞組 (noun phrase) 罷了。而教育部長的造句「不要像三隻小豬裡面的老大一樣,三隻小豬的故事要想一想啊」,也是一樣的情形,並非成語用法。成語典其他例句中的「灰故娘」、「綠野仙蹤」情況也類似。

這樣看來,成語典裡的那些童話與電影名稱,有一部份是夠格算作成語了,但仍有許多並沒有形成成語這樣的單位,或者說沒有 idiom 的特性,而其中甚至有的條目只有典故卻根本沒被例句引用(如「小木偶奇遇記」),所以我想把這部份列為參考語料、而不跟一般成語混淆的確是比較好的做法。

本文同步刊登於符號工作站