Sunday, September 24, 2006

Leopard 的語音合成

2001 年的蘋果 Speech 網頁。

其實我已經嫌 Mac OS X 的語音合成功能很久了。大家若是看過蘋果創辦人之一 Steve Jobs 在 1984 年發表第一部 Macintosh 的影片,就知道那時的 Mac 已經有語音合成的功能了,而且 Jobs 似乎還為了那部小 Mac 一段感人肺腑的話而熱淚盈眶,就像第一次聽到兒子叫爸爸一樣。不過隨著時代的演進,Mac 的語音合成似乎沒多大進步,雖然後來是多了幾個較高品質的語音可選擇,但改進仍很有限。甚至自從進入 Mac OS X 時代後,原來的中文與西班牙文發音功能也無疾而終,我們也只能對「小趙」寄予無限的懷念。

我曾經介紹過一個在網上提供互動式動畫和語音的服務 SitePal,那時覺得這樣的服務都能有相當自然的發音,顯然 Mac OS X 也該加把勁了。終於在今年的全球開發者會議 (WWDC) 上, 蘋果展示了新的語音合成技術,它使用的「Alex」語音可以發出相當接近人聲的英語發音。雖然現在我們仍無法有實際操作的機會,但從現場的展示以及官方網站的範例來看,它的表現的確有很大的進步。在展示時 Steve Jobs 還秀了一段超快速的朗讀,效果也相當不錯。而且根據網頁上所述,蘋果的語音合成支援雙位元的語文,所以有中文與日文發音的能力。目前看不出 Mac OS X 本身是否會直接內建中文語音、還是只是留下空間給外界開發,不過這樣的發展還是給我們很大的期待。

我自己在使用即時通訊軟體 Proteus 時,有時會設定成讓它在有人上線時自動用語音報上名來,這樣就算沒有看到電腦螢幕,也知道是什麼人上線。只是由於現在系統的語音只支援英文,所以遇到以中文為使用者名稱的人就無用武之地了。從蘋果公布的內容看來,未來 iChat 可以自動朗讀對方送來訊息,若是也有上線類似 Proteus 的上線通知,再加上中文支援,那就相當實用了(至少對某些人來說)。

更好的 text-to-speech 結合到 Mac OS X 這個豐富的作業系統後,相信有很多有趣的應用方式,也能減少很多人的障礙,未來的發展如何,就讓我們拭目以待吧。

本文同步刊登於符號工作站