標籤 漢語多功能字庫 下的所有文章

《〈粵語審音配詞字庫〉審音原則和配詞音與實際讀音的差異》

《粵語審音配詞字庫》(下簡稱《字庫》)是由香港中文大學人文電算研究中心開發的粵音查詢服務,自2003年投入服務,使用者不計其數。

拙作《解.救.正讀》討論了近年由學者提倡、傳統推波助瀾下,香港人所面對的粵讀問題。不過,對於《字庫》這個大眾日常查證字音的工具,書中幾乎沒有觸及。這主要是因為:

  • 拙作集中討論「電視台正音」和「何文匯正讀」千絲萬縷的關係,不欲岔得太遠;
  • 大家看罷本書,再比較《字庫》提供的讀音,對這個網站提供的讀音跟現實的差距,應該心中有數;
  • 《粵庫》只是提供四書的讀音作參考,算是「二手」而非「一手」資料。就算要探討,一般都會研究其源頭——即四本工具書——所提供的讀音,而不是引用者。(我懷疑,這也是鮮有學術文章探討《粵庫》取音的原因。)

不過,這個網站肯定影響了不少人對使用字音的判斷。更大的問題是,不少人似乎誤解了網站所提供讀音和一些術語的用意。我就不止一次在發表有關字音的評論時,被一些人拿《粵庫》的「配詞音」批評我的說法錯誤(這情況甚至會在我已經舉出大量字典作憑證時發生)。因此,數年前我已經有寫文章探討《粵庫》字音的想法,甚至已經從《粵庫》網站蒐集讀音資料。但因生性疏懶,私事羈纏,還有種種原因,寫文一事,最後還是束之高閣。

至2015年,《香港經濟日報》旗下的TOPick新聞網站刊登文章,將《粵庫》的「異讀字與否」當成「錯讀與否」來「教導」大眾「正音」。及2016年8月,又有TVB報幕員羅山將「朽」改讀『柚jau2』。種種跡象顯示是《粵庫》影響使致。這令我又燃起寫文章探討《粵庫》注音的意念。這一年多時間,斷斷續續,終於完成這篇《〈粵語審音配詞字庫〉審音原則和配詞音與實際讀音的差異》。可以說,TOPick兩篇「離晒譜」的文章和羅山「離晒譜」的改讀,促成了本文的誕生。

拙文一則嘗試分析《粵庫》的審音取態,二則列舉「配詞音」跟日常讀音的差距,供使用者參考。以下是一些關於此文的題外話:

  • 本想以《解.救.正讀》「附錄」形式,仿照原書格式排版,但因字數和製表空間等掣肘,最後還是決定以獨立篇章發表。
  • 2014年,《粵語審音配詞字庫》的後繼者《漢語多功能字庫》公佈,本文仍在龜速寫作中,幾乎未面世已過時。好在兩個網站的收音差異不大。本文仍以《粵庫》為研究對象,但在附錄會列舉兩者相異之處。
  • 冠以「初稿」之名,主要是因為第四節的內容主要經電腦分析得來。雖然在寫作其他章節而用到這一節的資料時,會對再檢查一次引用資料的準確性,但因時間所限,無法對這些資料作一次詳細覆檢(否則以我的速度,明年也未必能寫完本文)。當然,既然選擇發表,自是相信當中假使有錯,也屬小錯而不影響全文結論。這個「初稿」就當我在「戴頭盔」吧。

《〈粵語審音配詞字庫〉審音原則和配詞音與實際讀音的差異》全文以補充參考形式放在《解.救.正讀》網頁讀者也可按此直接下載。歡迎高明賜正。