臺海網(wǎng)3月7日訊 據(jù)廈門廣電網(wǎng)報道 在語音識別領(lǐng)域,方言語音識別一直是需要解決的難題。近日,廈門大學智能語音團隊就成功研發(fā)了閩南方言人工智能語音系統(tǒng),只要對著系統(tǒng)說出閩南話,系統(tǒng)就能自動翻譯成中文文字。未來,這個系統(tǒng)將被應(yīng)用到更多領(lǐng)域。
按下錄音鍵,說出閩南話,閩南方言人工智能語音系統(tǒng)就能很快翻譯出中文。這個系統(tǒng)由廈門大學許彬彬等老師帶領(lǐng)的科研團隊共同研發(fā),目前已有微信小程序及APP等軟件工具可以使用。為了讓系統(tǒng)里的閩南方言數(shù)據(jù)盡可能全面,團隊整理收錄了大量語音資料,最終囊括了多地閩南方言口音,詞匯量超過600萬個。
廈門大學教師 許彬彬:覆蓋廈門漳州泉州甚至潮汕地區(qū),還有臺灣、臺北臺南地區(qū)、宜蘭、彰化這些地方,包括海外部分,屬于閩南話分布區(qū)域,像菲律賓馬尼拉,馬來西亞檳城、馬六甲、新加坡、印尼巴彥縣,也有采錄一些,所以我們盡可能覆蓋范圍廣一點,各種口音各種詞匯。
盡管收錄了閩南話的多種口音,但閩南話中存在大量多音字,也有著復雜的文讀、白讀現(xiàn)象,因此許彬彬的團隊不斷更新技術(shù),在識別上采取了發(fā)音詞典標準,經(jīng)過多個階段的內(nèi)部測試及完善,目前系統(tǒng)的準確率已經(jīng)達到80%以上。而隨著系統(tǒng)的逐漸成熟,團隊目前也將軟件開放免費試用,他們希望通過這個系統(tǒng),進一步擴大人工智能領(lǐng)域的方言應(yīng)用范圍,促進閩南方言與文化的傳播。
廈門大學教師 許彬彬:應(yīng)用到一些學習軟件,購買機票,購買火車票,給阿公阿嬤,不會說普通話的,有一些軟件可以幫助他們識別,最終是達到人機對話,今后AI程序加入方言,閩南話可以先作為一個試點吧。
