科技進步 聽障者可透過APP即時溝通

聽障者不一定都會手語,有些人是靠文字與讀唇和外界溝通。隨著科技的進步,除了近年來政府開始提供聽打員的服務之外,也有像雅婷逐字稿這樣的APP,協助聽障朋友的日常溝通。APP的速度快,聽打的意思比較精準,有沒有可能截長補短,讓服務更好?

「雅婷逐字稿」是台灣人工智慧實驗室開發的一個工具,裡面所有的語料都是用我們台灣當地的語料,所以它會最聽得懂台灣人講話的方式。

用台灣人自己開發的APP,將語音轉換成文字,不僅可以聽懂國語和台灣國語,中英文夾雜也OK,更在今年六月首度前進兩廳院為觀眾服務。

台灣人工智慧實驗室執行長杜奕瑾表示:「我們在兩廳院來講的話,我們是以general (一般) 領域的雅婷的資料,再加上兩廳院特有領域的資料,去做訓練出來的。我們會需要接觸到這個領域的比如說文章、過去的採訪。過去如果有些特殊的發音可能就是這個 Acoustic Model (聲音模型) 要去做調整,過去的採訪其實就是我們語音辨識的 Language Model (語言模型) 就要做調整。」

語音辨識的速度快,而且工作一整天都不會累,聽障者在日常生活中只要拿出手機、點開APP隨時都可以使用。聽障者林易佐表示:「讓我知道、了解大家在討論什麼事,我自己才不會說被邊緣化。」

不過這樣的APP還是有限制。只要收音不好的時候,辨識度馬上差很多。

近年來,聽障者新興的服務聽打員開始在重要場合擔任聽障者的耳朵,提供快速正確的訊息。比如 skype 的連線聲音,可以馬上透過括弧註記,讓聽障者能隨時掌握現場情況。聽障者謝素分表示:「聽打員他在打字的時候,他會把某某某、誰講──比如說有時候我去立法院,很多人都起來發問,我也不知道是誰在講、誰在講,聽打就會把某某某打出來。」

要提供有溫度的服務,聽打員的速度雖然比不上AI語音辨識系統,不過文字是經過去蕪存菁的。聽障人協會聽打方案督導解健彬表示:「每次配合的不管是社政或勞政,我們都要求每分鐘80-90個字以上。一般的演講,甚至總統就職這種,都會要求每分鐘144-160個字。所以可想而知,聽打員速度是一半都不到。所以我們在培訓聽打員的時候,快,絕對是主要的條件之一;但是次要的條件是在於你有沒有抓重點的能力。」

聽打員的理解力高,會整理出容易閱讀的文字;「雅婷逐字稿」則是速度快,隨時可以使用,各有優缺點。聽障者林易佐表示:「『雅婷』比較適合我自己私人的領域,看醫生,或是在家裡看直播,不然就是辦公場合私下的聊天。那聽打就是上課、講習,或是重大場合的活動。」

解健彬說:「未來因為手機APP,它的持久性高、它的辨別速度快,因為人手再怎麼快不會比電腦快,當它快速把訊息轉譯出來的時候,聽打員做第二線的工作,把不要的訊息刪掉,濃縮正確的訊息,然後在最短的時間內提供給使用者。」
 
杜奕瑾表示:「這是做得到的。但是就是說,為什麼會用『雅婷』?會有一個主要的原因就是,它可以即時的顯示字幕。有時候你人去配合的話,可能顯示字幕就會延遲。」

如何結合AI的速度與人腦的判斷力?未來人機是否有機會合作?令人期待。

相關新聞