數發部捒臺灣主權AI語料庫 收在地文化資料
發布時間:
更新時間:
數發部今仔日發佈「臺灣主權AI訓練語料庫」,提供工程師使用,予AI閣較接近臺灣人的語言習慣。目前有超過200个政府機關投入,囥超過2千筆資料、有超過6億个詞元 (token),收的攏是有臺灣文化特色的資料集,內容包含語言、文化、教育、生物、地理環境等等,遮的資料親像AI教材,幫助AI模型閣較倚近臺灣社會的語言表達。(新聞標題、導言為台語文)
唐嘉良/編輯
