語言模型CKIP答我國籍為中國 中研院下架澄清「導入明清研究」
發布時間:
更新時間:
中研院在日前推出類似ChatGPT的繁體中文語言模型CKIP,結果被網友實測後發現,使用中國所建置的資料庫,9日緊急下架。中研院長廖俊智今(12)日到立法院備詢時表示,是研究員求快心切,想用新技術導入到明清時期的相關研究,並非最原始的研究本意,將成立生成式AI的風險研究小組,提供研究人員指引。
點開中研院推出的繁體中文大型語言模型CKIP(CKIP-Llama-2-7b),範例中顯示,能了解22K是什麼,還能寫出各種文案。
但網友實測詢問國家、國花和國歌,全部都是中國資訊,等於模型使用到中國資料庫,引發熱議。
該語言模型9日緊急下架,中研院長廖俊智12日到立院備詢,朝野立委同樣關切議題。
國民黨立委萬美玲質疑,「我國最高領導人,它回答是習近平這樣子的狀況、回答我的國籍是中國,我覺得這個都是非常離譜的狀況。」
中研院長廖俊智回應,「一名研究人員因為求快心切,把尚未完全測試完畢的軟體,以開源的精神上網、請大家一同測試,但我們在這件事情當中,也學到很多正面的教訓。」
中研院說明,是研究員執行2項計畫,想把新的生成式AI帶進明清的歷史相關研究,又求快心切所導致,但開發AI語言模型並非研究員本意,也沒有想到資料庫背後的價值觀也被納入,才犯下疏忽。
民進黨立委張廖萬堅認為,「要成立生成式AI風險的研究小組,徵求相關人,我們也可以找一些人自己組成。」
無黨籍立委黃國書詢問,「未來在推動這個Chat GPT的研究,我們還會持續使用中國的資料集嗎?」
中研院長廖俊智表示,「我們會自己開發,配合國科會的TAIDE計畫。」
事件發生後,中研院規劃成立「生成式AI風險研究小組」,要深入了解AI對社會的衝擊,並提供研究人員相關指引。
洪詩宸/編輯