語言模型CKIP答我國籍為中國中研院下架澄清「導入明清研究」

發布時間：2023/10/12 12:31 更新時間：2023/10/12 20:36

曹晏郡邱福財／台北報導

中研院在日前推出類似ChatGPT的繁體中文語言模型CKIP，結果被網友實測後發現，使用中國所建置的資料庫，9日緊急下架。中研院長廖俊智今（12）日到立法院備詢時表示，是研究員求快心切，想用新技術導入到明清時期的相關研究，並非最原始的研究本意，將成立生成式AI的風險研究小組，提供研究人員指引。

點開中研院推出的繁體中文大型語言模型CKIP（CKIP-Llama-2-7b），範例中顯示，能了解22K是什麼，還能寫出各種文案。

但網友實測詢問國家、國花和國歌，全部都是中國資訊，等於模型使用到中國資料庫，引發熱議。

該語言模型9日緊急下架，中研院長廖俊智12日到立院備詢，朝野立委同樣關切議題。

國民黨立委萬美玲質疑，「我國最高領導人，它回答是習近平這樣子的狀況、回答我的國籍是中國，我覺得這個都是非常離譜的狀況。」

中研院長廖俊智回應，「一名研究人員因為求快心切，把尚未完全測試完畢的軟體，以開源的精神上網、請大家一同測試，但我們在這件事情當中，也學到很多正面的教訓。」

中研院說明，是研究員執行2項計畫，想把新的生成式AI帶進明清的歷史相關研究，又求快心切所導致，但開發AI語言模型並非研究員本意，也沒有想到資料庫背後的價值觀也被納入，才犯下疏忽。

民進黨立委張廖萬堅認為，「要成立生成式AI風險的研究小組，徵求相關人，我們也可以找一些人自己組成。」

無黨籍立委黃國書詢問，「未來在推動這個Chat GPT的研究，我們還會持續使用中國的資料集嗎？」

中研院長廖俊智表示，「我們會自己開發，配合國科會的TAIDE計畫。」

事件發生後，中研院規劃成立「生成式AI風險研究小組」，要深入了解AI對社會的衝擊，並提供研究人員相關指引。

洪詩宸/編輯

語言模型CKIP答我國籍為中國 中研院下架澄清「導入明清研究」