24H直播

國科會推資訊史料數位化 納AI語料庫訓練模型

發布時間: 更新時間:
區域安全情勢升溫的同時,科技領域的戰略布局也是關鍵。人工智慧發展迅速,如何捍衛台灣AI主權,國科會主委吳誠文說,未來希望編列科技預算,協助媒體將資訊史料數位化,放入台灣主權AI訓練語料庫進行模型訓練,協助各行業發展。

生成式AI深入生活,但大型語言模型訓練仰賴大型語料,立委陳培瑜指出,數據顯示,訓練語料近5成為英文,中文語料雖占5%,卻以簡體中文內容為大宗,她以ChatGPT詢問吳誠文是誰,得到這些內容。

民進黨立委陳培瑜表示,「ChatGPT跟我說他是數發部部長,然後我問他他會打棒球嗎,他說很抱歉,目前公開資料中,吳誠文並沒有以棒球選手,或是長期參與棒球活動聞名的紀錄。」

AI浪潮下,台灣面臨主權AI的挑戰,國科會主委、行政院政委吳誠文說,目前由數發部主導台灣主權AI訓練語料庫,國科會推動TAIDE模式,以具台灣主體性的文本為訓練素材,涵蓋政府及民間多元領域資料,未來希望編預算,協助媒體將已公開的資訊史料數位化。

國科會主委吳誠文指出,「媒體還是擁有其著作權,但是要捐給我們主權AI的這個資料庫,能夠做我們主權AI模型的訓練。」

吳誠文指出,目前南科已建置一個算力中心,第一階段建置5.1MW,第2階段需看後續預算,不過國民黨立委葛如鈞問及,美國建算力工廠的單位是多少。

國民黨立委葛如鈞詢問,「GW是MW的幾倍?」

國科會主委吳誠文說明,「這個我大一的計算機概論我在教學生,但講那沒意義,台灣不可能做那麼大的。」

葛如鈞追問:「多幾倍嘛?這個科學的問題我們在這裡不能回答嗎?」

吳誠文答:「1024倍。」

吳誠文表示,美國市場那麼大,國科會建的是為了學研,但會引起民間的投資。而對日前有外媒指出,台灣若面臨缺水及能源供應壓力,恐衝擊全球AI基礎設施運作,吳誠文會前受訪表示,水的部分未來兩個月應該算穩定,到5月底以前,能源供應也沒問題。

您的參與,
讓公共服務更完整!
閱讀、按讚,就能客製您的專屬推薦新聞
本網站使用 Cookie 技術提升體驗,詳見服務條款。繼續瀏覽即代表同意上述規範。