24H直播

文件辨識系統 輕鬆檢索中文資料

發布時間: 更新時間:
電子公文已經推行了一段時間,不過將文件數位化一直是許多行政人員的頭痛問題,中央研究院資訊所自行研發的一套文件辨識和檢索系統,只要把文件掃描進電腦,就可全自動處理每一個步驟,而且文字辨識的準確性高達百分之九十九。 電子公文並不稀奇,但是你收到的電子公文製作過程,一定沒有像中研院資訊所使用的這套系統這麼的聰明有智慧。 我們挑選難度較高的泛黃舊報紙來進行數位化的示範,數位化的過程不會超過三十秒。 掃描器只負責提供原始不失真的影像,接下來的所有步驟就交給聰明的電腦為您服務。電腦會將文件的灰階影像擷取出來,自動將文件轉換為黑白二色的影像,像這種因為紙張太薄,掃描後呈現多重的影像,或是模糊、白點等雜訊的影像問題,就能立即獲得解決。 特殊設計的排版分析功能,幫你解決了傾斜校正、圖文分離及去除框線等工作,文件經過分析處理後,就以文字檔方式儲存,您馬上就可以使用關鍵字檢索來調閱你所需要的資料。 中研院資訊所花了將近六年的時間,依照不同字體、不同的字形,逐字的建立這個系統資料庫,影像處理和文字分析、檢索等獨創的技術,讓這套系統在操作上可以相當的人性化。 目前除了中研院資訊所外,行政院、衛生署等機關也採用了這套系統來發送公文和檢索資料,而這套系統應用在影視字幕的辨識和檢索也已經開發成功,古籍和傳真文件的應用是接下來的研究重點。 中研院資訊所成功的然破了中文字型的複雜難度,克服了辨識內容品質的好壞,讓這套系統可以輕鬆被使用,也讓電腦變的更有智慧。公視新聞陳姝君馬台興採訪報導。
您的參與,
讓公共服務更完整!
閱讀、按讚,就能客製您的專屬推薦新聞
本網站使用 Cookie 技術提升體驗,詳見服務條款。繼續瀏覽即代表同意上述規範。