工研院宣布打造台灣首座針對語言模型評測的AI測試實驗室。工研院提供
隨著生成式AI應用範圍擴大,接踵而來的資安、準確性等議題,成為學界、產業關注重點。為確保AI朝更安全的方向發展,提升大家對AI的信賴度,在數發部數位產業署支持下,工研院今日(10/29)宣布打造台灣首座AI測試實驗室,確保產業客戶的語言模型能安全可靠的在各領域穩定運行。
語言模型是自然語言處理(Natural Language Processing;NLP)不可或缺的關鍵,也是AI人工智慧理解文本、生成內容、語音辨識、情感分析等重要依據,經由大規模文本學習來掌握語法、語意、上下文關聯性等語言特徵,進而產生類似人類的自然語言。然而,
模型也可能因為數據偏差或失真,導致產生錯誤或不當資訊,甚至在處理敏感數據時更有資安風險存在。因此,儘管生成式AI當紅,但語言模型的開發和部署還是得小心謹慎,以確保輸出結果準確、穩定且可靠。
在數發部數位產業署支持下,工研院成立台灣首座AI測試實驗室,參考國際可信賴AI的相關框架及標準,透過AI產品與系統評測中心(Artificial Intelligence Evaluation Center;AIEC)專家以及技術委員會
開發可信任語言模型評測工具,提供包括準確性、公平性、可靠性、隱私及資安等自動化語言模型測試方案,協助國內廠商評估及改善語言模型,以確保語言模型及AI應用能在不同場景下保持穩定及可靠,並滿足企業和使用者需求。
工研院量測技術發展中心執行長藍玉屏表示,隨著生成式AI滲透到各個領域,對AI模型進行可信任性的測試與評估至關重要,因此工研院打造針對語言模型提供評測工具開發和導入的AI測試實驗室,透過參考國際以及國內專家審議的測試題庫,來評估生成內容的可信任性,促進企業在應用AI技術時更具信心。
藍玉屏進一步指出,未來隨著AI應用更進一步拓展,工研院將持續加強對AI技術的測試和把關,並探索新興技術應用的測試與評估,確保台灣在全球AI技術競爭中的發展。此外,為了強化國際合作,工研院也同時與法國國家計量院(LNE)簽署合作協議,針對AI進行國際合作與技術交流,助力台灣AI評測技術接軌國際。