快訊

    扯!中研院大型語言模型用中國資料集 問AI最高領導人竟答習近平

    2023-10-09 20:01 / 作者 政治中心
    中央研究院。廖瑞祥攝
    中研院前天宣布自製的繁中大型語言模型登場,被爆使用的資料集,是以中國為主的簡體中文資料、再另外簡轉繁,今天中午下架。立委范雲今天舉例問最高領導人是誰,答案竟然是習近平,她直言這已經是資安問題,是認知戰的議題,要求中研院立刻檢討。

    立委范雲今天(10/9)晚間於臉書發文表示,中研院前天才宣布自製的繁中大型語言模型登場,今天中午就下架了。因為被發現使用的資料集,是以中國為主的簡體中文資料、再另外簡轉繁。

    范雲舉例,請它舉例「我國代表性法律」,它回答:「中華人民共和國法典、中華人民共和國憲法」等中國法律,還有其他回答例如:台灣是中國的一部分、國慶是10月1日等,讓她怒轟「實在太離譜,令人憤怒」,這已經是資安問題,是認知戰的議題,出現在最高、理應最嚴謹的學術機構,真的不能接受,她立刻要求中研院盡速出面說明,嚴格檢討!

    范雲進一步說明,中研院CKIP Lab中文詞知識庫小組,最新開源釋出大型語言模型CKIP-Llama-2-7b,並提供學術和商用,可運用在文案生成、文學創作、問答系統、客服系統、語言翻譯、文字編修、華語教學等;CKIP-Llama-2-7b使用了2個「簡轉繁」後的資料,包括COIG-PC資料集、dolly-15k資料集,前者是由中國AI研究單位為首,包括:北京人工智慧學院、北京大學、香港科技大學等;後者則是以簡中為主的知識問答對話資料集。

    范雲質疑,台灣想做自己的大型語言模型,為什麼會變成現在這般四不像的樣子?反而出現各種錯誤的、統戰的中共宣傳內容?出如此明顯錯誤的理由是什麼?是預算不足?是資料來源不足?還是什麼?但作為台灣最重要的研究智庫,中研院,怎能如此便宜行事?

    范雲指出,更重要的是,她會要求台灣能夠有一個我們自己的繁體中文大型語言模型,因為這是AI時代,厚植國力的必要戰備武器!

    政治中心 收藏文章

    本網站使用Cookie以便為您提供更優質的使用體驗,若您點擊下方“同意”或繼續瀏覽本網站,即表示您同意我們的Cookie政策,欲瞭解更多資訊請見