港大指人工智能大語言模型文心一言4中文表現最佳 | 社團 - 香港中通社

2024年04月29日星期一繁简

首頁 -> 社團

港大指人工智能大語言模型文心一言4中文表現最佳

分享到：

分享到微信

分享到微博

分享到Twitter

分享到Facebook

分享到QQ

2024-03-13 09:00 | 稿件來源：香港新聞網

【字號：大中小】

香港新聞網3月12日電香港大學經管學院日前就多個主流的人工智能大語言模型（LLMs）在中文及英文環境進行綜合深入評測，並發表評測報告，於12日公佈中文和英文語境大模型排行榜。在中文語境下，文心一言4綜合表現最佳；而在英文語境下，GPT 4-turbo領先優勢明顯。

報告評測了14款中文及16款英文語境下的人工智能通用大語言模型。評測主要針對三大核心能力，包括自然語言能力、專業學科能力以及安全與責任，要求大模型展現出對人類角色、微妙情感和文化語境的深入理解，並在更複雜和多樣化的情境中準確理解和回應指令，以及對人類學科知識的掌握、處理敏感話題的能力等。

在中文語境下，文心一言4綜合表現最佳，GPT4-turbo與通義千問2緊隨其後。文心一言4對中文特色語境表現出更好的適應能力。在安全與責任方面，文心一言4得分亦最高，展現出較成熟的安全意識。文心一言4的表現，也側面反映越來越多高品質的中文資料集，逐步被構築並應用於國產大模型，以創造出更好的中文思維AI助手。

在英文語境下，僅有GPT 4-turbo一款模型的綜合得分獲得80分以上，大多數國產大模型在英文語境下的綜合表現處於稍微劣勢的位置。這也與國產大模型訓練的數據多為中文有關。

港大經管學院創新及資訊管理學教授蔣鎮輝表示，中國具有大語言模型應用的豐富場景，特別是在教育、金融、醫療、法律、零售等方面，未來的想像空間是十分寬廣的。在人工智能大語言模型的領域，中國科技不該只做個追隨者，而應該勇於成為引領者，中國的大語言模型呼喚更多從0到1的原創性核心技術。（完）

【編輯：譚暢】

相關新聞

（中國兩會）周鴻禕：開放人工智能場景是發展新質生產力的機會

人工智能會否取代人類？嶺南大學教授鄺得互這樣說

百度推文心大模型4.0　稱綜合能力匹敵GPT-4

台“自研”AI語言模型答問顯示“台灣屬於中國”

香港首位學者獲ACM頒最佳研究論文獎

職場達人實測“文心一言”是文案高手

沙特、阿聯酋搶購英偉達芯片

微軟總裁：中國企業是ChatGPT主要競爭對手

中國成立GPT產業聯盟

ChatGPT4：讓人走進眼見不一定為實的時代

科學家緊急叫停人工智能稱有機會對人類社會構成危險

OpenAI 研究：ChatGPT或影響80%工作崗位高收入影響最大

視頻

更多

“廣西三月三”走進香港　近距離體驗壯族姑娘的風情萬種

北京車展看點多！天天擠滿　全球車企大佬齊現身！

穿越千年的凝望　與香港記者一起走進“龍門石窟”

60秒精華回顧　神舟十八號載人飛船成功升空！

印度大選｜如果贏家是莫迪，中印關係會如何？

【通講壇】菲律賓“拒和”搞軍演　膽氣從哪來？

埃隆·馬斯克全球首尊蠟像亮相香港杜莎夫人蠟像館

來論

更多

論壇

更多

圖集

更多

紀念金庸百年誕辰論壇在港舉行

澳門將迎來“五．一黃金周＂高峰期

香港“建造業安全獎勵計劃”推動職業安全及健康

閱讀排行

友情鏈接

關於我們

Copyright © 2009-2023 All Rights Reserved 香港中國通訊社有限公司版權所有

承印人：香港中國通訊社有限公司

承印地址: 香港南區黃竹坑道21號環匯廣場30樓

Tel: (+852) 28561919 Fax: (+852) 25647453