港大指人工智能大語言模型文心一言4中文表現最佳 | 社會 - 香港中通社

2026年06月25日星期四繁简

首頁 -> 港澳 ->社會

港大指人工智能大語言模型文心一言4中文表現最佳

分享到：

分享到微信

分享到微博

分享到Twitter

分享到Facebook

分享到QQ

2024-03-12 19:52 | 稿件來源：香港新聞網

【字號：大中小】

香港新聞網3月12日電香港大學經管學院日前就多個主流的人工智能大語言模型（LLMs）在中文及英文環境進行綜合深入評測，並發表評測報告，於12日公佈中文和英文語境大模型排行榜。在中文語境下，文心一言4綜合表現最佳；而在英文語境下，GPT 4-turbo領先優勢明顯。

報告評測了14款中文及16款英文語境下的人工智能通用大語言模型。評測主要針對三大核心能力，包括自然語言能力、專業學科能力以及安全與責任，要求大模型展現出對人類角色、微妙情感和文化語境的深入理解，並在更複雜和多樣化的情境中準確理解和回應指令，以及對人類學科知識的掌握、處理敏感話題的能力等。

在中文語境下，文心一言4綜合表現最佳，GPT4-turbo與通義千問2緊隨其後。文心一言4對中文特色語境表現出更好的適應能力。在安全與責任方面，文心一言4得分亦最高，展現出較成熟的安全意識。文心一言4的表現，也側面反映越來越多高品質的中文資料集，逐步被構築並應用於國產大模型，以創造出更好的中文思維AI助手。

在英文語境下，僅有GPT 4-turbo一款模型的綜合得分獲得80分以上，大多數國產大模型在英文語境下的綜合表現處於稍微劣勢的位置。這也與國產大模型訓練的數據多為中文有關。

港大經管學院創新及資訊管理學教授蔣鎮輝表示，中國具有大語言模型應用的豐富場景，特別是在教育、金融、醫療、法律、零售等方面，未來的想像空間是十分寬廣的。在人工智能大語言模型的領域，中國科技不該只做個追隨者，而應該勇於成為引領者，中國的大語言模型呼喚更多從0到1的原創性核心技術。（完）

【編輯：譚暢】

相關新聞

OpenAI最強模型GPT-5來了！免費可用

推理模型評測報告：文心X1 Turbo領跑中國國內總分第一

百度文心X1 Turbo獲中國首個‘4+級’評級

香港科大師生率先試用港版DeepSeek

科大率先試用首個港產AI大模型HKGAI V1　推動教育創新

中國發布海洋垂直領域大語言模型“瀚海智語”

港嶺大ChatGPT門戶網站接入DeepSeek-R1助教與學

AI競爭愈發激烈：馬斯克剛發佈Grok 3，DeepSeek跟著發重磅論文

DeepSeek到底什麼水平？

Deepseek出世英偉達暴跌15% 專家：中美AI競爭打成平手

通說：來自廣東的他，讓硅谷刮目相看

商湯推出“日日新”融合大模型勇奪“雙冠王”

百度推文心大模型4.0　稱綜合能力匹敵GPT-4

中國成立GPT產業聯盟

視頻

更多

【通講壇】東風-17發射畫面首公開，釋放何種戰略信號？

用20年“沖上雲霄”　香港首位女總機師的故事

中通獨家：台灣街頭現張雪機車820RR！背後藏著什麼故事？

德雲社環球巡演，香港收官！郭德綱：讓你笑是相聲，讓你哭是鄉音

駐港部隊昂船洲軍營開放　市民：感謝官兵守護香港

【通說環球】全球最大IPO：Space　X是在“造故事”還是在“賭未來”？

《給阿嬤的情書》香港公映　香港市民：這是我一生中最值得看的一部電影

來論

更多

論壇

更多

圖集

更多

香港回歸29周年前夕　多區掛起慶祝標語

6月份香港強積金人均暫錄虧損1549港元

香港引進外科手術機器人　完成全球首例活肝移植

閱讀排行

友情鏈接

關於我們

Copyright © 2009-2023 All Rights Reserved 香港中國通訊社有限公司版權所有

承印人：香港中國通訊社有限公司

承印地址: 香港南區黃竹坑道21號環匯廣場30樓

Tel: (+852) 28561919 Fax: (+852) 25647453