中國阿里巴巴推全模态AI模型　可處理音頻視頻及手機上用 | 內地 - 香港中通社

2026年06月25日星期四繁简

首頁 -> 內地

中國阿里巴巴推全模态AI模型　可處理音頻視頻及手機上用

分享到：

分享到微信

分享到微博

分享到Twitter

分享到Facebook

分享到QQ

2025-03-27 10:57 | 稿件來源：香港中通社

【字號：大中小】

香港中通社3月27日電 27日凌晨，中國互聯網企業阿里巴巴發布並開源首個端到端全模態大模型通義千問Qwen2.5-Omni-7B，可同時處理文本、圖像、音頻和視頻等多種輸入，並實時生成文本與自然語音合成輸出。

資料圖為北京市朝陽區望京地區的阿里巴巴集團北京總部標識。香港中通社圖片

據介紹，Qwen2.5-Omni以接近人類的多感官方式“立體”認知世界並與之實時交互，還能通過音視頻識別情緒，在複雜任務中進行更智能、更自然的反饋與決策。現在，開發者和企業可免費下載商用Qwen2.5-Omni，手機等終端智能硬件也可輕鬆部署運行。

Qwen2.5-Omni在一系列同等規模的單模態模型權威基准測試中，展現出了全球最強的全模態優異性能，其在語音理解、圖片理解、視頻理解、語音生成等領域的測評分數，均領先於專門的Audio或VL模型，且語音生成測評分數（4.51）達到了與人類持平的能力。

此外，Qwen2.5-Omni以7B的小尺寸讓全模態大模型在產業上的廣泛應用成為可能。即便在手機上，也能輕鬆部署和應用該模型。

阿里巴巴2023年9月起向公眾開放通義大模型。截至目前，海內外AI開源社區中阿里通義千問的衍生模型數量突破10萬，超越美國Llama系列模型，是公認的全球第一開源模型。

目前世界範圍內，OpenAI和谷歌都提供了生成式AI模型，可處理包括文本和音頻在內的不同類型輸入。（完）

【編輯：彭玉婷】

相關新聞

中國科企小米推出三款自研大模型

中國AI平台“千問”開源創紀錄：下載破10億次

杭州雲棲大會閉幕阿里發布全球首款原生端到端全模態大模型

表現強勁！阿里、快手等再掀中國AI重估熱潮

阿里巴巴升級開源視頻生成模型強化AI競爭力

阿里開源Qwen3全系列助推蘋果智能中國落地

阿里通義千問發布最新推理模型股價大漲

性能超過Deepseek！蘋果選擇阿里巴巴合作開發AI功能

中國首個千億級多模態行業大模型投入應用

中國科創大舉押注AI領域進“戰國時代”

阿里雲音視頻AI助手“通義聽悟”能力升級

阿里巴巴向公眾開放AI大模型“通義千問”

視頻

更多

【通講壇】東風-17發射畫面首公開，釋放何種戰略信號？

用20年“沖上雲霄”　香港首位女總機師的故事

中通獨家：台灣街頭現張雪機車820RR！背後藏著什麼故事？

德雲社環球巡演，香港收官！郭德綱：讓你笑是相聲，讓你哭是鄉音

駐港部隊昂船洲軍營開放　市民：感謝官兵守護香港

【通說環球】全球最大IPO：Space　X是在“造故事”還是在“賭未來”？

《給阿嬤的情書》香港公映　香港市民：這是我一生中最值得看的一部電影

來論

更多

論壇

更多

圖集

更多

香港回歸29周年前夕　多區掛起慶祝標語

6月份香港強積金人均暫錄虧損1549港元

香港引進外科手術機器人　完成全球首例活肝移植

閱讀排行

友情鏈接

關於我們

Copyright © 2009-2023 All Rights Reserved 香港中國通訊社有限公司版權所有

承印人：香港中國通訊社有限公司

承印地址: 香港南區黃竹坑道21號環匯廣場30樓

Tel: (+852) 28561919 Fax: (+852) 25647453