DeepSeek發布最新大語言模型　關聯下一代中國芯片 | 電訊 - 香港中通社

2026年04月03日星期五繁简

首頁 -> 電訊

DeepSeek發布最新大語言模型　關聯下一代中國芯片

分享到：

分享到微信

分享到微博

分享到Twitter

分享到Facebook

分享到QQ

2025-08-21 21:48 |

【字號：大中小】

　　香港中通社8月21日電　中國人工智能（AI）公司深度求索（DeepSeek）21日宣布，其最新大語言模型DeepSeek-V3.1正式發布。

　　據DeepSeek介紹，新升級版本的變化主要體現在三個方面：混合推理架構、更高的思考效率、更強的Agent（智能體）能力。

　　DeepSeek-V3.1實現了一個模型同時支持思考模式與非思考模式。它就像一個擁有兩種工作模式的超級大腦，當面對簡單問題時，能以非思考模式快速給出答案。而在處理複雜問題時，可切換到思考模式，給出更具深度和邏輯的解答。用戶可通過官方App或網頁端的“深度思考”按鈕切換這兩種模式。

　　此外，DeepSeek-V3.1使用了UE8M0 FP8 Scale的參數精度。當天，DeepSeek官方公眾號在其文章置頂留言裡說，UE8M0 FP8是針對即將發布的下一代中國產芯片設計。

　　官方數據顯示，與DeepSeek-R1-0528相比，DeepSeek-V3.1在思考模式下效率大幅提升，能在更短時間內給出答案，且經過思維鏈壓縮訓練，token（大模型文本處理的最小單位）消耗量可減少20%至50%，各項任務的平均表現與R1-0528持平。R1-0528是DeepSeek於今年5月發布的旗艦推理模型DeepSeek R1的升級版本。（完）

相關新聞

2025-09-18DeepSeek創始人梁文鋒研究論文登《自然》封面
2025-08-22DeepSeek發布最新大語言模型關聯下一代中國芯片
2025-08-11DeepSeek問世半年英媒：它改寫了美國AI行業的思維模式
2025-02-25DeepSeek-R1多芯片版本開源
2025-02-21港嶺大ChatGPT門戶網站接入DeepSeek-R1助教與學
2025-02-14DeepSeek大模型接入中國雲平台政務系統等促行業變革
2025-02-12百度智能雲千帆上架DeepSeek模型推限時免費
2025-02-08DeepSeek到底什麼水平？
2025-01-27中國新AI大模型DeepSeek登頂美國區免費APP下載排行榜

視頻

更多

【通說環球】外國博主說“中國很安全”，這是真的嗎？

香港的士全面推行電子支付　乘客司機紛紛點讚

“此愛綿綿無絕期”　粉絲哽咽悼念張國榮離世23周年

政府飛行服務隊開放日一家大小齊參與　感受航空魅力

【你不知道的香港】一邊看書一邊種花餵羊　最遙遠菜田上的小書店

香港算力基建沙嶺數據園區動工　將助AI賦能產業

【通講壇】柯文哲遭判17年　政治生命因此終結？

來論

更多

論壇

更多

圖集

更多

復活節及清明節假期　內地旅客訪港暢旺

訪羅淑佩：香港啟德體育園盛事經濟效應顯著

香港躋身全球第五大貿易體

閱讀排行

友情鏈接

關於我們

Copyright © 2009-2023 All Rights Reserved 香港中國通訊社有限公司版權所有

承印人：香港中國通訊社有限公司

承印地址: 香港南區黃竹坑道21號環匯廣場30樓

Tel: (+852) 28561919 Fax: (+852) 25647453