首頁 -> 內地

DeepSeek發布最新大語言模型 關聯下一代中國芯片

分享到:
2025-08-22 09:09 | 稿件來源:香港中通社

【字號:

香港中通社8月21日電 中國人工智能(AI)公司深度求索(DeepSeek)21日宣布,其最新大語言模型DeepSeek-V3.1正式發布。

香港中通社資料圖

據DeepSeek介紹,新升級版本的變化主要體現在三個方面:混合推理架構、更高的思考效率、更強的Agent(智能體)能力。

DeepSeek-V3.1實現了一個模型同時支持思考模式與非思考模式。它就像一個擁有兩種工作模式的超級大腦,當面對簡單問題時,能以非思考模式快速給出答案。而在處理複雜問題時,可切換到思考模式,給出更具深度和邏輯的解答。用戶可通過官方App或網頁端的“深度思考”按鈕切換這兩種模式。

此外,DeepSeek-V3.1使用了UE8M0 FP8 Scale的參數精度。當天,DeepSeek官方公眾號在其文章置頂留言裡說,UE8M0 FP8是針對即將發布的下一代中國產芯片設計。

官方數據顯示,與DeepSeek-R1-0528相比,DeepSeek-V3.1在思考模式下效率大幅提升,能在更短時間內給出答案,且經過思維鏈壓縮訓練,token(大模型文本處理的最小單位)消耗量可減少20%至50%,各項任務的平均表現與R1-0528持平。R1-0528是DeepSeek於今年5月發布的旗艦推理模型DeepSeek R1的升級版本。(完)

【編輯:石歡歡】

視頻

更 多
“地表最難”乒乓球賽的巔峰對決!樊振東王曼昱衛冕全運會單打冠軍
張家朗全運會奪銅 讚對手表現出色期待之後團體賽賽事
香港立法會選委會界別論壇氣氛熱烈 逾千選委聽取50候選人說政綱
【通說環球】邊賺人民幣邊鼓吹“台獨” 揭開雙面人沈伯洋的真面目
聲浪轟鳴不絕耳!澳門格蘭披治大賽車有多熱鬧?!
全運會深港跨境馬拉松創歷史 近三百名志願者一同參與見證
全運男子七欖港隊全勝奪金 李卡度憶述關鍵達陣