DeepSeek發布V3模型　編程能力大幅提升 | 內地 - 香港中通社

2025年12月24日星期三繁简

首頁 -> 內地

DeepSeek發布V3模型　編程能力大幅提升

分享到：

分享到微信

分享到微博

分享到Twitter

分享到Facebook

分享到QQ

2025-03-25 17:25 | 稿件來源：香港中通社

【字號：大中小】

香港中通社3月25日電中國初創公司深度求索（DeepSeek）發布了V3模型更新，加強了模型的編程能力，顯示這家公司希望在人工智能（AI）激烈競爭中保持領先優勢。

DeepSeek 香港中通社資料圖

綜合媒體25日報道，AI開源模型DeepSeek-V3的版本更新V3-0324於北京時間3月24日深夜在AI開源平台HuggingFace上線。DeepSeek沒有為此次版本更新發布任何公告，延續了該公司的低調風格。

據悉，初代DeepSeek-V3發布於去年12月26日，這款模型自上線後便以高性價比火速“出圈”。根據官方技術披露，DeepSeek-V3模型的總訓練成本為557.6萬美元，而GPT-4o等模型的訓練成本約為1億美元。

更新後的DeepSeek-V3模型大小為641GB，參數量6850億。與V3相同，V3-0324模型採用專家混合（MoE）架構，並開源允許自由商用。

此次DeepSeek發布的V3版本更新，編程能力的優化成了最大亮點。有網民使用V3-0324模型編寫800多行代碼，全程沒有出現任何故障。

有AI研究者在X發布評測指出，V3-0324模型在所有基準測試中都取得巨大進步，可能已超越美國Anthropic的Claude Sonnet 3.5，成為最強大的非推理模型。Sonnet 3.5是當前最受認可的商業AI模型之一。（完）

【編輯：彭玉婷】

相關新聞

DeepSeek創始人梁文鋒研究論文登《自然》封面

DeepSeek創始人梁文鋒研究論文登《自然》封面

DeepSeek“橫空出世”半年曇花一現還是AI產業轉捩點？

梁文鋒談DeepSeek-V3硬體創新與模型優化

DeepSeek橫空出世改變AI生態系？台專家：這一註解挺有說服力

AI競爭愈發激烈：馬斯克剛發佈Grok 3，DeepSeek跟著發重磅論文

DeepSeek熱度一路“狂飆”：微信等大型科企政企不斷接入

百度智能雲千帆上架DeepSeek模型推限時免費

性能超過Deepseek！蘋果選擇阿里巴巴合作開發AI功能

華為騰訊阿里百度等上線DeepSeek大模型

中國DeepSeek橫空出世，外媒讚其“震動硅谷”

中國新AI大模型DeepSeek登頂美國APP排行榜

中國大模型DeepSeek為何會讓Meta恐慌？

中國新AI大模型DeepSeek登頂美國區免費APP下載排行榜

中國人工智能開源模型橫空出世印媒：美國的限制失效了

視頻

更多

河套香港園區開幕首批逾60企業進駐八成樓面已出租　李家超：目標成為世界級創新平台

【通說環球】關於海南封關的這些誤解，你都搞清楚了嗎？

【通講壇】台灣“藍白”聯手彈劾賴清德　學者：很多象徵性意義

香港特區政府舉辦與候任議員交流會　三司長齊出席多位“新丁”議員發言

三項控罪均裁定成立　黎智英會被怎樣判刑？

黎智英三項控罪均判定成立

王曼昱衛冕WTT女單冠軍　香港市民：因為看比賽愛上打乒乓球

來論

更多

論壇

更多

圖集

更多

“多彩中國　佳節好物”在澳門開幕

"吳冠中——邂逅風景"展覽在港展出

“粵車南下”入境香港市區首日實施流程順暢

閱讀排行

友情鏈接

關於我們

Copyright © 2009-2023 All Rights Reserved 香港中國通訊社有限公司版權所有

承印人：香港中國通訊社有限公司

承印地址: 香港南區黃竹坑道21號環匯廣場30樓

Tel: (+852) 28561919 Fax: (+852) 25647453