DeepSeek發布V3模型　編程能力大幅提升 | 內地 - 香港中通社

2026年06月25日星期四繁简

首頁 -> 內地

DeepSeek發布V3模型　編程能力大幅提升

分享到：

分享到微信

分享到微博

分享到Twitter

分享到Facebook

分享到QQ

2025-03-25 17:25 | 稿件來源：香港中通社

【字號：大中小】

香港中通社3月25日電中國初創公司深度求索（DeepSeek）發布了V3模型更新，加強了模型的編程能力，顯示這家公司希望在人工智能（AI）激烈競爭中保持領先優勢。

DeepSeek 香港中通社資料圖

綜合媒體25日報道，AI開源模型DeepSeek-V3的版本更新V3-0324於北京時間3月24日深夜在AI開源平台HuggingFace上線。DeepSeek沒有為此次版本更新發布任何公告，延續了該公司的低調風格。

據悉，初代DeepSeek-V3發布於去年12月26日，這款模型自上線後便以高性價比火速“出圈”。根據官方技術披露，DeepSeek-V3模型的總訓練成本為557.6萬美元，而GPT-4o等模型的訓練成本約為1億美元。

更新後的DeepSeek-V3模型大小為641GB，參數量6850億。與V3相同，V3-0324模型採用專家混合（MoE）架構，並開源允許自由商用。

此次DeepSeek發布的V3版本更新，編程能力的優化成了最大亮點。有網民使用V3-0324模型編寫800多行代碼，全程沒有出現任何故障。

有AI研究者在X發布評測指出，V3-0324模型在所有基準測試中都取得巨大進步，可能已超越美國Anthropic的Claude Sonnet 3.5，成為最強大的非推理模型。Sonnet 3.5是當前最受認可的商業AI模型之一。（完）

【編輯：彭玉婷】

相關新聞

DeepSeek發布新模型更接近人類視覺理解

DeepSeek創始人梁文鋒研究論文登《自然》封面

DeepSeek創始人梁文鋒研究論文登《自然》封面

DeepSeek“橫空出世”半年曇花一現還是AI產業轉捩點？

DeepSeek橫空出世改變AI生態系？台專家：這一註解挺有說服力

AI競爭愈發激烈：馬斯克剛發佈Grok 3，DeepSeek跟著發重磅論文

DeepSeek熱度一路“狂飆”：微信等大型科企政企不斷接入

百度智能雲千帆上架DeepSeek模型推限時免費

性能超過Deepseek！蘋果選擇阿里巴巴合作開發AI功能

華為騰訊阿里百度等上線DeepSeek大模型

中國DeepSeek橫空出世，外媒讚其“震動硅谷”

中國新AI大模型DeepSeek登頂美國APP排行榜

中國大模型DeepSeek為何會讓Meta恐慌？

中國新AI大模型DeepSeek登頂美國區免費APP下載排行榜

中國人工智能開源模型橫空出世印媒：美國的限制失效了

視頻

更多

【通講壇】東風-17發射畫面首公開，釋放何種戰略信號？

用20年“沖上雲霄”　香港首位女總機師的故事

中通獨家：台灣街頭現張雪機車820RR！背後藏著什麼故事？

德雲社環球巡演，香港收官！郭德綱：讓你笑是相聲，讓你哭是鄉音

駐港部隊昂船洲軍營開放　市民：感謝官兵守護香港

【通說環球】全球最大IPO：Space　X是在“造故事”還是在“賭未來”？

《給阿嬤的情書》香港公映　香港市民：這是我一生中最值得看的一部電影

來論

更多

論壇

更多

圖集

更多

香港回歸29周年前夕　多區掛起慶祝標語

6月份香港強積金人均暫錄虧損1549港元

香港引進外科手術機器人　完成全球首例活肝移植

閱讀排行

友情鏈接

關於我們

Copyright © 2009-2023 All Rights Reserved 香港中國通訊社有限公司版權所有

承印人：香港中國通訊社有限公司

承印地址: 香港南區黃竹坑道21號環匯廣場30樓

Tel: (+852) 28561919 Fax: (+852) 25647453