首頁 -> 內地

DeepSeek模型升級 複雜推理創意寫作能力提升

分享到:
2025-05-30 11:20 | 稿件來源:香港中通社

【字號:

香港中通社5月30日電  中國科企深度求索29日晚公布,其名下DeepSeek R1模型已完成小版本升級,當前版本為DeepSeek-R1-0528。據介紹,相較於舊版R1,新版模型在複雜推理任務中的表現有了顯著提升。

DeepSeek  香港中通社圖片

DeepSeek-R1-0528仍然使用2024年12月所發布的DeepSeek V3 Base模型作為基座,但在後訓練過程中投入了更多算力,顯著提升了模型的思維深度與推理能力。更新後的R1模型在數學、編程與通用邏輯等多個基準測評中取得了當前中國所有模型中首屈一指的優異成績,並且在整體表現上已接近其他國際頂尖模型,如美國公司OpenAI的o3與穀歌Gemini-2.5-Pro。

另外,與舊版相比,更新後的模型在改寫潤色、總結摘要、閱讀理解等場景中,幻覺率降低了45至50%左右,能够有效地提供更為準確、可靠的結果。在舊版基礎上,更新後的R1模型針對議論文、小說、散文等文體進行了進一步優化,能够輸出篇幅更長、結構內容更完整的長篇作品,同時呈現出更加貼近人類偏好的寫作風格。新模型在前端代碼生成、角色扮演等領域的能力也均有更新和提升。

DeepSeek-R1-0528為開源模型。

中國民營科創公司深度求索於2023年7月在杭州成立。今年1月15日,其名下大數據模型DeepSeek正式發布;2月1日,DeepSeek日活躍用戶數已突破3000萬。(完)

【編輯:彭玉婷】

視頻

更 多
香港特首春節前落區“探民情” 市民:心砰砰跳 沒想到能和特首握手交流 
馬年新春 乘“微醺巴士”邂逅北京夜色
香港特區行政長官李家超給中通社全球讀者送新春祝福
超算中心、數據中心等用電大戶陸續進駐 港深創科園保供電沒少花心思
春節倒計時!香港2026年宵花市開鑼
法律專家傅健慈:黎智英犯罪行為與新聞自由無關 提早釋放門檻高大概率將坐足20年
黎智英被判囚20年 香港市民這樣說