首頁 -> 內地

DeepSeek模型升級 複雜推理創意寫作能力提升

分享到:
2025-05-30 11:20 | 稿件來源:香港中通社

【字號:

香港中通社5月30日電  中國科企深度求索29日晚公布,其名下DeepSeek R1模型已完成小版本升級,當前版本為DeepSeek-R1-0528。據介紹,相較於舊版R1,新版模型在複雜推理任務中的表現有了顯著提升。

DeepSeek  香港中通社圖片

DeepSeek-R1-0528仍然使用2024年12月所發布的DeepSeek V3 Base模型作為基座,但在後訓練過程中投入了更多算力,顯著提升了模型的思維深度與推理能力。更新後的R1模型在數學、編程與通用邏輯等多個基準測評中取得了當前中國所有模型中首屈一指的優異成績,並且在整體表現上已接近其他國際頂尖模型,如美國公司OpenAI的o3與穀歌Gemini-2.5-Pro。

另外,與舊版相比,更新後的模型在改寫潤色、總結摘要、閱讀理解等場景中,幻覺率降低了45至50%左右,能够有效地提供更為準確、可靠的結果。在舊版基礎上,更新後的R1模型針對議論文、小說、散文等文體進行了進一步優化,能够輸出篇幅更長、結構內容更完整的長篇作品,同時呈現出更加貼近人類偏好的寫作風格。新模型在前端代碼生成、角色扮演等領域的能力也均有更新和提升。

DeepSeek-R1-0528為開源模型。

中國民營科創公司深度求索於2023年7月在杭州成立。今年1月15日,其名下大數據模型DeepSeek正式發布;2月1日,DeepSeek日活躍用戶數已突破3000萬。(完)

【編輯:彭玉婷】

視頻

更 多
過千人入住政府過渡性房屋 “善樓”負責人:希望為災民們建一個家
以“獅子山”畫作鼓勵災民 林天行個展“夜·香港”開幕
【通講壇】涉台最新表態 高市早苗這次說得比較清楚?
若AI和無人機參與救援,能在香港的火災中發揮什麼功能?
宏福苑大火遇難者人數增至159名 家屬“頭七”哀傷路祭
香港五級大火致156人死亡 政府善後工作進展如何?
法國總統馬克龍“單飛”訪華 會聊些什麼?