首頁 -> 內地

DeepSeek模型升級 複雜推理創意寫作能力提升

分享到:
2025-05-30 11:20 | 稿件來源:香港中通社

【字號:

香港中通社5月30日電  中國科企深度求索29日晚公布,其名下DeepSeek R1模型已完成小版本升級,當前版本為DeepSeek-R1-0528。據介紹,相較於舊版R1,新版模型在複雜推理任務中的表現有了顯著提升。

DeepSeek  香港中通社圖片

DeepSeek-R1-0528仍然使用2024年12月所發布的DeepSeek V3 Base模型作為基座,但在後訓練過程中投入了更多算力,顯著提升了模型的思維深度與推理能力。更新後的R1模型在數學、編程與通用邏輯等多個基準測評中取得了當前中國所有模型中首屈一指的優異成績,並且在整體表現上已接近其他國際頂尖模型,如美國公司OpenAI的o3與穀歌Gemini-2.5-Pro。

另外,與舊版相比,更新後的模型在改寫潤色、總結摘要、閱讀理解等場景中,幻覺率降低了45至50%左右,能够有效地提供更為準確、可靠的結果。在舊版基礎上,更新後的R1模型針對議論文、小說、散文等文體進行了進一步優化,能够輸出篇幅更長、結構內容更完整的長篇作品,同時呈現出更加貼近人類偏好的寫作風格。新模型在前端代碼生成、角色扮演等領域的能力也均有更新和提升。

DeepSeek-R1-0528為開源模型。

中國民營科創公司深度求索於2023年7月在杭州成立。今年1月15日,其名下大數據模型DeepSeek正式發布;2月1日,DeepSeek日活躍用戶數已突破3000萬。(完)

【編輯:彭玉婷】

視頻

更 多
“腦機接口”新突破 港大團隊研發超長續航“類腦芯片”
【通說環球】中國醫療憑什麼讓外國人打“飛的”來看病?
地緣衝突升溫 油金避險不再是最佳選擇?股市震盪中投資者應如何應對?
因戰爭停擺的文化交流 在香港再次聯動
防AI“胡說八道”之後 我們該防AI“胡作非為”了?
【你不知道的香港】來香港還可以這樣玩!藏在美食工廠的穿越之旅
馬龍訪港與霍啟剛郭晶晶對打 笑稱六金是被“畫餅”畫出來的