首頁 -> 電訊
DeepSeek模型升級 複雜推理創意寫作能力提升分享到:
香港中通社5月30日電 中國科企深度求索29日晚公布,其名下DeepSeek R1模型已完成小版本升級,當前版本為DeepSeek-R1-0528。據介紹,相較於舊版R1,新版模型在複雜推理任務中的表現有了顯著提升。
DeepSeek-R1-0528仍然使用2024年12月所發布的DeepSeek V3 Base模型作為基座,但在後訓練過程中投入了更多算力,顯著提升了模型的思維深度與推理能力。更新後的R1模型在數學、編程與通用邏輯等多個基準測評中取得了當前中國所有模型中首屈一指的優異成績,並且在整體表現上已接近其他國際頂尖模型,如美國公司OpenAI的o3與穀歌Gemini-2.5-Pro。 另外,與舊版相比,更新後的模型在改寫潤色、總結摘要、閱讀理解等場景中,幻覺率降低了45至50%左右,能够有效地提供更為準確、可靠的結果。在舊版基礎上,更新後的R1模型針對議論文、小說、散文等文體進行了進一步優化,能够輸出篇幅更長、結構內容更完整的長篇作品,同時呈現出更加貼近人類偏好的寫作風格。新模型在前端代碼生成、角色扮演等領域的能力也均有更新和提升。 DeepSeek-R1-0528為開源模型。 中國民營科創公司深度求索於2023年7月在杭州成立。今年1月15日,其名下大數據模型DeepSeek正式發布;2月1日,DeepSeek日活躍用戶數已突破3000萬。(完) 相關新聞
|
視頻更 多
黎智英串謀勾結外國勢力等3罪罪成 被判囚20年
【通說環球】巴拿馬運河前世今生 80公里水道何以挑起一場權力遊戲?
【你不知道的香港】最美最刺激?這條巴士線路被稱為“隱藏版過山車”
什麼?!清朝亡了百年了 《大清律例》在香港還在用?
香港中聯辦舉行2026年新春團拜會
香港新派武俠小說展開幕 “老夫子”重出江湖
徐悲鴻的馬“跑”起來了!女兒徐芳芳現場見證
來論更 多評論更 多
論壇更 多閱讀排行
|









