中國新AI大模型DeepSeek登頂美國APP排行榜分享到:
香港中通社1月27日電 1月27日,中國新AI大模型DeepSeek(深度求索)應用登頂蘋果美國地區應用商店免費App下載排行榜,超越了ChatGPT。同日,蘋果中國區應用商店免費榜顯示,DeepSeek成為中國區第一。 數天前,總部位於中國杭州的DeepSeek發布推理模型R1,在性能逼近OpenAI o1正式版的同時,推理成本卻僅為後者的幾十分之一。這些成果在國內外AI圈掀起討論熱潮,被稱作“來自東方的神秘力量”。紐約時報稱,DeepSeek大模型以極低成本(600萬美元)和少量芯片(2000塊)實現了與OpenAI等巨頭相媲美的性能,挑戰了“唯有科技巨頭才能研發尖端AI”的行業共識。 據了解,DeepSeek R1沒有使用業內普遍使用的監督微調(SFT)訓練範式,而是直接通過強化學習讓模型自主進化出複雜的推理能力,包括反思和長鏈思考等能力。有分析指,DeepSeek恰恰是美國對華進行芯片出口限制之下所激發出的創新。
近日在中國,一個由專家、企業家和教科文衛體等領域代表的座談會,來自廣東湛江吳川的DeepSeek創始人梁文鋒出席並發言。梁文鋒是位80後,2002年,他以吳川市第一中學“高考狀元”的成績考上浙江大學電子信息工程專業,畢業後在浙江大學攻讀研究生。在大學期間,梁文鋒就已積累市場行情數據和探索全自動量化交易。 DeepSeek成立於2023年5月,是一家大模型創業公司。成立半年後,DeepSeek就推出了免費商用、完全開源的代碼大模型DeepSeek Coder。 2024年5月,該公司發布開源模型DeepSeek V2,將推理成本降低近百倍,一躍成名。同年12月26日,全新系列模型DeepSeek-V3發布,在大模型主流榜單中位居前列。(完) 【編輯:李濼】
相關新聞 |
視頻更 多
【LIVING IN HONG KONG】居港逾55年 賀祈思欲把一生收藏贈香港
【通說環球】“燒垃圾發電”全球第一,中國垃圾處理已是Next Level!
【你不知道的香港】從結業邊緣到大排長龍 靠內地學生“盤活”的香港燒臘店
金價再創新高 香港市民排隊賣金笑呵呵
2025年特區政府施政十件大事結果出爐
“體操王子”李寧看好香港體育發展:很多青少年“身懷絕技”
【通講壇】中國開年迎“外交熱” 歐洲政要為何排隊訪華?
來論更 多評論更 多
論壇更 多閱讀排行
|










