QY球友会体育

多功能模拟作用震惊!AI界“拼多多”Deepseek新模型成本仅600万美元性能媲美GPT-4

作者:QY球友会体育 阅读量: 发布时间:2025-02-23 08:34:27

  近日,中國杭州的Deepseek公司在全球AI界掀起了一場震蕩,令人矚目的新模型DeepSeek-v3橫空出世,迅速登頂開源模型排行榜。該模型的性能達到與世界頂尖閉源模型如GPT-4o及Claude-3.5-Sonnet針鋒相對的地步,引發了海外同行的廣泛關注。

  最爲人稱道的是,DeepSeek-v3的訓練成本僅爲600萬美元,較以往✅降低了驚人的10倍。正如某投資機構負責人所稱,這份長達53頁的技術論文簡直是“黃金”。Deepseek的中文名爲“深度求索”,是量化巨頭幻方量化的子公司,已爲量化交易領域鍛造了強大的AI硬件基礎。

  自今年5月發布的DeepSeekV2因其史無前例的性價比在業界一躍成名後,半年之間,Deepseek便實施了更進一步的技術飛躍。准備好迎接新一輪的技術革命嗎?在Launch的12月26日,DeepSeek-v3的首個版本完成上線,並公開開源,其評測成績超越了包括Qwen2.5-72B和Llama-3.1-405B等其他主要開源模型,尤其在百科知識、長文本、代碼及數學能力等領域表現尤爲突出。有數據顯示,DeepSeek-V3在美國數學競賽(AIME2024,MATH)及全國高中數學聯賽(CNMO2024)中尤爲出色,輕松超過了所有競爭對手。

  此外,該新模型在生✅成吐字速度上也實現了質的飛躍,從20 TPS提升至60 TPS,增加了整整三倍的效率。值得注意的是,Deepseek還調整了API服務價格,打算通過超值體驗期爲廣大開發者提供更人性化的費用方案。

  天使投資人Balaji對此表示特別震驚,認爲DeepSeek新開源模型的發布,不僅技術上具高端能力,其訓練預算的低廉亦是前所未有。Andrej Karpathy也對該模型的神奇訓練效率表示認可:在之前,類似能力的大模型往往需要成千上萬的GPU,而DeepSeek僅用280萬GPU小時完成訓練,真可謂高效應對資源挑戰。

  此外,Deepseek創始人梁文鋒則重申了他們降低價格的初衷是爲了讓更多的人能夠進入AI領域,並讓技術創新惠及更廣泛的群體,以推動整個生態的持續成長。作爲中國AI界最低調的隱形巨頭,Deepseek一路成長並不斷爲行業帶來沖擊。如同其名字“深度求索”中所蘊涵的✅精神,Deepseek顯然在探索人工智能的更深層次可能性上未止步。

  無論外界的競爭局勢如何變化,Deepseek或許將繼續在這一競爭白熱化的行業中引領風騷。返回搜狐,查看更多

上一篇:最新Delta模拟器测试版为iPhone添加了在线多人游戏、
下一篇:智能体应用:现实世界中的未来畅想2025年2月23日