大公網(wǎng)

大公報電子版
首頁 > 新聞 > 內(nèi)地 > 正文

?中國小公司AI“火”到海外 性價比擊敗美國巨頭

2025-01-27 05:02:48大公報
字號
放大
標準
分享

  【大公報訊】記者張寶峰北京報道:1月20日晚,中國DeepSeek(深度求索)公司發(fā)布推理模型DeepSeek-R1正式版,該模型在數(shù)學、代碼、自然語言推理等多個領域展現(xiàn)出與OpenAI o1正式版比肩的實力,但訓練成本更低。據(jù)介紹,DeepSeek僅用兩個月就完成了訓練,成本為550萬美元,僅為OpenAI等美國公司所花費金額的一小部分。此外,在2024年12月26日晚間,其開源模型DeepSeek-V3上線后更是在國內(nèi)外AI圈刷了屏。

  剛開始歐美還不相信,海外獨立評測網(wǎng)站Artificial Analysis就關鍵指標進行了反復測試,最終得出的結論是各項指標的分數(shù)都為80以上。團隊只有139名研發(fā)人員,是OpenAI的十分之一。

  據(jù)公開資料了解,DeepSeek創(chuàng)始人梁文峰出生于上世紀80年代廣東一個五線城市,本科、碩士就讀于浙江大學,攻讀人工智能專業(yè)。2008年,梁文峰開始致力于量化對沖領域的研究,2015年創(chuàng)立了幻方量化,之后規(guī)模擴張迅速,隨后2023年7月成立DeepSeek。該公司第一期研發(fā)投入就是幻方自主出資的,且旗下?lián)碛小拔灮鸪恪比f卡級別的算力加持。

  美科技界高度評價:或改變一切

  去年5月,深度求索發(fā)布DeepSeek-V2,以其創(chuàng)新的模型架構和史無前例的性價比爆火。模型推理成本被大幅降低,引發(fā)字節(jié)、阿里、百度等企業(yè)的模型降價潮,中國大模型價格戰(zhàn)由此一觸即發(fā)。

  DeepSeek的崛起,不僅震動了國內(nèi)科技界,更引起了美國科技界的廣泛關注。知名投資人馬克.安德森對DeepSeek-R1給予了高度評價,稱其為“我見過的最令人驚嘆和印象深刻的突破之一”。而AI科技初創(chuàng)公司Scale AI的創(chuàng)始人亞歷山大.王更是直言,DeepSeek的AI大模型發(fā)布可能會“改變一切”,讓美國在人工智能競賽中的領先地位受到挑戰(zhàn)。

點擊排行