當前報章為 第13902號
2025年02月11日
星期二
DeepSeek新一波人工智能惹關注
2025-02-11
【特稿】近日,中國人工智能企業深度求索(DeepSeek)推出了其最新的開源模型DeepSeek-R1,該模型在成本控制方面的表現相當出色,性能接近於美國開放人工智能研究中心(OpenAI)開發的GPT-01。此舉標誌著人工智能產業在運算能力依賴上的一大突破,並可能引發新一輪的創新浪潮,進一步推動全球人工智能的發展。
根據DeepSeek的官方資料,DeepSeek-R1在後訓練階段大量運用了強化學習技術,成功地在僅有極少標註數據的情況下,顯著提升了模型的推理能力。該模型在數學、代碼生成及自然語言推理等任務中的測試結果,與GPT-01的正式版相當接近。
國際知名投行摩根士丹利指出,「更大並不等於更聰明」,DeepSeek通過提升數據質量和改進模型架構,展示了與以往大型模型截然不同的高效訓練路徑。摩根士丹利表示,DeepSeek模型的成本優勢明顯,與國際知名大模型相比,其開發成本低了約一個數量級。
高盛集團也認為,DeepSeek的新模型成本遠低於目前市場上的其他模型,這意味著開發和利用大型模型的門檻降低,互聯網巨頭將面臨來自初創公司的潛在競爭。這一變化可能會顯著重塑人工智能市場的格局。
《金融時報》的評論文章指出,DeepSeek正在挑戰人工智能領域的核心信念,即認為更強大的硬件是推動人工智能發展的關鍵。摩根士丹利強調,DeepSeek的模型表明,前沿的AI能力不必依賴龐大的計算資源。通過巧妙的工程設計和高效的訓練方法,資源的高效利用比單純的計算能力更為重要。這一觀點可能會激勵企業探索更具成本效益的AI開發和部署方式。
DeepSeek的模型為開源共享,近期多個全球知名的開源平台如抱抱臉等,也宣佈已復現了DeepSeek-R1的訓練過程。美國「元」公司的首席AI科學家楊立昆在社交媒體上發文表示,DeepSeek-R1的推出象徵著開源模型正在超越閉源模型的時代。
《金融時報》的評論強調,開源模型DeepSeek-R1對全球用戶具有極大的吸引力,有助於推動人工智能技術的進一步開發和應用。對於大多數商業用戶而言,擁有一款足夠可靠且易於操作的模型,比擁有一個絕對領先的模型更為重要。如同文章所言,「並不是每個司機都需要一輛法拉利」,像R1這樣的模型在推理能力上的進步,可能會為企業在客戶互動或工作任務的處理帶來突破性變化。若能以更低的成本獲得這些模型,企業的盈利能力將大幅提升。
瑞士瑞銀集團則預測,若AI訓練和推理成本顯著降低,將促使更多終端用戶利用AI來改善業務或開發新應用。這一趨勢將可能改變市場競爭格局,推動整個行業向前發展。
DeepSeek-R1的推出不僅是技術上的創新,更是市場格局的轉變,預示著一場新的人工智能革命即將到來。
*曉凌