DeepSeek新一波人工智能惹關注

當前報章為第13902號

2025年02月11日

星期二

本版新聞

MORE+

DeepSeek新一波人工智能惹關注

英皇娛樂酒店舉行傳媒春茗

名廚聯手呈獻《皇廷金獎宴》

明愛安老服務部新春團拜

逾六百位長者共聚一堂歡慶新春佳節

團體五點意見助兒童理財及新年利是安排

路環居民聯誼會新春敬老聯歡

澳門青少年壁球代表隊赴港競逐亞錦賽

展智會與親子會員慶新春

澳娛綜合「『京』彩名宴」系列載譽歸來

「御花園」「蘭亭永」聯推粵川交織風味

輔仁大學澳門校友會新閣就職

美高梅開啟2025「名廚駕到」系列

盛邀Ricardo Chaneton「雅吉」獻藝

澳團體訪護老院傳遞溫暖與關懷

DeepSeek新一波人工智能惹關注

2025-02-11

【特稿】近日，中國人工智能企業深度求索（DeepSeek）推出了其最新的開源模型DeepSeek-R1，該模型在成本控制方面的表現相當出色，性能接近於美國開放人工智能研究中心（OpenAI）開發的GPT-01。此舉標誌著人工智能產業在運算能力依賴上的一大突破，並可能引發新一輪的創新浪潮，進一步推動全球人工智能的發展。

根據DeepSeek的官方資料，DeepSeek-R1在後訓練階段大量運用了強化學習技術，成功地在僅有極少標註數據的情況下，顯著提升了模型的推理能力。該模型在數學、代碼生成及自然語言推理等任務中的測試結果，與GPT-01的正式版相當接近。

國際知名投行摩根士丹利指出，「更大並不等於更聰明」，DeepSeek通過提升數據質量和改進模型架構，展示了與以往大型模型截然不同的高效訓練路徑。摩根士丹利表示，DeepSeek模型的成本優勢明顯，與國際知名大模型相比，其開發成本低了約一個數量級。

高盛集團也認為，DeepSeek的新模型成本遠低於目前市場上的其他模型，這意味著開發和利用大型模型的門檻降低，互聯網巨頭將面臨來自初創公司的潛在競爭。這一變化可能會顯著重塑人工智能市場的格局。

《金融時報》的評論文章指出，DeepSeek正在挑戰人工智能領域的核心信念，即認為更強大的硬件是推動人工智能發展的關鍵。摩根士丹利強調，DeepSeek的模型表明，前沿的AI能力不必依賴龐大的計算資源。通過巧妙的工程設計和高效的訓練方法，資源的高效利用比單純的計算能力更為重要。這一觀點可能會激勵企業探索更具成本效益的AI開發和部署方式。

DeepSeek的模型為開源共享，近期多個全球知名的開源平台如抱抱臉等，也宣佈已復現了DeepSeek-R1的訓練過程。美國「元」公司的首席AI科學家楊立昆在社交媒體上發文表示，DeepSeek-R1的推出象徵著開源模型正在超越閉源模型的時代。

《金融時報》的評論強調，開源模型DeepSeek-R1對全球用戶具有極大的吸引力，有助於推動人工智能技術的進一步開發和應用。對於大多數商業用戶而言，擁有一款足夠可靠且易於操作的模型，比擁有一個絕對領先的模型更為重要。如同文章所言，「並不是每個司機都需要一輛法拉利」，像R1這樣的模型在推理能力上的進步，可能會為企業在客戶互動或工作任務的處理帶來突破性變化。若能以更低的成本獲得這些模型，企業的盈利能力將大幅提升。

瑞士瑞銀集團則預測，若AI訓練和推理成本顯著降低，將促使更多終端用戶利用AI來改善業務或開發新應用。這一趨勢將可能改變市場競爭格局，推動整個行業向前發展。

DeepSeek-R1的推出不僅是技術上的創新，更是市場格局的轉變，預示著一場新的人工智能革命即將到來。

*曉凌