微軟、英偉達、阿里、百度“開搶”,DeepSeek成為主流標配

robot
摘要生成中

DeepSeek熱度持續席捲全球,短短一週內,微軟Azure、英偉達等海外科技巨頭,以及國內阿里雲、華為雲、騰訊雲、百度雲等雲廠商均宣佈上線DeepSeek大模型,並以“零代碼”“超低價”等優惠吸引更多用戶。

2025年以來,DeepSeek陸續開源大語言模型V3、推理模型R1和多模態模型Janus Pro,因其高性能、低成本等優勢,率先受到海外市場關注。作為OpenAI的“金主”之一,微軟CEO納德拉在1月29日大讚DeepSeek的創新之處,同時也為微軟自身拉了一波廣告:DeepSeek-R1模型可通過微軟的AI平臺Azure AI Foundry和GitHub獲取,並承諾未來將在搭載Copilot+的電腦上運行。

1月30日,英偉達也緊隨其後,宣佈英偉達的開發者網站已將DeepSeek-R1模型納入“最受歡迎的模型”欄目,可在NVIDIA NIM微服務預覽版上使用。NVIDIA NIM是NVIDIA AI企業版服務的一部分,為跨雲、數據中心和工作站的自託管GPU加速推理微服務提供容器,用於預訓練和自定義AI 模型。

很快,國內各大互聯網雲服務商開始爭相接入DeepSeek系列模型,並拿出“真金白銀”相互競爭。

2月3日,阿里雲宣佈,阿里雲PAI Model Gallery支持雲上一鍵部署DeepSeek-V3和R1模型。在該平臺上,用戶可以零代碼實現從訓練到部署再到推理的全過程,簡化模型開發流程,為開發者和企業用戶帶來了更快、更高效、更便捷的AI開發和應用體驗。

同一天內,百度智能雲千帆平臺也正式上架DeepSeek-R1和V3模型,推出了超低價格方案,還可享受限時免費服務,登錄百度智能雲千帆ModelBuilder即可快速體驗。同時,百度還融入自身大模型技術,比如將DeepSeek模型融合千帆推理鏈路,集成百度獨家內容安全算子,實現模型安全增強保障。

記者瞭解到,包括華為雲、騰訊雲、360數字安全、雲軸科技ZStack等多家國內AI公司已接入DeepSeek模型,相當於DeepSeek模型幾乎成了主流AI雲平臺服務的標配。

DeepSeek一路“狂飆”的同時,AI大模型業內逐漸進入“拉力賽”。

1月29日,阿里通義千問上線旗艦級模型Qwen2.5-Max,採用超大規模MoE(混合專家)架構,基於超過20萬億token(詞元)的預訓練數據。阿里團隊表示,該模型均展現出與DeepSeek V3、GPT-4和Claude-3.5-Sonnet比肩,甚至領先的性能。隨著後訓練技術的不斷進步,下一個版本將有望達到更高水平。

2月1日,OpenAI上線o3-mini,這是OpenAI首款支持開發者需求功能的小型推理模型,具備低成本、低延遲優勢,並支持函數調用、流式傳輸、結構化輸出等功能,還支持與搜索功能結合,能夠提供最新答案並鏈接至相關網絡資源。經過部分開發者的測試後發現,OpenAI o3-mini性能與DeepSeek R1相比沒有明顯優勢,部分環節仍被R1反超。

(文章來源:上觀新聞)

來源:東方財富網

作者:上觀新聞

DEEPSEEK-4.11%
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)