點評Gartner全球AI平台魔力像限:火山引擎被讚,谷歌高過OpenAI

作者| 高飛

剛看到Gartner發了首份《AI應用開發平台魔力像限》(Gartner MQ)(見圖),讀了一下,報告信息量還是不小的,翻譯解讀一下。

該圖片來自火山引擎公眾號,已獲得火山引擎轉載授權

先做個背景介紹。Gartner MQ是什麼?它從“落地能力”和“戰略完整性”兩個維度給全球廠商打分畫象限,分成領導者、挑戰者、遠見者、利基玩家四個陣營。這套方法論可以追溯到1980年代,創始人Gideon Gartner最初只是在內部會議上用來做市場速覽,1994年才正式對外發布。魔力像限是企業CIO等群體選型時參考權重很大的第三方報告之一,有上百個技術領域。但是評價AI應用開發平台,可能是一個信號:全球大模型市場已經從“混戰期“進入“分化期”,需要被正式排座次了。

10個要點

1

中國廠商存在感很強,火山引擎在挑戰者象限的位置很亮眼

中國廠商在這份報告中表現突出,火山引擎、阿里雲、騰訊雲均入選挑戰者象限。其中,火山引擎在該象限中“落地能力”得分最高;在“多模態應用開發能力”上,全球第四。值得注意的是,這份報告的入選門檻極高:AI應用開發平台年營收至少1億美元。這意味著很多知名的AI創業公司都被擋在門外。 Cohere(企業級大模型明星公司)、CrewAI(Agent框架新銳)、Dify(開源LLMOps平台)均因營收未達標而落選。 CoreWeave雖然入選,但因為剛完成對Weights & Biases的收購、整合尚未完成,被歸入利基玩家。換句話說,入選的廠商都是在和全球最成熟的玩家同台競技。我覺得可以補充的一個背景是,之前根據斯坦福大學HAI的2025年AI指數報告,在中國(83%)、印度尼西亞(80%)等亞洲國家,大多數民眾認為人工智能產品和服務帶來的好處多於危害。相比之下,在加拿大(40%)、美國(39%)和荷蘭(36%)。也就是說,中國比美國高出44個百分點,這種樂觀是是否是一種加持?

2

火山引擎不是傳統雲廠商,它是字節跳動的技術外溢所以單獨說一下火山引擎,揣測一下為什麼火山引擎能在報告中拿到這個位置。2020年火山引擎成立時,它的核心能力來自字節跳動在內容平台上的積累:推薦算法、高並發處理、視頻編解碼、A/B測試方法論。這些能力被產品化,對外輸出給企業客戶。到了大模型時代,這種外溢也隨之變化。豆包大模型本身就是字節跳動內部業務(豆包APP、抖音、飛書)的底座,火山方舟則是把這套AI基礎設施開放給外部企業。所以火山引擎的邏輯始終是“內部先用、驗證有效、再對外輸出”。它不是從IaaS層往上打,而是從應用層往下延伸。這個基因決定了它天然懂:“如何讓AI創造業務價值”,而不僅僅是“如何提供算力”。

3

這份報告的核心命題:模型強≠平台強報告中,OpenAI是遠見者,不是領導者。估計是很多人看報告會困惑的點。但是,我覺得其實一點都不奇怪。因為在我的印像中,OpenAI其實更像一個互聯網公司,而非AI平台公司。印像中,山姆·奧特曼出來做訪談,常說DAU這些數字,而且也認命了消費業務CEO,還拉來蘋果前首席設計師Ivy做消費硬件。從開發者的角度,Anthropic的存在感早就強過OpenAI了。但是Anthropic並不在像限中。我想是因為雖然Anthropic 提供了強大的Claude 模型API 和Workbench(工作台),但在Gartner 的評估週期內,Anthropic 更多被視為一家基礎模型供應商(Model Vendor)。其主要的應用開發功能(如復雜的RAG 編排、多模型路由、企業級治理)通常是依賴合作夥伴(如AWS Bedrock 和Google Vertex AI)來實現的,而不是通過Anthropic 自身的獨立平台提供的全棧服務。繼續說OpenAI,Gartner也提出,OpenAI的企業級支持結構比同類精簡(沒有正式的客戶顧問委員會),缺乏混合雲/私有化部署能力,且部分客戶表示正在尋找替代平台。換句話說,OpenAI “企業級開發平台”的味道也比較淡。但對財富500強的CIO來說,24/7專屬支持、SLA保障、數據主權,這些“乏味”的東西比模型MMLU得分重要得多。這個判斷框架也適用於理解整份報告:Gartner評估的不是“誰的模型最聰明”,而是“誰能讓企業把AI用起來”。

4

接下來說一下,四大領導者各有什麼特點?AWS的亮點是在Bedrock Guardrails中引入了“神經符號AI”的自動推理,用數學驗證而非概率判斷來對抗模型幻覺,號稱准確率99%。這解決了金融、醫療等行業對確定性的剛需。Google力推Agent2Agent協議,想成為AI智能體時代的“TCP/IP制定者”。如果未來不同廠商的智能體需要互相通信、協作,Google希望這個協議是標準。微軟的優勢在於Azure AI Foundry的開發者體驗,特別是Visual Studio Code的深度集成。但報告也指出,微軟的很多重要發布基於OpenAI的技術,且在Gartner Peer Insights上的服務支持評分低於其他領導者。IBM則走了一條“開放路線”,把所有Granite模型以Apache 2.0許可開源,並推出了開源的BeeAI智能體框架。感慨一下,IBM和微軟真是從IT時代走過數字化轉型時代,再到大模型時代,代表老牌公司的企業級底蘊。四家領導者的共同點是:都在試圖定義某種“標準”。 AWS定義安全標準,Google定義協議標準,微軟定義開發者體驗標準,IBM定義開源標準。

5

火山引擎的技術護城河:一套解決“從模型到應用”的組合拳再說回火山引擎,報告特別提到了火山引擎的三個核心產品:veRL、HiAgent、PromptPilot。其實,這三個產品不是並列關係,而是一條完整的價值鏈:veRL解決的是“模型怎麼變聰明”。它是火山引擎開源的強化學習框架,讓企業能夠用自己的業務數據和目標函數,把通用大模型訓練成懂行業的專用模型。HiAgent解決的是“智能體怎麼搭建”。它支持“意圖驅動的智能體創建”,開發者用自然語言描述需求,比如“創建一個能根據用戶位置推薦餐廳並完成預訂的助手”,HiAgent能自動將其轉化為可測試、可部署的服務。PromptPilot解決的是“應用怎麼調優”。它把提示詞工程變成了一個正經的IDE,支持版本控制、A/B測試、效果對比。在AI應用裡,提示詞就是源代碼,需要被嚴肅管理。這套組合拳的邏輯是:先用veRL讓模型具備行業能力,再用HiAgent快速搭建智能體應用,最後用PromptPilot持續優化效果。從模型層到應用層到運維層,全覆蓋。

6

veRL:強化學習框架為什麼是最硬核的一環報告把RL作為一個相當的要點去提。當然也很合理。畢竟AI競爭正在從“預訓練”轉向“後訓練”。預訓練給模型打基礎,但要讓模型真正具備複雜推理能力、理解業務目標,需要強化學習(RL)。問題是,大規模RL訓練是一項工程浩劫。需要同時維護Actor、Critic、Reward、Reference四個模型,頻繁進行數據交換和狀態同步。veRL的核心論文HybridFlow被系統領域頂會EuroSys 2025接收。它的關鍵技術是3D-HybridEngine。在RL訓練中,模型需要在“生成階段”和“訓練階段”之間頻繁切換,傳統架構會產生大量顯存冗餘和通信開銷。 3D-HybridEngine通過高效的actor model resharding,消除了這種冗餘,實現了SOTA級別的吞吐量。說人話就是:同樣的GPU資源,veRL能比其他框架多訓練好幾倍的數據。不過,雖然這個工具很不錯,但對很多企業而言,到底是把資源投入到模型微調,還是上下文工程,應該是一個比較難抉擇的題目吧。

7

永久授權,這一個容易被忽視的商業模式差異再說到商業模式,火山方舟支持公有云SaaS、私有化部署,以及永久授權(Perpetual License)。這在當前訂閱制盛行的SaaS市場中是一個亮點。對於金融等偏好一次性資本支出(CapEx)而非長期運營支出(OpEx)的行業,永久授權是殺手鐧。另外,報告還提到,火山引擎的直銷團隊執行效率極高,平均交易閉環時間僅為數週。相比於依賴漫長諮詢流程的傳統IT廠商,這種“短平快“的銷售節奏反映了其產品的高標準化程度。 (這也是互聯網基因起作用吧)

8

火山引擎的行業版圖,藏著字節跳動的底色上邊我們講過,火山引擎是字節跳動的技術外溢而創立的,報告談到,火山引擎增長最快的兩個垂直領域是“科技公司(包括設備製造商和機器人)”和“零售電商”,也能體現這個基因。科技硬件方面,機器人和智能硬件對網絡延遲極其敏感,火山引擎在邊緣計算和低延遲上的優勢,結合其能夠部署在端側的模型能力,使其成為“具身智能”廠商的理想合作夥伴。據公開信息,全球Top10手機廠商有9家和火山引擎深度合作。零售電商也是火山引擎的“主場”之一。它在電商推薦、智能客服、營銷內容生成方面擁有實戰經驗。利用veRL框架,零售企業可以訓練出具備“推銷技巧”的AI導購,而不僅僅是處理售後問題的客服。此外,據火山引擎披露的數據,其在汽車行業覆蓋超九成主流車企,在金融行業服務八成頭部券商和系統重要性銀行,在教育行業與超七成985高校達成合作。

9

飛輪效應:調用量、收入、產品三個維度的正向循環除了Gartner這份報告,還有一些公開數據可以交叉驗證這個領域市場飛輪效應的重要性。IDC數據顯示,2025上半年中國公有云大模型服務市場,火山引擎佔49.2%份額。按此計算,中國公有云上每兩個Tokens中有一個由火山引擎生產。這裡解釋一個概念:大模型公有云服務市場。這個市場指的是企業通過雲平台調用大模型API的服務。你不需要自己買GPU、自己部署模型,而是按調用量付費。這是目前大多數企業使用大模型的主流方式,也是AI商業化的一個核心戰場。所以:調用量大→業務場景豐富→模型迭代快→產品體驗好→收入高→有資源持續投研發→調用量更大。從目前了解到的情況看,這種飛輪效應是火山引擎當前增長勢能的核心來源。

10

深層信號:AI開發平台的競爭進入工程化階段最後,這份報告釋放的核心信號是:大模型競爭已經從“拼參數”進入“拼工程”。因為對AI行業落地而言,模型能力重要,但它是前提條件之一,而不是唯一的決勝因素。在模型能力趨於同質化的背景下,企業客戶開始更關注:你的智能體框架是否完善?多模態交互是否穩定?能否過合規審查?成本能否算得過賬?這份Gartner報告本質上是在說:大模型時代的雲計算格局正在被重塑。一些競爭發生在IaaS層,另一些競爭則發生在MaaS層。對行業來說,這或許意味著“AI雲“正在成為一個獨立的賽道,而不是傳統雲計算的附屬品。

分享你的喜愛