當推理成為稀缺的資源, 誰能捕捉到它

2026/06/09 14:07
👤ODAILY
🌐zh-Hant

最終贏的公司不會是GPU最大的公司. 。

當推理成為稀缺的資源, 誰能捕捉到它

原著:傅法蘭

资料来源:IOSG Ventures

2023年,大衛·卡恩暗示洞从未填滿在訓練方面. 過去幾周, 市場才開始將它纳入價格。 由於年輕的Waida重新整理了「服務符號」的財務, 當推理變成稀缺資源時, 數值會沉淀在計算器的哪一層 。

追隨GPU:從2000億到600億

2023年,塞奎亞的David Cahn提出了掛在整個AI大樓上的問題,即"十億美元問題". 每一美元花在GPU上, 他發現在「投入」和「最终用户付款」之間, GPU超過需求。

一年后,差距有所扩大,而不是缩小。 在2024年的续作中,卡恩将它重新定义为"600億美元問題",与超大制造商CapEx的擴張. 一個熟悉的空邏輯外形: 過量建造導致供應過量。

這兩篇文章都問同樣的問題:誰能填滿這個洞? 答案從未出現在 "鐵路" 一邊的書中 市場在過去幾週才開始將它算作價值。

Cerebras IPO和推理壓制

切雷斯于星期四上市. 這一次IPO被超過20倍, 需求並非來自下一個Nvidia兇手的賭注。

Cerebras的才華是芯片結構 使推理非常快 不是訓練,是推理 這就是華爾街的動機 市場是常見的, Claude每次回答一個問題 每次蚂蚁執行任務 都會耗盡計算能力 訓練只發生一次 推理永不停止。

J. P. Morgan估計參考市場的大小是訓練的10至50倍。 當機器從其他機器開始執行任務,也就是以解剖學的形式擴展,參考需求不再隨使用者的數量而增長,而是隨著微分本身而增長。

Nvidia 重排: 推理成為頭條

如果Cerebras是市場的醒來 那么Nvidia的最近一季就是從鐵鏈的頂端證實 在最近一次財政會議上, Jensen Huaang說得很清楚:AI的需求正在以抛物主義的方式增长。 原因很簡單, 主流AI從一次性推理轉而為逻辑推理, 黄帝曰:"托肯斯今有利. 在AI時代,計算能力是收入和利润。

它重塑了整個業務 訓練是建模的一次性成本。

Nvidia將此判斷寫入她的財政報告。 數據中心與邊緣銷售。 數據中心(本季約750億美元, 而92%)被拆解至Hyperscale(約380億美元, 包括PC、工作站、AI-RAN基地站、機器人及汽車等真正運行的終站。

但Nvidia已與數據中心一同升格為第二平台。 意識是推論被分成兩個方面, 數據中心的Claud推論, 路由圖遵循同樣的邏輯:從第三季度起,薇拉·魯賓可能高达布莱克威爾推論的35倍; 黃 also也為Vera CPU提供了全新的2000億TAM, 各一線模范公司预计首日全面轉投。

當地球上最有價值的企業 重整了他們在"服務符號"上的財產披露時 瓶颈就解決了 這篇論文的其余部分。

先做個描述 提供外部 API 代碼服務。 Endpoint指的是裝置本身內的一個局部芯片(Jetson, RTX, Drive, AI-RAN), 將它看成一個平滑的方式來放大整個經濟, 支持瓶颈, 而不是超博力和威尼斯的集市。

塞住了

Anthropic是煤礦中的金絲雀 Claude對「腦葉」的抱怨, 2026年5月, Anthropic從SpaceX接手了整個Colossus 1數據中心, 220,000 + Nvidia GPU, 300 + MW。

這部分的容量會解鎖一系列的上限變更, 每個都是一個信號 。 5月6日,Anthropic把Claude Code的5小時限制翻了一番,取消了高峰期限,大大提高了Opus的API限制. 5月13日,Claude Code的周限又提高了50%(至7月13日)。 使用無頭模式claude-p, CI從平面訂單中流過水線, 并將它們放在一個獨立計算的信用池(按API價格每月20-200美元), 蚂蚁比平面訂閱的設計耐受性要快得多, 所以它必須按其最初的"常年成本"來定价。

培训是一次性的基建支出。 推論是每名新使用者和每名新代表的经常性運作成本。

這個倉庫,六層,一個瓶颈

每一個AI應用程式都位于一個供應鏈中

大多數公司只有一家 Nvidia擁有硅, CoreWeave 擁有裸體金屬, 共同AI有推理优化, OpenRouter 有模型 API 路由。

除了一個。

雙曲: 跨越三層的唯一公司

2025年6月, 在前幾個月, 開發者已超過20萬+。

有趣的是它的結構。

Hyperbolic 擁有未持有的 GPU 。 每張卡片都來自Neocloud和數據中心,包括CoreWeave,Lambda Labs,Nebius和容量空闲的小型操作員. 聽起來很虛弱,但這是護城河。

在GPU供應商與消費商之間, 它知道誰買GPU 以什麼價格,在什麼時間。 在超量供應開始之前。

今天,護城河本身是多層聚落。 雙曲將數以十計的獨立雲和數據中心 的碎片產生能力接合成一個标准化的統一池, 讓開發者可以在任何地方租用最便宜的GPU, 云越到,流水越多,數據價值越高 未來團隊正在探索如何利用這些資料建模GPU價值曲線, 最後投資自己的資金, 以平靜供求。

這是輪子:

  1. 得到更多云, 更多的總供應
  2. 更多供應,更深的市場和实时定价資料
  3. 更好的數據 更聰明的路徑 更長的定价模型
  4. 更方便的行動和物價 更多的開發者 更多的雲

沒有其他公司嘗試過這個 Hyperbolic是唯一跨過GPU租赁,部署和模型API層的公司。

文斯,這面鏡子

威尼斯是經濟在應用層面最清晰的表示, 它是一個隱私优先推理應用程式: OpenAI 兼容的 API 集, 加上面向消费的訂閱(Free / Pro / Pro+ / Max), 引领了約75個型號的請求, 其中約三分之二是開源型號或自寄型號(Llama, Mistral, Quen, DeepSeek), 其余是匿名的闭源邊緣型號的傳真. 重點是文斯沒有有意义的微积分 它的GPU合作者和機密計算供應商(NEAR AI Cloud, Phala)通过前身實驗室租用并付費。

Vince真的賣了隱私 而非保留數據、不訓練、要求匿名, 以及部分撞上TEE, 讓操作員看不到。 其底部是路面負载, 而這層保證是分層的和不均匀的:在自己控制下或在TEE GPU上運作的開源模型可以從光谱的末端到末端來計算;但克勞德,GPT等關閉源模型的匿名通過,隱私只會剥离你的身份,而你的原始提示仍然在前身實驗室的末端處理中. 因此最強的隱私只涵盖開源, 威尼斯的毛利語 = 訂價 – 下游為推論付出的價格。

令牌設計包裝了這部分要求 。 威尼斯運行兩種標語:VVVV(代碼和平台存取)和DIEM, 費用訂單會啟動可編程回购VVVs(Pro / Pro+ / Max, 分别为 2/ 5 / 10 美元), 4月和5月, 約1030萬美元被摧毀, 6月, 它慢慢攀升到约1.1億美元。

基本表面比標題更健康. 公開流傳的7000萬ARR的數值几乎可以肯定, 每月有990萬次網站訪問(每天約33萬次), 這是一項真正的生意。

所以超曲棍球在它的上面。 如果文斯是加油站, 超曲棍球是炼油廠。 威尼斯的購買力與所有人所依赖的相同; 因為需求增加, 價值的积累不僅是用于消耗計算應用程式。

為什麼現在這很重要

Nvidia已依據「服務符號」重新調整財政。 Cerebras的IPO證明了市場已經明白, 炭疽病很嚴重, 經過雲端和末端。

它有另一邊的"600億美元問題"戒指 Cahn的空邏輯,即过度建築,然后能力过剩,有可能最终被驗證. 當GPU價格下跌, 供應品的碎裂散佈在數以百計的雲中時, 雙曲比空的還多。

總算贏了的公司不是GPU最大的公司, 而是能告訴你哪些GPU在哪裏。

雙曲正在建立這家公司 他們不擁有GPU,他們是軟體,它們在三層深處,但它們被制成推測的極端微积分。

QQlink

Tidak ada "backdoor" kripto, tidak ada kompromi. Platform sosial dan keuangan terdesentralisasi berdasarkan teknologi blockchain, mengembalikan privasi dan kebebasan kepada pengguna.

© 2024 Tim R&D QQlink. Hak Cipta Dilindungi Undang-Undang.