當推理成為稀缺的資源, 誰能捕捉到它

2026/06/09 04:26
🌐zh-Hant
當推理成為稀缺的資源, 誰能捕捉到它

作者 :傅法蘭克监督办

 

2023年,大衛·卡恩暗示洞从未填滿在訓練方面. 過去幾周, 市場才開始將它纳入價格。 殷維達重新集結財務 以"服務符號"為中心心臟病20次超過要求, 當推理變成稀缺資源時, 數值會沉淀在計算器的哪一層 。

一、跟隨GPU:從2000亿美元到600亿美元

2023年,塞奎亞的David Cahn提出了掛在整個AI大樓上的問題,即"十億美元問題". 每一美元花在GPU上, 他發現在「投入」和「最终用户付款」之間, GPU超過需求。

一年后,差距有所扩大,而不是缩小。 在2024年的续作中,卡恩将它重新定义为"600億美元問題",与超大制造商CapEx的擴張. 一個熟悉的空邏輯外形: 過量建造導致供應過量。

這兩篇文章都問同樣的問題:誰能填滿這個洞? 答案從未出現在 "鐵路" 一邊的書中 市場在過去幾週才開始將它算作價值。

二. Cerebras IPO和推理

切雷斯于星期四上市. 這一次IPO收到超過20倍的申請, 需求並非來自下一個Nvidia兇手的賭注。

Cerebras的才華是芯片結構 使推理非常快 不是訓練,是推理 這就是華爾街的動機 市場是常見的, Claude每次回答一個問題 每次蚂蚁執行任務 都會耗盡計算能力 訓練只發生一次 推理永不停止。

J. P. Morgan估計參考市場的大小是訓練的10至50倍。 當機器從其他機器開始執行任務,也就是以解剖學的形式擴展,參考需求不再隨使用者的數量而增長,而是隨著微分本身而增長。

三. Nvidia 重畫地圖: 推理成為頭條

如果Cerebras是市場的醒來 那么Nvidia的最近一季就是從鐵鏈的頂端證實 在最近一次財政會議上, Jensen Huaang說得很清楚:AI的需求正在以抛物主義的方式增长。 原因很简单:我又不會這麼做已經來了 主流AI從一次性推理轉而為逻辑推理, 黄帝曰:"托肯斯今有利. 在AI時代,計算能力是收入和利润。

它重塑了整個業務 訓練是建模的一次性成本。

Nvidia將此判斷寫入她的財政報告。 數據中心與邊緣銷售。 數據中心(本季約750億美元, 而92%)被拆解至Hyperscale(約380億美元, 包括PC、工作站、AI-RAN基地站、機器人及汽車等真正運行的終站。

但Nvidia已與數據中心一同升格為第二平台。 意識是推論被分成兩個方面, 數據中心的Claud推論, 路由圖遵循了同樣的理論維拉·魯賓另外,黃給Vera CPU提供了全新的2000億塔姆,而Vera CPU的設計是用于麻醉載荷. 各一線模范公司预计首日全面轉投。

當地球上最有價值的企業 重整了他們在"服務符號"上的財產披露時 瓶颈就解決了 這篇論文的其余部分。

先做個描述 提供外部 API 代碼服務。 Endpoint指的是裝置本身內的一個局部芯片(Jetson, RTX, Drive, AI-RAN), 請將它視為一個平滑的方法 放大整個經濟 支持瓶颈雙曲Vince在市場上 他們完全在云線上。

四 que已到

Anthropic是煤礦中的金絲雀 Claude對「腦葉」的抱怨, 2026年5月, Anthropic從SpaceX接管了整個Colossus 1數據中心, 220,000 + Nvidia GPU, 300+ MW。

這部分的容量會解鎖一系列的上限變更, 每個都是一個信號 。 5月6日,Anthropic把Claude Code的5小時限制翻了一番,取消了高峰期限,大大提高了Opus的API限制. 5月13日,Claude Code的周限又提高了50%(至7月13日)。 使用無頭模式claude-p, CI從平面訂單中流過水線, 并將它們放在一個獨立計算的信用池(按API價格每月20-200美元), 蚂蚁比平面訂閱的設計耐受性要快得多, 所以它必須按其最初的"常年成本"來定价。

培训是一次性的基建支出。 推論是每名新使用者和每名新代表的经常性運作成本。

五. 倉庫:六層,一個瓶颈

每一個AI應用程式都位于一個供應鏈中

大多數公司只有一家 Nvidia擁有硅, CoreWeave 擁有裸體金屬, 共同AI有推理优化, OpenRouter 有模型 API 路由。

除了一個。

六. 雙曲:唯一的三级公司

2025年6月, 在前幾個月, 開發者數已超過20萬+。

有趣的是它的結構。

Hyperbolic 擁有未持有的 GPU 。 每張卡片都來自Neocloud和數據中心,包括CoreWeave,Lambda Labs,Nebius和容量空闲的小型操作員. 聽起來很虛弱,但這是護城河。

在GPU供應商與消費商之間, 它知道誰買GPU 以什麼價格,在什麼時間。 在超量供應開始之前。

今天,護城河本身是多層聚落。 雙曲將數以十計的獨立雲和數據中心 的碎片產生能力接合成一個标准化的統一池, 讓開發者可以在任何地方租用最便宜的GPU, 云越到,流水越多,數據價值越高 未來團隊正在探索如何利用這些資料建模GPU價值曲線, 最後投資自己的資金, 以平靜供求。

這是輪子:

  1. 得到更多云, 更多的總供應

  2. 更多供應,更深的市場和实时定价資料

  3. 更好的數據 更聰明的路徑 更長的定价模型

  4. 更方便的行動和物價 更多的開發者 更多的雲

沒有其他公司嘗試過這個 Hyperbolic是唯一跨過GPU租赁,部署和模型API層的公司。

文斯此镜

威尼斯是經濟在應用層面最清晰的表示, 它是一個隱私优先推理應用程式: OpenAI 兼容的 API 集, 加上面向消费的訂閱(Free / Pro / Pro+ / Max), 引领了約75個型號的請求, 其中約三分之二是開源型號或自寄型號(Llama, Mistral, Quen, DeepSeek), 其余是匿名的闭源邊緣型號的傳真. 重點是文斯沒有有意义的微积分 它的GPU合作者和機密計算供應商(NEAR AI Cloud, Phala)通过前身實驗室租用并付費。

Vince真的賣了隱私 而非保留數據、不訓練、要求匿名, 以及部分撞上TEE, 讓操作員看不到。 其底部是路面負载, 而這層保證是分層的和不均匀的:在自己控制下或在TEE GPU上運作的開源模型可以從光谱的末端到末端來計算;但克勞德,GPT等關閉源模型的匿名通過,隱私只會剥离你的身份,而你的原始提示仍然在前身實驗室的末端處理中. 因此最強的隱私只涵盖開源, 威尼斯的毛利語 = 訂價 – 下游為推論付出的價格。

令牌設計包裝了這部分要求 。 威尼斯運行兩種標語:VVVV(代碼和平台存取)和DIEM, 費用訂單會啟動可編程回购VVVs(Pro / Pro+ / Max, 分别为 2/ 5 / 10 美元), 4月和5月, 約1030萬美元被摧毀, 6月, 它慢慢攀升到约1.1億美元。

基本表面比標題更健康. 公開流傳的7000萬ARR的數值几乎可以肯定, 這項行動是真實的:約13萬6000個貨幣位址、每月990萬次網站訪問(每天約33萬次), 這是一項真正的生意。

所以超曲棍球在它的上面。 如果文斯是加油站, 超曲棍球是炼油廠。 威尼斯的購買力與所有人所依赖的相同; 因為需求增加, 價值的积累不僅是用于消耗計算應用程式。

為什麼這很重要

Nvidia已依據「服務符號」重新調整財政。 Cerebras的IPO證明了市場已經明白, 炭疽病很嚴重, 經過雲端和末端。

它有另一邊的"600億美元問題"戒指 Cahn的空邏輯,即过度建築,然后能力过剩,有可能最终被驗證. 當GPU價格下跌, 供應品的碎裂散佈在數以百計的雲中時, 雙曲比空的還多。

總算贏了的公司不是GPU最大的公司, 而是能告訴你哪些GPU在哪裏。

雙曲正在建立這家公司 他們不擁有GPU,他們是軟體,它們在三層深處,但它們被制成推測的極端微积分。

QQlink

No crypto backdoors, no compromises. A decentralized social and financial platform based on blockchain technology, returning privacy and freedom to users.

© 2024 QQlink R&D Team. All Rights Reserved.