推論がスカースリソースになるとき、値をキャプチャしますか

2026/06/09 04:22
🌐ja
推論がスカースリソースになるとき、値をキャプチャしますか

著者:フラン・フIOSGについて

 

2023年、デビッド・カーンは、トレーニング面に穴が入らないことを示唆しました。 推論に含まれていますが、市場は過去数週間の価格設定に始まったばかりです。 Yin Weidarが「サービストークン」の周りの財務をリグループ化したとき、セレブラスそれは20回以上必須です、ボトルネックの戦いは上にあり、実際の問題は次です。 推論がスカースリソースになると、計算のどのレベルで値が入金されます。

I. GPUをフォロー:200億ドルから60億ドル

2023年、セコイアのデビッド・カーンがAIビル全体にハングアップした問題「億ドル問題」を提起しました。 GPUに費やされた各ドルと、データセンターでパワーを費やした約別のドルは、毎年GPU CapExは、チップが最終的に約200億ドルを調達して資本を回復しなければならないことを意味します。 人工知能の収入の非常に寛大な前提を持つにもかかわらず、彼は「インプット」と「エンドユーザー決済」の間に1億5億ドルを超える穴を発見しました。 問題は明らかです:GPUは、実際の需要の先で構築されています。

1年後、狭いのではなくギャップが広くなっています。 2024年の継続では、Cahnは超大型メーカーCapExの拡大に伴い、「60億ドル問題」として再定義しました。 空の論理の馴染みのある形状:過剰な構造は、資本を焼くオーバースプライにつながります。

どちらの記事も同じことを尋ねます:この穴を埋めるつもりですか? 「緊張」側の本には、答えが現れない。 それは推論の側面に現れ、市場は過去数週間の価格設定に始まったばかりです。

ii. Cerebras IPOと推論スクイズ

木曜日にセレブラスが紹介されました。 今回、IPOは20倍の過剰な要件を受け取り、価格は水曜日の最終増加がほぼ倍増しました。 需要は、次のNvidiaキラーに賭けから来ませんが、より単純なものから:市場は、AIの実質のボトルネックが侵入していることを認識し始めています, 訓練ではありません。

Cerebrasの才能は、非常に迅速に推論するチップ構造です。 訓練ではなく、推論。 それはウォールストリートをオンにしているものです。 市場が再稼働し、利用状況で拡大します。 Claudeが質問に答えるたびに、すべての人がミッションを約束し、コンピューティングを排出しています。 訓練は一度だけ起こり、推論は止まらない。

J.P.モルガンは、トレーニングのサイズが10〜50倍の基準市場の規模を推定した。 マシンは、解剖学の形で展開する他の機械からその使命を実行し始めるとき、参照の要求はもはやユーザーの数で拡大しませんが、計算自体で。

3。 地図を再描画する:推論は見出しになります

Cerebrasが市場の目覚めである場合、Nvidiaの最新の季節はチェーンの上部から確認されています。 最新の財務会議では、Jensen Huaangは、未発表の声明をクリアした:AIの要求は、パラボリックファッションで成長しています。 理由は簡単です:こうやってみたいじゃないすでに来ています。 主流AIは、1回限りの推論から論理的な推論へと移行し、独自のツールを呼び出し、タスクを整理するプロセスへと移行しました。 Huang氏は、「トークンは今、収益性があります。 AI時代では、計算する能力は収入と利益です。

業界全体を再構築しています。 トレーニングはモデルの構築のワンタイムコストで、今日のボトルネックは引き起こされず、訓練されていない間、参照はそれを実行する再現在のコストです。

Nvidiaは、この判断を財務ステートメントに書きました。 データセンタとエッジマーケティングの2つのプラットフォームで公開されました。 データセンター(現在の季節に約75億ドル、約1セントあたり+92に比べ)は、さらにハイパースケール(約38億ドル、約1セントあたり+12に相対)およびACIEに分解され、AIクラウド、業界および企業(約37億ドル、約1セントあたり+31)。 全く新しいラインはエッジコンプシアンです:PC、ワークステーション、AI-RANの基地局、ロボットおよび車のような偽りなく動くターミナルをカバーする$ 6.4億、+ 29パーセント。

エッジはまだ合計所得の8パーセント未満のアカウントが、Nvidiaはデータセンターと一緒に2番目のプラットフォームに上昇しました。 信号は、インフェレンスが2つの正面に分割され、データセンターの不正侵入、エッジのエンドポイントの推論、AIは物理的な世界で見て、移動して行動することです。 ロードマップは、第3四半期から同じロジックに従いますVera ルビン加えて、Huang は、Vera CPU 用の真新しい $200 億 TAM を提供しました。これは、アナタリック負荷のために設計されています。 先日は、各モデル会社がフルシフトを期待しています。

惑星の最高値の企業が「サービストークン」の周りの財務開示を再編成したとき、ボトルネックは解決しました。 この論文の残りの部分は、参照(トレーニングよりもむしろ)がスカースリソースになるときに値をキャプチャする者と取引します。

最初にスキャッピングノート。 両面では、CDU と、外部の API トークン サービスを提供するレンタルデータセンターを扱っています。 エンドポイントは、GPSリースとポリマーなしで完全に実行されるデバイス自体(Jetson、RTX、Drive、AI-RAN)内のローカルチップを指します。 ここでは、ボトルネックをサポートするために、経済全体を拡大するためのスムーズな方法として考慮してくださいハイパーボリックVinceは市場で、彼らは完全にクラウドライン上にいます。

4月4日 スクイーズが到着しました

Anthropicは石炭鉱山のカナリアです。 設定済みの容量をはるかに超えるClaudeのクレームは、制限されたフロー応答、遅い推論、圧縮されたコンテキストウィンドウを含む、すべてのWeb上にあります。 Solving は 2026 年 5 月、Anthropic は、Colossus 1 データセンター全体、Nvidia GPU、300+ MW の 220,000 から取り引きされ、それに推論に専念し、訓練しません。

容量のこの部分は一連の帽子の変更を、信号である各鍵を開けます。 5月6日、AnthropicはClaudeコードの5時間の制限を2倍にし、ピーク時間制限を削除し、OpusのAPI制限を大幅に増加させました。 5月13日には、クロードコードの週単位の制限が1セント(13 7月まで)別の50で上昇しました。 続いて、6月15日の時点で、Agent SDK、no-headモードのclaude-p、CIのストリーミング水ラインをフラットサブスクリプションから使用し、独立して測定されたクレジットプール(APIで1か月あたり$ 20-200)に置いた。 この最後のステップは、引数のセット全体をアクションに凝縮しました。 ant は、フラットサブスクリプションの設計公差よりもはるかに高速なレートで推論を消費するので、元の "再発コスト" に従って値付けする必要があります。

研修は1回限りの資本金です。 インフェレンスは、新しいユーザーと新しいデレゲートのそれぞれにaccrues再発運用コストです。

V。 倉庫: 6 つの床、1 つのネック

各AIアプリケーションは、TSMCクリスタルサークルプラントから始まり、APIエンドポイントで終わるサプライチェーンにあります

ほとんどの企業は、そのうちの1つです。 Nvidiaはシリコンを所有し、CoreWeaveはnudityの金属を所有し、AIは最適化を推論しましたり、OpenRouterにモデルAPIルートがあります。

1つを除いて。

VI. Hyperbolic:唯一の3層の会社

Hyperbolicは6月2025日にGPU市場を発売しました。 最初の数か月で、前線のAIラボ、検索、および大規模なコンシューマーレベルのプラットフォームを使用して、開発者の数が200,000を超える。

興味深いのは、その構造です。

Hyperbolic は GPU を保有していません。 各カードは、CoreWeave、Lambda Labs、Nebius、およびIDle容量の小規模なオペレータを含むNeocloudおよびデータセンターから来ています。 弱さのように聞こえますが、モアットです。

GPUのサプライヤーと消費者の間で座ることで、Hyperbolicは、他に誰も見られないリアルタイムデータを見ることができます。 GPUが何の価格で何を買うか、何時に知っている。 過剰供給が開封される前に、市場への需要が高まっていた。

今日、モット自体はマルチクラッド集計です。 Hyperbolicは、スタンドアローンクラウドとデータセンターの数十から、デブリの生産能力を標準化された統一プールに拡張し、各オペレータと交渉したり、アカウントのパイルを管理することなく、開発者が最も安い利用可能なGPUをどこでもレンタルすることができます。 到達するより多くの雲、それがより多くの流体、それがより多くの価格のデータです。 将来、チームはこれらのデータをGPU価格曲線をモデル化し、最終的には、供給と需要を円滑にし、物理的な計算でマーケターの役割を果たすために、独自の資本に投資する方法を探求しています。 しかし、この目標は初期段階にあり、今本当に回復しているポリマー層です。

これは車輪です:

  1. より多くの雲、より多くの総計の供給にアクセスして下さい

  2. より多くの供給、より深い市場および実時間価格データ

  3. より良いデータ、よりスマートなパス、より長い価格設定モデル

  4. より良いモビリティと価格、より多くの開発者、アクセスするより多くのクラウド

他社がやっていません。 Hyperbolic は GPU リース、デプロイメント、モデル API レイヤーの両方で実行する唯一の企業です。

VIIプロフィールこのミラー

ヴェネツィアは、アプリケーションレベルで経済の最も明確な表現であり、Hyperbolicの場所への有用なコントラストです。 消費者指向のサブスクリプション(Free / Pro / Pro + / Max)と一緒に、OpenAI互換のAPIのアプリケーションを推論するプライバシー優先性であり、約75モデルへのリクエストをリードし、約2分の3分の1がオープンソースまたはセルフホストモデル(Llama、Mistral、Qwen、DeepSeek)であり、残りはクローズドソースフロンティアモデルの匿名FAXです。 その点は、バイスは意味のある計算を持たない。 これまでに公開された GPU コラボレーターと機密コンピューティング サプライヤー (NEAR AI Cloud, Phala) は、それをレンタルし、フロントラボを通じて支払いました。そのため、アクセスの実質のコストは、SaaS ホスティングではなく、劣っています。

Vinceは本当にプライバシーを販売しています。 「privileged」という用語は、パブリックコンピューティングをプライベートプロパティに変えることではなく、商用化の論理に対する保証の層を追加することではなく、データを保存し、訓練し、匿名性を求め、オペレータがそれを見ていないように、TEEに実行する部分的なものではありません。 ボトムファクターはロードロードであり、追加価格はプライバシーパッケージのこのレイヤーです。 そして、この保証の層はレイヤー化され、不均等です。独自の制御下やTEE GPU上で動作するオープンソースモデルは、スペクトルの端から端まで計算することができます。しかし、クロード、GPT、プライバシーなどのクローズドソースモデルの匿名パススルーは、あなたの身元を除去し、元のプロンプトはフロントラボの最後に処理されます。 そのため、最も強力なプライバシーはオープンソースのみをカバーし、フロントラインモデルは「本物の秘密」ではなく「匿名」です。 ヴェネツィアのマオリ = サブスクリプション価格 – 推論のために支払った価格の部分, 露出した API の価格以上である, ほとんど完全には、pricervacyの価格によってサポートされています, それは薄く、前方価格の対象となる理由です。

トークンの設計は要求のこの部分を詰めました。 ヴェネツィアは、参照クレジットであるVVVVV(担保およびプラットフォームアクセス)とDIEMの2つのトークンで実行され、各DIEMは1日約$ 1です。 手数料サブスクリプションは、VVVV(Pro / Pro + / Max、それぞれ約2/5 / 10)のプログラム可能な買い戻しをトリガーし、排出量は固定スケジュールに応じて減少します。6M → 5M → 4M VVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVV 払い戻しは現実的ですが、裁量的かつまだ控えめです:4月と5月、約1億US $ 10.3百万が破壊され、6月に、約1万US $ 110百万にゆっくりと登りました。

基本的な表面は、タイトルよりも健康です。 US$ 70 百万 ARR の公に循環した図は、サブスクリプション料金の純追加としてほぼ確実に識別することができる; 防御可能な領域は US$ 6 百万から US$ 15 万に近いです。 この文脈では、アクションは現実的です:約136,000の通貨ヘルドアドレス、約9.9万人のWebサイト訪問月(約330,000回)、約1400日の行程を巡る新しいProサブスクリプション。 実際の事業ですが、薄い事業の経済は買収した計算の対象となります。

そのため、Hyperbolicはそれの上にあります。 Vinceがガソリンスタンドの場合、Hyperbolicは精製所です。 ヴェネツィアは、すべての人が依存する同じ制限された供給から電力を購入しています。そのセグメントがヴェネツィアに集約し、標準化し、それを好きなすべてのプレーヤーに販売するHyperbolicの供給。 需要が拡大するにつれて、価値は消費計算アプリケーションだけでなく、これらのアプリケーションに対する消費支払いのコストの蓄積を集約し、ルート計算し、捕獲するだけでなく、蓄積します。

なぜ重要なのか

Nvidiaは「サービストークン」の周りの金融を再構成しました。 Cerebras' IPOは、アクセスがボトルネックであることを理解している市場があることを証明しています。 Anthropic は容量のために動きます、それは実質問題です。 有力で物理的なAIは、雲と端の側面を渡る倍率の複数の順序によって要求を認識します。

また、反対側から「60億ドル問題」リングが挙げられます。 Cahn ' s の空の論理, すなわち, オーバービルド, その後、過容量性, 最終的に検証される可能性があります。. しかし、過剰は正確に光資産ポリマーのための最高のものです: GPUの価格が下に移動し、供給の断片化が数十のクラウド上に散らばっているとき、, 任意のハードウェアを持っていないプレーヤーや、最も安い利用可能なカードに各タスクの負荷を転送する人は、差を稼ぐ, 減価償却GPUを保持しているオペレータは、損失を負います. Hyperbolic は空以上をしている。

最終的に勝った会社は、最大のGPUで1つではなく、GPUがどこにいたのか、どの価格で利用できるかを伝えることができ、各ジョブの負荷の1つは最低コストで実行されます。

Hyperbolicは、この会社を設立しています。 彼らはGPUを所有していません, 彼らはソフトウェアです, 彼らは3層に深くなっています, しかし、彼らは、推論の究極の計算に作られています。

บทความที่เกี่ยวข้อง

QQlink

ไม่มีแบ็คดอร์เข้ารหัสลับ ไม่มีการประนีประนอม แพลตฟอร์มโซเชียลและการเงินแบบกระจายอำนาจที่ใช้เทคโนโลยีบล็อกเชน คืนความเป็นส่วนตัวและเสรีภาพให้กับผู้ใช้

© 2024 ทีมวิจัยและพัฒนา QQlink สงวนลิขสิทธิ์