이유가 무서운 자원이 될 때, 누가 가치를 캡처

2026/06/09 14:04
👤ODAILY
🌐ko

결국 이 회사는 가장 큰 GPU로 하나가되지 않습니다. 。

이유가 무서운 자원이 될 때, 누가 가치를 캡처

Frank Fu에 의해 원래

출처: IOSG 벤처

2023 년 데이비드 콜은 구멍이 훈련 측에 결코 채워지지 않았다는 것을 건의했습니다. 그것은 소원에 포함 되었으며, 시장은 지난 몇 주 동안 가격으로 간주하기 시작했다. 실제 문제는 젊은 Waida가 "서비스 토큰"및 Cerebras 주위에 재정을 재구성 할 때 다음 하나가되었다 20 배. 이유가 무서운 자원이 될 때, 값은 계산기의 수준에 입금됩니다。

GPU를 따르십시오: $200 억에서 $60 억

2023 년, 세쿼리아의 데이비드 콜 (David Cahn)은 AI 건물 전체에 걸친 문제를 제기했습니다. "억 달러 문제" 각 달러는 GPU에 지출하고 데이터 센터에 전원을 공급하는 데 약 다른 달러가 소요되므로 매년 GPU CapEx는 칩이 궁극적으로 자본을 복구하기 위해 매출 약 200 억 달러를 생성해야한다는 것을 의미합니다. AI의 소득의 매우 관대 한 가정도, 그는 "입력"과 "end-user 지불" 사이에 $ 12.5 억 이상의 구멍을 발견했습니다. 관심사는 명확합니다: GPU는 진짜 수요의 앞에 붙박이입니다。

1 년 후, 격차는 좁은 대신 넓은. 2024의 오염에서 Cahn은 Super-large 제조업체 CapEx의 확장으로 "60 억 문제"로 정의되었습니다. 빈 논리의 익숙한 모양: 과도한 건축은 자본을 점화하는 oversupply에 지도합니다。

둘 다 기사는 실제로 동일한 것을 요구합니다: 누가 이 구멍을 채울 것입니까? 대답은 "train"측에 책에서 결코 나타나지 않습니다. 그것은 inference의 측에 나타나고, 시장은 과거 몇 주에 있는 가격으로 그것을 요인하기 위하여 시작되었습니다。

Cerebras IPO와 질감

Cerebras는 목요일에 나열되었습니다. 이 시간 IPO는 20 배를 초과하고, 가격은 수요일에 마지막 증가 거의 두 번이었습니다. Demand는 다음 Nvidia killer에 베팅에서 제공되지 않습니다. 그러나 간단한 것에서 : 시장은 AI의 실제 병목이 의도하지 않다는 것을 깨닫기 시작합니다。

Cerebras의 재능은 매우 빠른 이유를 만드는 칩 구조입니다. 훈련하지, 이유. 벽 거리가 켜지는 것은 무엇입니까? 시장은 recurrent, 그것은 사용법으로 확장합니다. 매번 Claude는 질문에 답합니다. 매번 antent는 임무를 수행하고, 계산을 배수합니다. 훈련은 한 번만 일어나고 결코 멈추지 않는다。

J.P. Morgan는 10에서 50배 훈련의 크기로 참고 시장의 크기를 예상했습니다. 기계가 다른 기계에서 임무를 수행 할 때, anatomy의 형태로 확장하는, 참조 요구는 더 이상 사용자의 수와 확장, 하지만 calculus 자체。

Nvidia 철회 : 이유가 헤드 라인이됩니다

Cerebras가 시장의 awakening 인 경우 Nvidia의 최신 시즌은 체인의 상단에서 확인됩니다. 최신 금융 회의에서 Jensen Huaang은 비만 진술을 명확하게 만들었습니다 : AI 수요는 패러다임 패션에서 성장합니다. 이것은 간단합니다 : angstic AI가 도착했습니다. Mainstream AI는 논리적인 이유에 한 번의 이유에서 이동하고 그 자체 도구를 호출 할 수있는 프로세스로 작업을 구성합니다. 황은 말했다, "토큰은 이제 수익성입니다. AI 시대에서 계산 능력은 소득과 이익입니다。

그것은 전체적인 기업을 reshaping입니다. 교육은 모델 구축의 한 번의 비용이며, 참조는 실행의 재발적 비용이며, 오늘날 병목이 감소하고 훈련되지 않습니다。

Nvidia는이 판단을 재정적 진술으로 썼습니다. 이제는 Data Center 및 Edge Marketing보다 두 플랫폼에 공개됩니다. 데이터 센터 (현재 시즌 동안 약 75 억 달러, +92 퍼센트에 비해) Hyperscale (약 38 억 달러, 상대 +12 퍼센트) 및 ACIE, i.e. AI 클라우드, 산업 및 기업 (대략 $37 억, +31 퍼센트에 관계)에 더 분해되었다. 완전히 새로운 라인은 Edge Compushing입니다. $ 6.4 억, +29 퍼센트, PC, 워크스테이션, AI-RAN 기지국, 로봇 및 자동차와 같은 진정한 실행 터미널을 덮고 있습니다。

가장자리는 여전히 총 소득의 8 % 미만의 계정이지만, Nvidia는 데이터 센터와 함께 두 번째 플랫폼에 상승했다. 신호는 2개의 정면으로 분할되고, 자료 센터의 claud inference, 그리고 가장자리 끝 지점 inference, AI는 보고, 움직이고 육체적인 세계에 있는 행위입니다. 도로 지도는 동일한 논리를 따릅니다: Vera Rubin는, 년의 제 3 분기에서, Blackwell의 inference의 크기 35배까지 일 수 있었습니다; Huang는 또한 Vera CPU를 위한 아주 새로운 $200 억 TAM를, 임신한 짐을 위해 디자인됩니다. 각 정면 선 모형 회사는 첫번째 일에 완전히 교대할 것으로 예상됩니다。

지구상에서 가장 높은 가치 회사가 "서비스 토큰", 병목이 정착하는 주위에 재정적 공개를 재구성 할 때. 참고 할 때 값을 캡처 한이 종이 거래의 나머지 (훈련보다 오히려)는 스카프 리소스가됩니다。

첫 상품 모두에,이 종이는 CDU와 거래, 외부 API 토큰 서비스를 제공하는 임대 데이터 센터. Endpoint는 GPS 임대 및 폴리머없이 완전하게 실행되는 장치 자체 (Jetson, RTX, Drive, AI-RAN) 내에서 로컬 칩을 나타냅니다. 여기에, 전체 경제를 확대하는 부드러운 방법으로보고, 병목을 지원하기 위해, 오히려 Hyperbolic과 베니스가 위치하는 시장보다, 이는 클라우드 라인에 완전히。

짜기가 도착했습니다

Anthropic은 석탄 광산에서 운하입니다. 사전 구성 용량보다 훨씬 더 많은 사용, Claude의 불평은 "brain-leafed"는 제한적 흐름 응답, 느린 이유, 압축 컨텍스트 창을 포함하여 웹 이상입니다. 이 솔루션은 벌거 벗은 계산입니다. 5 월 2026에서 Anthropic은 SpaceX에서 전체 Colossus 1 데이터 센터, 220,000 + Nvidia GPU, 300 + MW를 인수했으며 inference에 전념하지 않습니다。

용량의이 부분은 일련의 캡 변경 사항을 잠금 해제합니다. 각 신호입니다. 5 월 6 일, Anthropic은 Claude Code의 5 시간 제한을 두배로했으며 피크 시간 제한을 제거하고 Opus의 API 제한을 크게 증가했습니다. 5 월 13 일, Claude Code의 주간 제한은 50 퍼센트 (until 13 July)에 의해 제기되었습니다. Subsequently, as of 15 June, it did the Oppos of "sponsible": to use Agent SDK, no-head mode claude-p, CI 스트리밍 워터 라인 플랫 구독에서 독립적으로 측정 된 신용 풀 ($20-200 API 가격). 이 마지막 단계는 전체적인 인수 집합을 작업으로 집계했습니다: ant는 평평한 구독의 디자인 포용력 보다는 매우 더 빠른 속도로 inference를, 그래서 그것의 본래 “recurring 비용”에 따라 가격될 것입니다。

교육은 한 번의 자본 지출입니다. inference는 각 새로운 사용자 및 모든 새로운 delegate로 accrues 하는 recurring 운영 비용입니다。

이 창고: 6개의 지면, 1개의 bottleneck

각 AI 신청은 TSMC 결정 원형 식물과 API ENDPOINT로 끝나는 공급 사슬에서 있습니다:

대부분의 회사는 그들 중 하나가 있습니다. Nvidia는 실리콘을 소유하고, CoreWeave는 nudity 금속을 소유하고, AI는 최적화를 이유가지고, OpenRouter에는 모형 API 노선이 있습니다。

하나 제외。

Hyperbolic: 3개의 층의 맞은편에 유일한 회사

Hyperbolic은 6 월 2025에서 GPU 시장을 출시했습니다. 처음 몇 달에, 개발자의 수는 200,000 +를 능가했다, 프론트 라인 AI 실험실, 검색 및 대형 소비자 수준의 플랫폼을 사용하여。

흥미로운 것은 그것의 구조입니다。

Hyperbolic은 GPU를 보유하지 않습니다. 각 카드는 CoreWeave, Lambda Labs, Nebius 및 작은 연산자를 포함하여 Neocloud 및 데이터 센터에서 제공됩니다. 그것은 약점처럼 들린다, 그러나 그것은 moat입니다。

GPU 공급 업체 및 소비자 사이에 앉아서 Hyperbolic은 다른 사람이 볼 수있는 실시간 데이터를 볼 수 있습니다. 어떤 가격에서 GPU를 구입하는 것을 알고 있습니다. 과잉 공급이 열리기 전에 보았습니다. 수요가 시장으로 크게 증가했습니다。

오늘, moat 자체는 다색 집계입니다. Hyperbolic은 수십 개의 독립형 클라우드 및 데이터 센터의 파편 생산 능력은 개발자가 각 운영자와 협상하거나 계정의 더미를 관리하지 않고 가장 저렴한 가능한 GPU를 임대 할 수있는 표준화 된 통합 풀로 구성됩니다. 더 많은 구름에 도달, 더 많은 유체, 더 많은 가격 데이터입니다. 앞으로 팀은 GPU 가격 곡선을 모델링하기 위해 이러한 데이터를 사용하는 방법을 탐구하고 결국 자신의 자본에 투자하여 원활한 공급 및 수요를 확보하고 물리적 계산의 마케터의 역할을합니다. 그러나이 목표는 초기 단계에서 여전히되고 실제로 회복되는 폴리머 층입니다。

이것은 바퀴입니다:

  1. 더 많은 클라우드에 액세스, 더 많은 집적 공급
  2. 더 많은 공급, 더 깊은 시장 및 실시간 가격 데이터
  3. 더 나은 데이터, 이제 더 스마트 경로, 더 긴 가격 모델
  4. 더 나은 이동성 및 가격, 더 많은 개발자, 액세스하는 더 많은 클라우드

다른 회사가 이것을 시도하지 않습니다. Hyperbolic은 GPU 임대, 배포 및 모델 API 레이어 모두에서 실행되는 유일한 회사입니다。

Vince, 이 거울

베니스는 응용 수준에서 경제의 가장 명확한 표현이며 Hyperbolic의 위치에 유용한 대조입니다. 그것은 개인 정보 보호 보장하는 응용 프로그램입니다 : 소비자 중심의 구독 (무료 / Pro / Pro + / Max)과 함께 API의 OpenAI 호환 세트, 약 75 모델에 대한 요청을 리드, 약 2 세의 오픈 소스 또는 자체 호스팅 모델 (Llama, Mistral, Qwen, DeepSeek), 나머지는 닫힌 소스 국경 모델의 익명 팩스입니다. 포인트는 Vince는 의미있는 calculus가 없습니다. 그것의 독립된 GPU collaborators 및 은밀한 컴퓨팅 공급 업체 (NEAR AI Cloud, Phala) 그것을 임대하고 전면 실험실을 통해 지불, 그래서 액세스의 실제 비용은 SaaS 호스팅되지 않습니다。

Vince는 정말 개인 정보를 판매. "privileged"라는 용어는 개인 재산으로 공공 컴퓨팅을 도는 것이 아니라 상업화의 논리에 대한 보증 층을 추가하는 것이 아닙니다. 데이터를 유지하지 않고 익명성을 요구하고 TEE로 실행하기 때문에 운영자가 그것을 볼 수 없습니다. 밑바닥 요인은 도로 짐이고, 추가된 가격은 개인 정보 보호 포장의 이 층입니다. 그리고 이러한 보증 층은 계층화되지 않습니다 : 자체 제어 또는 TEE GPU에서 실행되는 오픈 소스 모델은 스펙트럼의 끝에서 계산 될 수 있습니다. 그러나 Claude, GPT, 개인 정보 보호와 같은 닫힌 소스 모델의 익명 통과 추적은 당신의 정체성을 스트립하고 원본 프롬프트는 여전히 앞 실험실의 끝에 처리됩니다. 그래서 가장 강력한 개인 정보 보호는 오픈 소스 만 커버하고, 프론트 라인 모델은 "실제 비밀"보다 오히려 " 익명"입니다. Venice의 Maori = 구독 가격 – 가격의 일부는 배당 된 배당류를 지불, 이는 육안 API의 가격보다 더 많은, 감당류의 가격에 의해 거의 전적으로 지원됩니다, 이는 왜 얇은과 포용 가격의 주제입니다。

토큰 디자인은 요청의이 부분을 포장했습니다. 베니스는 두 개의 토큰에서 실행 : VVVV (양자 및 플랫폼 액세스) 및 DIEM, 이는 참조 크레딧이며, 각 DIEM은 약 $ 1 일입니다. 수수료 구독은 VVVs (Pro / Pro + / Max, 약 US $ 2 / 10, 각각)의 프로그래밍 가능한 구매 백을 트리거하고, 배출은 고정 일정에 따라 감소합니다. 6M → 5M → 4M VVVVVVVVVVVVVVVVVV, 1 7 월 3M. Repurchases는 사실이지만 재량과 여전히 겸손합니다. 4 월과 5 월, 약 US $ 10.3 백만이 파괴되었으며 6 월에는 약 US $ 110 백만으로 천천히 등반되어 매월 $ 200,000 라인 미만입니다。

기본 표면은 제목보다 더 건강합니다. 미국 $ 70 백만 ARR의 공개적으로 순환 된 인물은 거의 확실히 구독 수수료 이외에 그물로 식별 할 수 있습니다. 현명한 지역은 US $ 6 백만에서 US $ 15 백만에 가깝습니다. 이 컨텍스트에서 이동은 실제적입니다. 약 136,000 통화 헬드 주소, 달 당 9.9 백만 웹 사이트 방문 (당일 약 330,000 시간) 및 새로운 Pro 구독 hover 하루 약 1400의 라인 주위에. 이것은 실제 사업이지만, 얇은 사업의 경제는 계산에 따라 인수되었습니다。

그것은 왜 Hyperbolic는 그것의 정상에 입니다. Vince가 주유소인 경우, Hyperbolic은 정유 공장입니다. 베니스는 모든 사람들이 의존하는 동일한 제한 공급에서 전력을 구입했습니다. Hyperbolic은 그 세그먼트를 집계, 표준화하고 베니스와 같은 모든 플레이어에게 판매합니다. 수요가 성장함에 따라, 값은 소비 측정 애플리케이션뿐만 아니라 집계 및 경로 계산 및 이러한 응용 프로그램에 대한 소비 지불의 축적을 캡처합니다。

왜이 중요한가

Nvidia는 "서비스 토큰"의 주위에 금융을 재구성했습니다. Cerebras' IPO는 시장에 접근이 병목이라고 이해한 것을 증명합니다. Anthropic는 수용량을 위해 주변에, 진짜 문제입니다. Agentic and Physical AI는 클라우드와 끝의 측면에 걸쳐 몇 가지 순서로 수요를 확대합니다。

그리고 다른 쪽에서 "60 억 달러 문제"링이 있습니다. Cahn 's 빈 논리, i.e., over-building, then overcapacity, 결국 검증 될 가능성이. 그러나 초과는 빛 자산 중합체를 위한 가장 제일 일입니다: GPU 가격은 아래로 갈 때 공급의 파편은 어떤 기계설비도 없는 수십의 구름, 어떤 기계설비도 없는 선수 이상 흩어져지고 가장 싼 유효한 카드에 각 작업 부하를 옮기는 것은 다름을, 감속 GPU를 붙드는 통신수가 손실을 품는 동안. Hyperbolic 이다 doing more 보다 그것 이다 빈다。

결국이 가장 큰 GPU로 하나가 아니었지만, GPU가 어디에서나 사용할 수 있었는지 말해 줄 수 있는 하나이며, 각 작업의 부하가 가장 낮은 비용으로 실행될 것입니다。

Hyperbolic는 이 회사를 건설합니다. 그들은 GPU를 소유하지 않습니다, 그들은 소프트웨어, 그들은 세 층에서 깊은, 그러나 그들은 의도의 궁극적 인 계산으로 만들어。

QQlink

无加密后门,无妥协。基于区块链技术的去中心化社交和金融平台,让隐私与自由回归用户手中。

© 2024 QQlink 研发团队. 保留所有权利.