SIAPA YANG BERBAGI BIAYA BULANAN AI-MU? PETA UNTUK MEMECAHKAN RANTAI PASOKAN ALGORITMA 20 DOLAR
Pendapatan dari aplikasi AI tidak setara dengan SaaS tradisional, dan valuasi perusahaan bergantung pada biaya yang lebih rendah dan Maori yang ditingkatkan. 。

♪ TL;DR ♪
- AI biaya bulanan untuk model perusahaan, komputasi awan, GPU, listrik dan rantai pasokan。
- Langganan AI AI memiliki biaya penalaran yang sedang berlangsung dan tidak dapat langsung diterapkan pada skenario SaaS tradisional。
- Sasaran yang terpaut adalah: OpenAI, Antropik, Microsoft, Amazon, Google, NVDA, Radio Akumulasi, SK Hercules, Samsung, Light, Data Centre dan Power Chain。
Sebuah perkiraan mengenai bagaimana Claude Pro membayar kira-kira $20 per bulan oleh Amerika Serikat kepada perusahaan model, komputasi awan, penyusutan GPU, listrik dan rantai pasokan menyebabkan investor untuk kembali mengunjungi bagaimana pendapatan terapan AI harus dihargai。

Figur ini bukanlah sub-count resmi untuk Antropik, awan Amazon atau Weeda, juga tidak dapat dianggap buku nyata dari perusahaan manapun. Nilainya terletak pada menaikkan pertanyaan yang lebih mendasar: berapa banyak langganan yang dibayar oleh pengguna untuk aplikasi AI, dan berapa banyak yang didepositkan sebanyak SaaS tradisional ke dalam maturitas perangkat lunak
valuasi tradisional SaaS jelas dibayangkan. Setelah perangkat lunak ditulis, satu akun tambahan dijual, dan biaya penambahan baru biasanya rendah, dan perusahaan perangkat lunak murni yang matang cenderung memiliki lebih dari 70% atau lebih dari mereka sendiri. Investor-investor yang berkeinginan memberikan kelipatan karena kesempatan untuk terus meningkatkan margin keuntungan mereka sebagai pendapatan berkembang。
Kesulitan aplikasi AI adalah setiap kali pengguna bertanya, menulis kode, menganalisis berkas atau panggilan semut, ia mengkonsumsi waktu GPS, listrik, bandwidth memori dan sumber daya awan. Permukaan adalah biaya bulanan tetap, tetapi bagian bawah adalah rantai biaya yang bervariasi dengan penggunaan. Pengguna ringan mungkin Māori tinggi dan pengguna berat dapat menjalankan misi berturut-turut dalam jumlah yang tersedia atau paket alat terkait, dan biaya mungkin meningkat dengan cepat。
Jadi tantangan dari $20 split bukan berapa dolar yang telah diambil perusahaan, tetapi apakah pendapatan aplikasi AI secara alami sama dengan pendapatan SaaS. AIA harus membuktikan nilainya adalah ganda, tidak hanya bahwa pengguna bersedia membayar, tetapi juga bahwa rasio Maori berbobot-guna akan terus ditingkatkan。
Ada rantai biaya penalaran di balik langganan
AI PERBEDAAN TERBESAR ANTARA BERLANGGANAN DAN BERLANGGANAN PERANGKAT LUNAK REGULER ADALAH BAHWA BIAYA MARGINAL " SEKALI DALAM PENGGUNAAN " TIDAK LAGI DEKAT DENGAN NOL。
Di SaaS tradisional, sebuah tim membuka akun tambahan dan penyedia layanan juga memiliki server, biaya penumpang dan bandwidth, yang biasanya tidak naik secara linear dengan setiap klik. Apa yang benar-benar mahal adalah penelitian dan pengembangan sebelumnya, penjualan dan akuisisi. Bila produk diskalakan, sebagian besar pendapatan tambahan dapat dipertahankan。
Produk model yang besar berbeda. Pertanyaan masukan pengguna, model menghasilkan jawaban, proses yang disebut penalaran, yaitu perhitungan sebenarnya dari model ketika dipanggil oleh pengguna. Token adalah unit dasar pengukuran untuk model pembacaan dan penulisan. Semakin banyak pengguna bertanya, semakin panjang konteksnya, semakin kompleks kandungannya, semakin banyak token dan semakin banyak algoritme yang dikonsumsi。
Hal ini menciptakan pertentangan antara langganan tetap dan konversibilitas. Claude Pro membayar sekitar $20 per bulan untuk Amerika Serikat, dan harganya akan terpengaruh oleh wilayah, pajak dan pajak, dan penyesuaian antropik. Pengguna Indianapolis melihat harga tetap dan perusahaan model menghadapi penggunaan yang sangat berbeda. Ada orang yang menulis surat dan memeriksa informasi, dan ada orang yang memproses berkas panjang, menjalankan tugas kode atau menyebut proses otomatis yang lebih kompleks。
UPAYA PETA PENYEBARAN PASAR UNTUK MEMVISUALISASIKAN MASALAH: DARI $ 20, PORSI DITINGGALKAN KE PERUSAHAAN MODEL, DAN PORSI DIBAYAR KE PENYEDIA AWAN DAN KALKULATOR. BIAYA PENGHITUNGAN PENDUDUK TERMASUK LISTRIK, TRANSPORTASI, SUSUTNILAI GPU. PENGANGKUTAN GPU MENGALIR KE ATAS KE WEEDA INGGRIS, PEMBANGUN LISTRIK, HBM (HIGHWIDTH MEMORY), MODUL CAHAYA, ODM DAN PERUSAHAAN TERKAIT DAYA。

ISTILAH "GPU SUSUTNILAI " DI SINI DIPAHAMI BERARTI BAHWA GPU YANG MAHAL BUKANLAH BUKU PENYEMPURNAAN SATU KALI, TETAPI PERLAHAN-LAHAN DIDISTRIBUSIKAN KE LAYANAN AI DALAM HAL USIA, INTENSITAS PENGGUNAAN ATAU KALIBER AKUNTANSI. INFURANSI SEBENARNYA DIPENGARUHI OLEH UKURAN PAKET, PROPORSI PENGGUNA RINGAN, HARGA PENYELESAIAN INTERNAL PRODUSEN AWAN, DISKON TUNJANGAN, PEMANFAATAN GPU DAN USIA PENYUSUTAN. BIAYA RATA - RATA JUGA TIDAK SAMA DENGAN BIAYA MARGINAL。
INVESTOR-INVESTOR YANG BENAR-BENAR PERLU FOKUS PADA ARAH: IP AI TIDAK HANYA DAPAT MENGUNGKAPKAN PERTUMBUHAN PENDAPATAN, TETAPI JUGA MENJAWAB APAKAH BIAYA KALKULUS DI BALIK PERTUMBUHAN PENDAPATAN MENINGKAT SECARA BERSAMAAN. TEKANAN BOROUGH MĀORI MUNGKIN MENJADI LEBIH DIUCAPKAN JIKA PENGGUNAAN MENGEMBANG LEBIH CEPAT DARIPADA EFISIENSI MODEL MENINGKAT DAN SEMAKIN TINGGI PENDAPATAN LANGGANAN. HANYA KETIKA PERBAIKAN EFISIENSI CUKUP CEPAT AKAN MEMODELKAN PERUSAHAAN MEMILIKI KESEMPATAN UNTUK MENDAPATKAN KEMBALI AKSES KE STRUKTUR KEUNTUNGAN PERUSAHAAN PERANGKAT LUNAK。
Infrastruktur Infrastruktur menerima penghasilan yang lebih pasti terlebih dahulu
PADA TAHAP INI, PERTUMBUHAN PENGGUNAAN AI MENGALIR LEBIH LANGSUNG KE INFRASTRUKTUR DARIPADA KE SELURUH LAPISAN APLIKASI。
Apakah pengguna menggunakan model dalam Claude, ChatGPT, Gemini, atau dalam perusahaan, individu, penalaran akhirnya jatuh ke dalam komputasi, listrik, memori dan jaringan. Mungkin ada turnover produk pada tingkat aplikasi dan konsumsi sumber daya bawah yang lebih kaku. Selama penggunaan AI terus meningkat, pengeluaran modal awan, pembelian GPU, permintaan HBM dan pusat data listrik akan ditarik。
INI JUGA ALASAN MENGAPA RANTAI INFRASTRUKTUR SEPERTI IN WEIDA, TELEKOMUNIKASI, DAN SK HERCULES TERUS DINILAI ULANG OLEH PASAR. SECARA KESELURUHAN KADAR MĀORI DI YINGWEIDA TELAH TINGGI DALAM BEBERAPA TAHUN TERAKHIR, DENGAN TINGKAT GAAP DAN NON-GAAP MĀORI KIRA-KIRA 71,1 DAN 71,3 PERSEN UNTUK TAHUN 2026, SERTA PEDOMAN TRIWULANAN. PERLU DIPERHATIKAN BAHWA KUARTAL INDIVIDU TERGANGGU OLEH BIAYA SPESIFIK DAN BAHWA PENGUNGKAPAN KEUANGAN PUBLIK TIDAK SELALU MENGHAPUS STRUKTUR MAORI YANG SEBENARNYA DARI PUSAT DATA AI SECARA LANGSUNG, TETAPI KEBERADAAN HAK-HAK PRIORITAS UNTUK INFRASTRUKTUR LANGKA TERCERMIN DALAM KINERJA。
MBM ADALAH LINK PALING KHAS DALAM RANTAI INI. INI BUKAN MEMORI BIASA, ITU ADALAH KOMPONEN KUNCI DALAM AKSELERATOR AI YANG MENDUKUNG PERHITUNGAN INPUT TINGGI. EKSEKUSI PERMINTAAN UNTUK UKURAN MODEL, PANJANG KONTEKS DAN CODING MENYEBABKAN KETERGANTUNGAN YANG LEBIH BESAR PADA MEMORI BANDWIDTH TINGGI UNTUK CHIP AI. PERKIRAAN RANTAI BEKAL BEKAL BEKAL BEKAL BEKAL BEKAL BEKAL BEKAL BEKAL BEKAL BEKAL BEKAL BEKAL BEKAL BEKAL BEKAL BEKAL BEKAL BEBAN BEBAN BEBAN BEBAN BEBAN BEBAN MENUNJUKKAN PENINGKATAN HBM ' S SHARE DARI BIAYA GENERASI BARU AI CHIP, YANG JUGA MERUPAKAN ALASAN PENTING MENGAPA SK HERCULES, SAMSUNG, AMERICAN LIGHT DIRESEPKAN DALAM SIKLUS AI。
listrik dan pusat data juga telah berpindah dari biaya latar belakang ke hub investasi. konsumsi energi dari satu pertanyaan teks regular tunggal tidak selalu dilebih-lebihkan, tetapi agen kompleks, konteks, pembuatan kode dan beberapa putaran tugas diperbesar. untuk produsen awan dan operator pusat data, kunci tidak untuk bertanya berapa banyak listrik yang dikonsumsi pada satu waktu, tetapi untuk bertanya berapa banyak permintaan penalaran terus berlanjut, pemanfaatan cluster, harga listrik, pendinginan, kapasitas kamar dan kapasitas akses grid menjadi biaya dan bottlenecks。
KEUNTUNGAN DARI INFRASTRUKTUR AKHIR TERLETAK PADA VALIDASI KINERJA YANG LEBIH CEPAT. PENGELUARAN MODAL AI OLEH PRODUSEN AWAN TELAH TERJADI, PENDAPATAN DAN MAORI DARI INGWEIDA TERCERMIN DALAM PERNYATAAN KEUANGAN, DAN PESANAN PERUSAHAAN HBM DAN HARGA AKAN MEMASUKI PERNYATAAN LABA RELATIF CEPAT. LAPISAN APLIKASI MODEL FOLDON DIPERDAGANGKAN LEBIH UNTUK MENGANTISIPASI MASA DEPAN: KONVERSI LANGGANAN, PENETRASI BISNIS, RILIS KEUNTUNGAN SETELAH PENDAPATAN API DAN PENURUNAN KURVA BIAYA MASA DEPAN。

Efisiensi perbaikan tetap menjadi dasar sentral dan multimuka
INVESTOR PERANGKAT LUNAK DAN AI MULTIPLE HEADS TIDAK TANPA SANGGAHAN. TITIK PUSAT EFISIENSI ADALAH BAHWA HARI INI ' S BIAYA TINGGI PENALARAN HANYA FENOMENA TAHAP AWAL DAN BAHWA MODEL OPTIMISASI, CACHE, MODEL KECIL, CHIP BELAJAR SENDIRI DAN PEMANFAATAN CLUSTER YANG LEBIH TINGGI DAPAT TERUS MENGURANGI BIAYA UNIT. SELAMA BIAYA JATUH CUKUP CEPAT, APLIKASI AI MUNGKIN MASIH BISA KEMBALI KE LOGIKA PERANGKAT LUNAK TINGGI MĀORI。
Pemberontakan ini memiliki dasar yang realistis. Beberapa model arus utama telah mengalami penurunan harga unit yang ditandai dengan kemampuan yang setara atau lebih tinggi. Sebelumnya OpenAI telah mengungkapkan bahwa GPT-4o Mini 99% lebih rendah daripada biaya awal SMS-davinci-003 per token. Hikmah dari perusahaan yang berbeda tidak sepenuhnya konsisten, dan Antropik lebih baru-baru ini telah tercermin dalam upgrade harga dan lapisan model, tetapi arah industri tetap untuk memberikan kemampuan yang lebih kuat dengan biaya yang lebih rendah。

Perusahaan-perusahaan Model ouble juga memiliki berbagai cara untuk meningkatkan ekonomi unit. Tugas-tugas yang sederhana diberikan kepada model kecil, dan permintaan yang sering dikirim ke model yang lebih kuat melalui penggunaan ulang cache, konteks panjang dan tugas yang kompleks. Pabrikan Awang klaster cloud mengurangi biaya komputasi unit melalui self-study chip dan gerakan cluster. Wafford Google memiliki TPU, Microsoft telah meluncurkan Maia untuk penalaran, dan Amazon mendorong Trainium dan Inferentia。

ADA RUANG UNTUK PENINGKATAN DALAM PENERAPAN AI MARGIN KEUNTUNGAN JIKA ITU DIDASARKAN SEMATA-MATA PADA KEMAJUAN TEKNOLOGI. ALASAN YANG LEBIH MURAH, MODEL ROUTING YANG LEBIH BAIK, DAN DAYA YANG LEBIH KOMPRESIF MEMBUAT LANGGANAN $20 YANG SAMA UNTUK MEMBAWA LEBIH BANYAK PENGGUNAAN. PENGGUNA RINGAN, PAKET ENTERPRISE YANG BERNILAI TINGGI, LAPISAN API DAN BATASAN PENGGUNAAN YANG LEBIH KETAT JUGA DAPAT MENINGKATKAN EKONOMI UNIT SECARA KESELURUHAN。
Kesulitannya adalah pengurangan biaya bukan satu-satunya variabel. Aplikasi AI beralih dari obrolan sederhana ke beban tugas yang lebih berat. Pada masa lalu, pengguna mungkin hanya mengajukan pertanyaan dan menulis ulang teks, dan sekarang ada permintaan yang meningkat dari agen kode, pemrosesan dokumen yang panjang, pembuatan video dan multi-modular, dan proses otomasi perusahaan. Adegan ini lebih berharga dan dikonsumsi. Model yang lebih berguna adalah, semakin besar kemungkinan pengguna untuk mempercayakannya dengan tugas yang lebih kompleks dan lebih panjang。
PERBEDAAN-PERBEDAAN MENJADI LEBIH SPESIFIK: TINGKAT PENURUNAN BIAYA PENALARAN DAPAT MELEBIHI PENINGKATAN PENGGUNAAN DAN KERUMITAN TUGAS. JIKA BIAYA UNIT JATUH DENGAN CEPAT, TETAPI KONSUMSI KONSUMEN RATA-RATA MENINGKAT LEBIH CEPAT, PERUSAHAAN MODEL 'S BERAT MĀORI RASIO AKAN TETAP DI BAWAH TEKANAN. SELANJUTNYA, LANGGANAN AI MUNGKIN AKAN MENJAUH DARI FITUR BERAT-BIAYA HARI INI ' S JIKA RUTE MODEL, CACHE, CHIP BELAJAR SENDIRI DAN LAPISAN HARGA CUKUP EFEKTIF。
Jumlah pelanggan bukan angka Maori
Peta pemisah dolar Amerika Serikat seharusnya tidak dipahami sebagai final. Hal ini lebih seperti valuasi pada tahap saat ini yang perlu didiskonsi investor dengan asumsi bahwa aplikasi "AI adalah wajar sama dengan SaaS" ketika pasar belum melihat model perusahaan MUR tarif yang cukup transparan。
Untuk perusahaan model yang tidak terdaftar seperti OpenAI, Antropik, sangat sulit bagi investor eksternal untuk melihat buku lengkap. Bahan Financing, pengungkapan mitra, struktur biaya awan, harga paket enterprise, pembagian pendapatan API dan penggunaan pembatasan semua berfungsi sebagai titik apresiasi. Data yang benar-benar berharga bukan jumlah pengguna pembayaran biaya, tetapi pembagian pengguna ringan dan berat, kesediaan klien bisnis untuk membayar harga yang lebih tinggi untuk penggunaan intensitas tinggi, penurunan biaya kliring awan, dan kemampuan biaya penalaran unit jatuh ke dalam maturitas perusahaan。
SERTIFIKASI RANTAI PERUSAHAAN TERDAFTAR AKAN MUNCUL DALAM PERNYATAAN KEUANGAN LEBIH CEPAT. PERTUMBUHAN DALAM KADAR MĀORI BRUTO DAN PENDAPATAN PUSAT DATA, PERMINTAAN UNTUK PRODUKSI DAN PENAHANAN DAYA DESKTOP CANGGIH, HARGA DAN PROFITABILITAS PRODUSEN HBM, DAN INTENSITAS PENGELUARAN MODAL OLEH PRODUSEN AWAN AKAN TERUS MENCERMINKAN APAKAH PENGGUNAAN AI TERUS MENGALIR KE UJUNG INFRASTRUKTUR. JIKA INDIKATOR INI TETAP KUAT DAN ADA KURANGNYA BUKTI TINGKAT MĀORI YANG DITINGKATKAN PADA TINGKAT APLIKASI MODEL, PASAR AKAN TERUS MEMBERIKAN PREMI VALUASI YANG LEBIH DEFINITIF UNTUK INFRASTRUKTUR。
Pada akhirnya, untuk memulihkan jangkar valuasi yang lebih tinggi, perusahaan model perlu menunjukkan bahwa tidak hanya pengguna bersedia membayar $20, tetapi bahwa langganan ini, setelah penggunaan berat, masih meninggalkan Maori cukup. Pada babak berikutnya perbedaan harga mungkin berbeda dari angka utama ARR ' s, sementara biaya penalaran, pembatasan paket dan harga biaya perusahaan ' s berjalan secara bersamaan。
