Themendossier · Thema KI
Data Center: KI-Rechenzentren als eigener Markt im AI-Stack
Dieses Dossier ordnet den Markt für KI-Rechenzentren: Public-Cloud-Hyperscaler, Eigenbetreiber, Neo-Clouds/GPU-Clouds, Colocation-/Datacenter-Entwickler und chinesische Anbieter. Es trennt Public-Cloud-Marktanteile von der nicht öffentlich sauber messbaren KI-Training- und Inferenzkapazität.
Kernantwort
Was belegt ist
Public-Cloud-Spend, einzelne Capex-Ausblicke, ausgewählte Clustergrößen, Data-Center-Strombedarf, Hyperscale-Kapazität und konkrete GPU-/TPU-/Trainium-Deployments.
Was nicht belegt ist
Eine vollständige Rangliste der Anbieter nach AI-Training-Kapazität, Inferenzkapazität oder installierten AI-Accelerator-FLOPS. Diese Daten sind nicht konsistent öffentlich.
Investment-Relevanz
Die Engpässe wandern von Chips allein zu einem Gesamtsystem aus Strom, Netzanschluss, Kühlung, Gebäude, Netzwerk, HBM, Storage und langfristigen Kapazitätsverträgen.
Marktgröße und harte Nachfrageindikatoren
Die belastbarsten öffentlichen Daten messen nicht „AI-Rechenzentren" als einheitlichen Markt, sondern Stromverbrauch, AI-Infrastruktur-Ausgaben, Data-Center-Capex und Hyperscale-Kapazität. Prognosen sind als Quellenprognosen markiert, nicht als eigene Annahmen.
Grafik: globaler Data-Center-Stromverbrauch
Quelle: IEA, Energy and AI 2025 und Key Questions on Energy and AI 2026. Daten: assets/data/globaler-strombedarf.csv.
Grafik: AI-Infrastruktur-Ausgaben
Quelle: IDC, April 2026. 2029 ist eine IDC-Prognose „mehr als 1 Bio. USD". Daten: assets/data/ai-infrastruktur-ausgaben.csv.
| Kennzahl | Wert | Zeitraum | Quelle |
|---|---|---|---|
| Hyperscale-Kapazität USA | 54% der globalen Kapazität | Ende 2024/2025 | Synergy Research |
| Kapazität Amazon + Microsoft + Google | 59% der Hyperscale-Kapazität | Ende 2024/2025 | Synergy Research |
| Pipeline weitere Hyperscale-Facilities | 504 | Ende 2024/2025 | Synergy Research |
| Top-4-US-Cloud-Anbieter | fast die Hälfte der globalen Data-Center-Capex 2025 | 2025 | Dell'Oro |
| AI-accelerated Server | 2029 rund die Hälfte der Data-Center-Infrastruktur-Ausgaben | 2029 Prognose | Dell'Oro |
Anbieterlandkarte: nicht ein Markt, sondern mehrere Schichten
„Data Center" bedeutet bei KI mindestens fünf Rollen. Die Anbieter überschneiden sich, aber die Geschäftsmodelle unterscheiden sich stark.
Public Cloud
AWS, Azure, Google Cloud und OCI verkaufen Cloud-Plattformen, AI-Compute, Storage, Netzwerk und Managed Services. Hier liegt der klassische Cloud-Marktanteil.
Eigenbetreiber
Meta und große Modellanbieter betreiben oder finanzieren eigene Kapazität. Meta ist kein Public-Cloud-Anbieter, aber einer der wichtigsten AI-Infrastruktur-Nachfrager.
Neo-Clouds
CoreWeave, Lambda und Nebius fokussieren auf GPU-/Accelerator-Clouds für Training und Inferenz, oft mit NVIDIA-first-Positionierung und Großkundenverträgen.
Datacenter-Entwickler
Crusoe, Applied Digital und klassische Colocation-/REIT-Modelle liefern Strom, Gebäude, Kühlung, Leasing und Betrieb. Nicht jede Fläche ist eine Cloud-Plattform.
China-Cloud
Alibaba, Tencent, Huawei, Baidu, ByteDance sowie China Mobile/Telecom/Unicom und SenseTime sind stark mit staatlicher Infrastruktur, Modellen und lokalen Chips verbunden.
Zulieferer
Der Engpass umfasst GPUs/ASICs, HBM, Netzwerke, Kühlung, Stromausrüstung und Netzanschluss. Dieses Dossier fokussiert die Betreiber- und Kapazitätsebene. Die Chip-Fertigung (wer entwirft/fertigt/verpackt die Beschleuniger) ist als eigenes Unter-Dossier ausgegliedert: Chip-Fertigung; die optische Vernetzung als Optische Interconnects; die On-site-Energieversorgung als Energie; die Massenspeicherung der KI-Datenflut als Massenspeicher.
Grafik: 2026-Capex-Ausblick der großen US-Plattformen
Quellen: Amazon Q4 2025 Results, Microsoft FY26 Q3 Earnings Call, Alphabet Q4/FY 2025 Results, Meta Q4/FY 2025 Results. Amazon-Wert ist Amazon gesamt; nicht ausschließlich AWS. Daten: assets/data/capex-hyperscaler.csv.
| Anbieter | Kategorie | Belegter KI-Infrastruktur-Fakt | Quelle |
|---|---|---|---|
| Microsoft Azure | Public Cloud | Großer NVIDIA-GB300-NVL72-Produktionscluster für OpenAI-Workloads mit mehr als 4.600 Blackwell-Ultra-GPUs; Fairwater-Architektur für sehr große GB200/GB300-Cluster. | Microsoft Azure / Microsoft Blog 2025 |
| AWS | Public Cloud | Project Rainier für Anthropic mit nahezu 500.000 Trainium2-Chips; Trn2 UltraServers mit 64 Trainium2-Chips. | AWS / About Amazon 2024–2025 |
| Google Cloud | Public Cloud | Ironwood TPU: bis zu 9.216 Chips pro Pod; Anthropic kündigte Nutzung von bis zu 1 Mio. TPUs an. | Google / Anthropic 2025 |
| Oracle OCI | Public Cloud / AI-Supercluster | OCI Supercluster skaliert laut Oracle auf mehr als 131.000 NVIDIA Blackwell GPUs; Argonne/DOE-Projekt mit 100.000 Blackwell GPUs angekündigt. | Oracle / NVIDIA 2025 |
| Meta | Eigenbetreiber | Capex 2025: 72,22 Mrd. USD; 2026 Guidance: 115–135 Mrd. USD, getrieben durch Meta Superintelligence Labs und Core Business. | Meta Q4/FY 2025 Results |
| CoreWeave | Neo-Cloud / GPU-Cloud | Ende 2025: 43 Data Center in Nordamerika und Europa, mehr als 850 MW aktive Leistung; Mega-Cluster mit 100.000+ GPUs. | CoreWeave FY2025 / CoreWeave AI Infrastructure |
| Crusoe | Datacenter-Entwickler | Abilene-Stargate-Campus Phase 1 auf OCI live; Campus-Ausbau auf 1,2 GW beschrieben. | Crusoe 2025 |
| Applied Digital | Datacenter-Entwickler | Polaris Forge 1: 400 MW Critical IT Load für CoreWeave; erste 50 MW 2025 Ready for Service. | Applied Digital 2025 |
Training vs. Inferenz: warum die Rangliste unscharf ist
Der Nutzer sieht „KI" als ein Produkt. Die Infrastruktur dahinter trennt sich aber in andere Lastprofile. Deshalb ist Public-Cloud-Größe nicht automatisch identisch mit größter Training-Kapazität.
Training
- Große, zusammenhängende Cluster mit sehr schnellen Interconnects.
- Kapazität wird häufig durch Modellanbieter, Hyperscaler und Neo-Clouds langfristig reserviert.
- Öffentlich belegte Beispiele: AWS Project Rainier für Anthropic, Azure/OpenAI-Cluster, Google-TPU-Kapazität für Anthropic, OCI/Stargate.
Inferenz
- Stärker verteilt, latenzsensibel, näher an Kunden und Anwendungen.
- Google beschreibt Ironwood TPU explizit als auf Inferenz ausgelegt; AI-fokussierte Data Center wachsen laut IEA besonders schnell.
- Bei hohen Volumina zählen nicht nur GPUs, sondern Strompreis, Auslastung, Netzwerk, Speicher und Softwarestack.
China: eigene Marktlogik, eigene Anbieter, andere Engpässe
China hat eine starke nationale Cloud-/Compute-Infrastruktur, aber der Chipzugang unterscheidet sich strukturell vom Westen. Staatliche Hubs, Telco-Clouds und lokale Modellplattformen spielen eine größere Rolle.
| Anbieter | Belegte Rolle | Ausgewählte Kennzahl / Fakt | Quelle |
|---|---|---|---|
| Alibaba Cloud | PAI-Lingjun für heterogene KI-Cluster, Training und Inferenz | Regionen u. a. Ulanqab, Shenzhen, Beijing, Shanghai, Hangzhou, Singapore | Alibaba Cloud Docs 2026 |
| Tencent Cloud | Cloud-GPU und AI-Cloud | AI-Cloud-Umsatz FY2024 etwa verdoppelt; interne GPU-Nutzung begrenzte externes Wachstum | Tencent FY2024 Results |
| Huawei Cloud | Pangu/ModelArts und Ascend-orientierte KI-Infrastruktur | PanguLM-Doku nennt Training und Inferenz | Huawei Cloud Docs |
| Baidu AI Cloud | ERNIE/Qianfan und AI-Cloud | AI-Cloud-Umsatz Q4 2024 +26% YoY; ERNIE ca. 1,65 Mrd. API-Aufrufe pro Tag im Dezember 2024 | Baidu FY2024 Results |
| ByteDance / Volcano Engine | ByteDance Cloud-/AI-Plattform | NVIDIA dokumentiert AI-Enterprise-Deployment auf Volcano Engine Cloud | NVIDIA Docs 2026 |
| China Mobile / Telecom / Unicom | Telco-Clouds mit Computing Power, AI-Training/Inferenz und Cloud-Umsätzen | China Mobile Cloud 2024 RMB 100,4 Mrd.; Unicom CDSA 2024 RMB 82,49 Mrd. | Annual Reports 2024 |
| SenseTime / SenseCore | AIDC und Generative-AI-Infrastruktur | SenseCore 23.000 PetaFLOPS Gesamt-Compute; +92% YoY | SenseTime 2025 |
Daten: assets/data/china-anbieter.csv. Marktanteile aus IDC sind sekundär berichtet; direkte IDC-Reports sind nicht vollständig frei verfügbar.
Ausblick 2026–2029: belegte Prognosen, keine eigene Schätzung
Nachfrage steigt weiter
IDC erwartet globale AI-Infrastructure-Spending von 487 Mrd. USD 2026 und mehr als 1 Bio. USD 2029. IEA erwartet Data-Center-Stromverbrauch von rund 950 TWh 2030; AI-fokussierte Data Center sollen 2025–2030 etwa verdreifachen.
Capex bleibt konzentriert
Dell'Oro erwartet 21% CAGR bei Data-Center-Capex bis 2029. Die Top-4-US-Cloud-Anbieter Amazon, Google, Meta und Microsoft standen 2025 für fast die Hälfte der globalen Data-Center-Capex.
Engpass wird ganzheitlich
IEA nennt Strom- und Netzanschluss als Verzögerungsrisiko; ohne Gegenmaßnahmen könnten rund 20% geplanter Data-Center-Projekte verzögert werden. IDC nennt zusätzlich Speicher-/Storage-Komponentenknappheit und Exportkontrollen.
China bleibt Sonderfall
China baut staatlich koordinierte Compute-Hubs und Telco-Clouds aus, arbeitet aber unter Exportkontrollen für Advanced-Computing-Chips und HBM. Dadurch ist die lokale Anbieterstruktur nicht eins zu eins mit AWS/Azure/Google vergleichbar.
Engpässe und Kill-Kriterien für die Marktthese
| Engpass | Belegter Fakt | Warum relevant? | Quelle |
|---|---|---|---|
| Strom / Netzanschluss | IEA: rund 20% geplanter Data-Center-Projekte könnten ohne Gegenmaßnahmen verzögert werden. | Kapazität entsteht nicht nur durch GPUs; Netzanschluss wird zum Zeitplanrisiko. | IEA 2025 |
| Rack-Leistungsdichte / Kühlung | IEA: AI-Serverrack kann bis 2027 Spitzenlast wie 65 Haushalte erreichen; AI-Server-Power-Density 2020–2025 um 11x gestiegen. | Luftkühlung reicht nicht immer; Liquid Cooling und Stromverteilung werden kritischer. | IEA 2026 |
| GPU/ASIC und HBM | IDC nennt Memory-/Storage-Komponentenknappheit; BIS kontrolliert Advanced-Computing-Chips und HBM mit China-Bezug. | Chip- und HBM-Verfügbarkeit bestimmen, ob gebaute Hallen produktiv werden. | IDC 2026 / BIS 2023–2024 |
| Auslastung / Überbau | Öffentlich nicht einheitlich messbar. | Bei sinkender Modellkostenkurve kann Kapazität profitabel sein; bei falschem Standort oder Kundenmix droht Überbau. | k. A. — Recherche ausstehend |
| Regulierung / Exportkontrollen | BIS verschärfte 2023/2024 Advanced-Computing- und HBM-Kontrollen gegen China. | Verschiebt Nachfrage, Anbieterwahl und Training-Standorte. | U.S. BIS |
Quellenapparat
Primärquellen und öffentliche Institutionen haben Vorrang. Sekundärquellen sind klar als Marktforschungs- oder Medienquellen markiert.
| Quelle | Typ | Verwendung | Link |
|---|---|---|---|
| IEA — Energy and AI / Key Questions on Energy and AI | Institution | Stromverbrauch, regionale Anteile, Engpässe, AI-fokussierte Data Center | IEA 2025 / IEA 2026 |
| IDC | Marktforschung | AI-Infrastructure-Spending 2025/2026/2029 | IDC Blog, April 2026 |
| Dell'Oro | Marktforschung | Data-Center-Capex CAGR bis 2029, Top-4-US-Cloud-Capex | PRNewswire/Dell'Oro 2025 |
| Synergy Research | Marktforschung | Hyperscale-Anzahl, Kapazität, US-Anteil, Amazon/Microsoft/Google-Kapazität | Synergy Research |
| Microsoft, Amazon, Alphabet, Meta | Primärquellen | Capex-Ausblicke und AI-Infrastruktur-Kommentare | Microsoft · Amazon · Alphabet · Meta |
| AWS, Google, Oracle, NVIDIA, CoreWeave, Crusoe, Lambda, Nebius, Applied Digital | Primärquellen | Cluster-, GPU-, TPU-, MW- und Vertragsfakten | AWS Project Rainier · Google Ironwood TPU · Oracle OCI Supercluster · CoreWeave · Crusoe · Lambda · Nebius · Applied Digital |
| Alibaba, Tencent, Huawei, Baidu, China Mobile, China Telecom, China Unicom, SenseTime, U.S. BIS | Primär-/Staatsquellen | China-Anbieter, staatliche Cluster, Exportkontrollen | Alibaba Lingjun · Tencent FY2024 · Baidu FY2024 · China Mobile · China Telecom · China Unicom · U.S. BIS 2023 · U.S. BIS 2024 |
Offene Punkte / nächste Vertiefung
- Investierbare Unterdossiers prüfen: CoreWeave, Oracle, Applied Digital, Digital Realty, Equinix, Vertiv, Schneider Electric, Eaton.
- Regionale Strom-/Netzanschlussdaten USA, Europa, China separat erfassen.
- Capex in Gebäude/Strom/Kühlung vs. Server/GPU/HBM aufteilen, wo Unternehmen es offenlegen.
- KI-Training und Inferenz nach öffentlich belegten Clusterbeispielen weiter trennen.
- China-Daten aus Annual Reports lokal in `sources/` sichern.