Use Case · Nachfragetreiber
Robotik & physische KI
Humanoide Roboter, autonome Fahrzeuge (AV, Autonomous Vehicle), Drohnen und Industrierobotik — zusammengefasst als Embodied AI (verkörperte KI: Systeme, die Wahrnehmung, Steuerung und Handlung in der echten Welt vereinen). Wie bei Vision & Perzeption: Training und Simulation erzeugen Datacenter-Storage, die Inferenz läuft am Edge (gerätenahe Verarbeitung direkt auf dem Roboter/Fahrzeug) — kaum Datacenter-Speicher. Sehr hohe IP-Intensität (VLA-Modelle und Demonstrationsdaten), aber heute geringe aggregierte DC-Speicher-Last.
Bedarfssignatur
| Dimension | Bedarf | Kurzbegründung |
|---|---|---|
| HBM (Beschleuniger) | N | Inferenz läuft on-device am Edge; im Datacenter nur beim Training — kein nennenswerter Dauer-HBM-Bedarf im DC durch laufende Flotten. |
| DRAM (Server) | N | Aus demselben Grund: Inferenz am Edge, DC-DRAM nur während Trainingskampagnen belastet. |
| NAND / Storage | H | Simulationsdaten, Sensor-Logs, Demonstrationsdaten und Weltmodell-Training erzeugen umfangreiche, wachsende Datenseen im Datacenter. |
| Compute (Kontext) | H | Beim Training (Welt-/Policy-Modelle plus Simulation im DC) hoch; Inferenz am Edge — Datacenter-Compute tritt schubweise bei Trainings-Runs auf. |
Was es ist & Reifegrad
Physische bzw. Embodied AI (verkörperte KI) bezeichnet Systeme, die Wahrnehmung, Steuerung und Aktion in der echten Welt vereinen: Humanoide Roboter, autonome Fahrzeuge (AV), Drohnen sowie Lager- und Industrierobotik. Das verbindende Element ist die Schleife Sensorik → Modell → Aktor in physischer Umgebung. Die Steuerung übernimmt zunehmend eine Policy (gelernte Steuerungsstrategie, die Sensoreingaben auf Aktionen abbildet) — häufig in Form eines VLA-Modells (Vision-Language-Action-Modell, das Bild, Sprachinstruktion und Aktion in einem Netz verbindet).
Reifegrad (Einschätzung): stark unterschiedlich je Segment. Industrierobotik und Lagerautomatisierung sind teils produktiv und skalieren; autonome Fahrzeuge befinden sich im Pilotbetrieb mit wachsenden Flotten; humanoide Roboter sind früh — erste Demonstrations- und Kleinserienprogramme, aber keine Massenproduktion. Drohnen im kommerziellen Bereich (Logistik, Inspektion) wachsen, regulatorisch unterschiedlich weit.
Stand der Dinge / Dynamik
Beim nächsten Review hier aktualisieren — das ist der lebende Teil der Seite.
- VLA-Modelle als Architektur-Front: Die methodische Front liegt bei VLA-Modellen (Vision-Language-Action) und Weltmodellen — ein einziges Netz bildet Kamerabild plus Sprachinstruktion auf Roboteraktionen ab. Hier sitzt die hohe IP-Intensität (proprietäre Architektur, Trainingsdaten, R&D). (Einschätzung, zu belegen.)
- Sim-to-Real und Demonstrationsdaten: Trainiert wird teils per Sim-to-Real (Lernen in Simulation, Übertragung auf reale Umgebung) und teils per Imitation Learning aus realen Demonstrationen. Reale Daten entstehen vor allem durch Teleoperation (ein Mensch steuert den Roboter ferngesteuert, die Bewegung wird als Lehrbeispiel aufgezeichnet) — operativ teuer und der eigentliche Engpass Engpass: hoch. Belegte Größenordnung offener Forschungsdatensätze: DROID umfasst 76.000 Demonstrations-Trajektorien bzw. 350 Stunden Interaktionsdaten, erhoben über 12 Monate an 13 Instituten; Open X-Embodiment aggregiert über 1 Mio. Trajektorien aus 60 Datensätzen (siehe Diagramm).
- Onboard-Compute am Edge: Plattformen wie der Nvidia Jetson Thor positionieren die Inferenz on-device — 128 GB LPDDR5X-Speicher direkt im Roboter, nicht im Datacenter. Das ist die strukturelle Grenze: laufender Betrieb belastet kaum DC-HBM/DRAM. (Anbieter-Spezifikation, siehe Kennzahlen.)
- Humanoide Programme & AV-Skalierung: Mehrere Unternehmen investieren substanziell in humanoide Roboter-Programme; autonome Fahrzeuge skalieren in Pilotmärkten. Aktuelle Stückzahlen, Zeitpläne und Flottengrößen sind noch nachzutragen. (Sekundärinfo, zu belegen.)
VLA-/Sim-to-Real-Aussagen sind Einschätzungen; die Datensatz-Größenordnungen (DROID, OXE) und die Jetson-Thor-Spezifikation sind belegt (siehe Diagramm und Kennzahlen). Vor harter Verwendung in der These gegen Primärquellen prüfen.
Treiber-Mechanik → Hardware
Warum Robotik Storage (im Datacenter) und Edge-Compute treibt:
Storage — Training & Simulation
- Sensor-Logs: Kameras, LiDAR (Light Detection and Ranging, laserbasierte Abstands-/Tiefenmessung), IMU (Inertial Measurement Unit, Lage-/Beschleunigungssensorik) und weitere Sensoren erzeugen je Fahrzeug/Roboter hohe Datenraten; bei wachsenden Flotten skaliert das Volumen linear. Diese landen als NAND-/Storage-Last im Datacenter (siehe Kioxia, SanDisk).
- Sim-Rollouts: Simulationsumgebungen erzeugen über Sim-to-Real große Mengen synthetischer Trajektorien und Szenen — ebenfalls Datacenter-Storage.
- Demonstrationsdaten: Teleoperierte Läufe und Imitation-Learning-Daten sind aufwendig zu sammeln und dauerhaft zu archivieren Engpass: hoch.
Edge-Inferenz
- Policy am Edge: Die ausgerollte Policy (gelernte Steuerungsstrategie) und der Perception-Stack laufen on-device auf einer NPU (Neural Processing Unit, KI-Beschleuniger im Gerät) bzw. einem System-on-Module wie dem Nvidia Jetson Thor — Datacenter-HBM (High Bandwidth Memory) und -DRAM werden während des Betriebs kaum belastet.
- Datacenter-Compute schubweise: Große Trainings-Runs und Simulations-Batches treffen den DC in Kampagnen, nicht als stetiger Dauerbetrieb. Der Trainings-Stack hängt an den GPU-Plattformen der Data-Center-/Chip-Fertigung-Ebene.
Größenordnung offener Demonstrations-/Trainingsdatensätze
Zeitraum: 2023–2024 · Einheit: Anzahl realer Demonstrations-Trajektorien (logarithmische Größenordnung, Balken gestaucht) · Legende: reale Trajektorien.
Quelle: DROID (RSS 2024) — 76.000 Trajektorien bzw. 350 Std., 564 Szenen, 86 Aufgaben, 12 Monate, ein Robotertyp; Open X-Embodiment (arXiv 2310.08864) — >1 Mio. Trajektorien, 22 Embodiments, Aggregat aus 60 Datensätzen. Reported. Balkenlängen sind nur Größenordnung — die Aussage ist, wie aufwendig reale Robotik-Daten zu erheben sind und dass sie als DC-Storage anfallen. Rohdaten: assets/data/robotik-demonstrationsdaten.csv.
Kennzahlen
Quantitative Anker — vor Eintrag belegen (Quelle, Zeitraum, Einheit, reported/geschätzt).
| Kennzahl | Wert | Zeitraum | Quelle |
|---|---|---|---|
| DROID — reale Demonstrations-Trajektorien | 76.000 (= 350 Std.) | 2024 | DROID, RSS 2024 |
| Open X-Embodiment — aggregierte Trajektorien | >1 Mio. (22 Embodiments) | 2023 | arXiv 2310.08864 |
| Edge-Onboard-Speicher (Nvidia Jetson AGX Thor) | 128 GB LPDDR5X (273 GB/s) | 2025 | NVIDIA Jetson Thor |
| Edge-Onboard-AI-Compute (Jetson AGX Thor) | 2.070 TFLOPS (FP4, sparse), 40–130 W | 2025 | NVIDIA Jetson Thor |
| Marktgröße Robotik / Humanoide | k. A. — Recherche ausstehend | k. A. | Recherche ausstehend |
| PB Simulations-/Sensordaten je Programm | k. A. — Recherche ausstehend | k. A. | Recherche ausstehend |
| Anteil DC-Training vs. Edge-Inferenz (Compute) | k. A. — Recherche ausstehend | k. A. | Recherche ausstehend |
| Stückzahlen ausgerollter Systeme (Humanoide / AV) | k. A. — Recherche ausstehend | k. A. | Recherche ausstehend |
Belegt: Datensatz-Größenordnungen (DROID, OXE) und Jetson-Thor-Spezifikation. Übrige Zeilen sind Platzhalter — belegte Rohdaten nach assets/data/ legen und mit dieser Tabelle synchron halten. Rohdaten: assets/data/robotik-demonstrationsdaten.csv, assets/data/robotik-edge-compute.csv. DROID und OXE bilden einen Robotertyp bzw. ein Aggregat ab — keine Markt-/Flottenzahl, sondern Indikator für den Aufwand realer Datenerhebung.
Edge vs. Datacenter
Inferenz am Edge — die laufende Policy (gelernte Steuerungsstrategie) und der Perception-Stack werden auf dem Gerät ausgeführt (Roboter, Fahrzeug, Drohne), typisch auf einer NPU bzw. einem System-on-Module. Konkretes Beispiel: der Nvidia Jetson AGX Thor trägt 128 GB LPDDR5X-Speicher und 2.070 TFLOPS (FP4) direkt im Gerät, bei 40–130 W — der gesamte Inferenz-Speicher sitzt also am Edge, nicht im Rechenzentrum. Das Datacenter ist zuständig für Training und Simulation: Weltmodelle, Policy-Training (auch per VLA-Modellen), große Simulations-Batches. Der Datacenter-Anteil ist zeitlich konzentriert (Trainingskampagnen) statt gleichmäßig verteilt. Genau deshalb erzeugt eine wachsende Roboterflotte heute kaum aggregierte DC-HBM/DRAM-Last.
Bedeutung für die Speicher-/Storage-These
Beobachten / offene Fragen
- Skalierung der Humanoiden-Programme: Stückzahlen, Zeitpläne und Kosten je Einheit als Indikatoren für die Adoptionsgeschwindigkeit.
- Volumen der Simulations- und Sensordaten: Wächst es proportional zur Flottengröße oder gibt es Effizienzgewinne durch bessere Sim-to-Real-Methoden? (Bessere Sim-to-Real-Übertragung kann den Bedarf an teurer Teleoperation senken.)
- Sim-to-Real-Fortschritt: Wie viel synthetische vs. reale Demonstrationsdaten brauchen VLA-/Weltmodelle? Das bestimmt den Storage-Bedarf maßgeblich (vgl. DROID-/OXE-Größenordnung im Diagramm).
- Ob Weltmodell-Training (Foundation Models für Robotik, d. h. breit vortrainierte Basismodelle) große, stetige DC-Trainingsflotten erfordert — das würde den Datacenter-Compute- und damit indirekt den HBM/DRAM-Beitrag erhöhen.
Quellen & Update-Log
Quellen mit klickbaren Links (Primär- bzw. anbieternah vor Sekundärquellen):
- DROID: A Large-Scale In-The-Wild Robot Manipulation Dataset (RSS 2024) — 76.000 Trajektorien / 350 Std., Demonstrationsdaten-Größenordnung.
- Open X-Embodiment: Robotic Learning Datasets and RT-X Models (arXiv 2310.08864, 2023) — >1 Mio. aggregierte Trajektorien, 22 Embodiments.
- NVIDIA Jetson Thor — Edge-Onboard-Compute/Speicher (128 GB LPDDR5X, 2.070 TFLOPS FP4, 40–130 W).
VLA-/Sim-to-Real-Methodenaussagen und Reifegrad bleiben Einschätzungen. Markt-/Flottenzahlen (Stückzahlen Humanoide/AV, PB je Programm) sind weiterhin offen — vor Verwendung in der These mit Primärquellen härten.
| Datum | Änderung |
|---|---|
| 2026-05-21 | Akronyme inline aufgelöst (VLA, Sim-to-Real, Policy, Teleoperation, IMU, LiDAR, AV, Edge, NPU, HBM, DRAM, NAND, Embodied AI). Querverweise (Micron/Kioxia/SanDisk, Data-Center/Chip-Fertigung/Nvidia, Vision-Schwesterseite) gesetzt. Engpass- und IP-Intensität-Pills ergänzt. Balkendiagramm Demonstrationsdaten (DROID vs. OXE) und belegte Kennzahlen (DROID, OXE, Jetson Thor) eingetragen; Rohdaten-CSVs angelegt. |
| 2026-05-20 | Seite als Gerüst angelegt (Template, Bedarfssignatur, Platzhalter-Kennzahlen). |