Robotik & physische KI

Use Case · Nachfragetreiber

Robotik & physische KI

Humanoide Roboter, autonome Fahrzeuge (AV, Autonomous Vehicle), Drohnen und Industrierobotik — zusammengefasst als Embodied AI (verkörperte KI: Systeme, die Wahrnehmung, Steuerung und Handlung in der echten Welt vereinen). Wie bei Vision & Perzeption: Training und Simulation erzeugen Datacenter-Storage, die Inferenz läuft am Edge (gerätenahe Verarbeitung direkt auf dem Roboter/Fahrzeug) — kaum Datacenter-Speicher. Sehr hohe IP-Intensität (VLA-Modelle und Demonstrationsdaten), aber heute geringe aggregierte DC-Speicher-Last.

Profil: Storage-geführt · Edge Reifegrad: früh (Humanoide), teils produktiv (Industrie) Training im DC, Inferenz am Edge Engpass (Demonstrationsdaten): hoch IP-Intensität: hoch Stand: 2026-05-21

Bedarfssignatur

DimensionBedarfKurzbegründung
HBM (Beschleuniger)NInferenz läuft on-device am Edge; im Datacenter nur beim Training — kein nennenswerter Dauer-HBM-Bedarf im DC durch laufende Flotten.
DRAM (Server)NAus demselben Grund: Inferenz am Edge, DC-DRAM nur während Trainingskampagnen belastet.
NAND / StorageHSimulationsdaten, Sensor-Logs, Demonstrationsdaten und Weltmodell-Training erzeugen umfangreiche, wachsende Datenseen im Datacenter.
Compute (Kontext)HBeim Training (Welt-/Policy-Modelle plus Simulation im DC) hoch; Inferenz am Edge — Datacenter-Compute tritt schubweise bei Trainings-Runs auf.

Was es ist & Reifegrad

Physische bzw. Embodied AI (verkörperte KI) bezeichnet Systeme, die Wahrnehmung, Steuerung und Aktion in der echten Welt vereinen: Humanoide Roboter, autonome Fahrzeuge (AV), Drohnen sowie Lager- und Industrierobotik. Das verbindende Element ist die Schleife Sensorik → Modell → Aktor in physischer Umgebung. Die Steuerung übernimmt zunehmend eine Policy (gelernte Steuerungsstrategie, die Sensoreingaben auf Aktionen abbildet) — häufig in Form eines VLA-Modells (Vision-Language-Action-Modell, das Bild, Sprachinstruktion und Aktion in einem Netz verbindet).

Reifegrad (Einschätzung): stark unterschiedlich je Segment. Industrierobotik und Lagerautomatisierung sind teils produktiv und skalieren; autonome Fahrzeuge befinden sich im Pilotbetrieb mit wachsenden Flotten; humanoide Roboter sind früh — erste Demonstrations- und Kleinserienprogramme, aber keine Massenproduktion. Drohnen im kommerziellen Bereich (Logistik, Inspektion) wachsen, regulatorisch unterschiedlich weit.

Stand der Dinge / Dynamik

Beim nächsten Review hier aktualisieren — das ist der lebende Teil der Seite.

  • VLA-Modelle als Architektur-Front: Die methodische Front liegt bei VLA-Modellen (Vision-Language-Action) und Weltmodellen — ein einziges Netz bildet Kamerabild plus Sprachinstruktion auf Roboteraktionen ab. Hier sitzt die hohe IP-Intensität (proprietäre Architektur, Trainingsdaten, R&D). (Einschätzung, zu belegen.)
  • Sim-to-Real und Demonstrationsdaten: Trainiert wird teils per Sim-to-Real (Lernen in Simulation, Übertragung auf reale Umgebung) und teils per Imitation Learning aus realen Demonstrationen. Reale Daten entstehen vor allem durch Teleoperation (ein Mensch steuert den Roboter ferngesteuert, die Bewegung wird als Lehrbeispiel aufgezeichnet) — operativ teuer und der eigentliche Engpass Engpass: hoch. Belegte Größenordnung offener Forschungsdatensätze: DROID umfasst 76.000 Demonstrations-Trajektorien bzw. 350 Stunden Interaktionsdaten, erhoben über 12 Monate an 13 Instituten; Open X-Embodiment aggregiert über 1 Mio. Trajektorien aus 60 Datensätzen (siehe Diagramm).
  • Onboard-Compute am Edge: Plattformen wie der Nvidia Jetson Thor positionieren die Inferenz on-device — 128 GB LPDDR5X-Speicher direkt im Roboter, nicht im Datacenter. Das ist die strukturelle Grenze: laufender Betrieb belastet kaum DC-HBM/DRAM. (Anbieter-Spezifikation, siehe Kennzahlen.)
  • Humanoide Programme & AV-Skalierung: Mehrere Unternehmen investieren substanziell in humanoide Roboter-Programme; autonome Fahrzeuge skalieren in Pilotmärkten. Aktuelle Stückzahlen, Zeitpläne und Flottengrößen sind noch nachzutragen. (Sekundärinfo, zu belegen.)

VLA-/Sim-to-Real-Aussagen sind Einschätzungen; die Datensatz-Größenordnungen (DROID, OXE) und die Jetson-Thor-Spezifikation sind belegt (siehe Diagramm und Kennzahlen). Vor harter Verwendung in der These gegen Primärquellen prüfen.

Treiber-Mechanik → Hardware

Warum Robotik Storage (im Datacenter) und Edge-Compute treibt:

Storage — Training & Simulation

  • Sensor-Logs: Kameras, LiDAR (Light Detection and Ranging, laserbasierte Abstands-/Tiefenmessung), IMU (Inertial Measurement Unit, Lage-/Beschleunigungssensorik) und weitere Sensoren erzeugen je Fahrzeug/Roboter hohe Datenraten; bei wachsenden Flotten skaliert das Volumen linear. Diese landen als NAND-/Storage-Last im Datacenter (siehe Kioxia, SanDisk).
  • Sim-Rollouts: Simulationsumgebungen erzeugen über Sim-to-Real große Mengen synthetischer Trajektorien und Szenen — ebenfalls Datacenter-Storage.
  • Demonstrationsdaten: Teleoperierte Läufe und Imitation-Learning-Daten sind aufwendig zu sammeln und dauerhaft zu archivieren Engpass: hoch.

Edge-Inferenz

  • Policy am Edge: Die ausgerollte Policy (gelernte Steuerungsstrategie) und der Perception-Stack laufen on-device auf einer NPU (Neural Processing Unit, KI-Beschleuniger im Gerät) bzw. einem System-on-Module wie dem Nvidia Jetson Thor — Datacenter-HBM (High Bandwidth Memory) und -DRAM werden während des Betriebs kaum belastet.
  • Datacenter-Compute schubweise: Große Trainings-Runs und Simulations-Batches treffen den DC in Kampagnen, nicht als stetiger Dauerbetrieb. Der Trainings-Stack hängt an den GPU-Plattformen der Data-Center-/Chip-Fertigung-Ebene.

Größenordnung offener Demonstrations-/Trainingsdatensätze

Zeitraum: 2023–2024 · Einheit: Anzahl realer Demonstrations-Trajektorien (logarithmische Größenordnung, Balken gestaucht) · Legende: reale Trajektorien.

DROID (2024)
76.000
Open X-Embodiment (2023)
>1 Mio.

Quelle: DROID (RSS 2024) — 76.000 Trajektorien bzw. 350 Std., 564 Szenen, 86 Aufgaben, 12 Monate, ein Robotertyp; Open X-Embodiment (arXiv 2310.08864) — >1 Mio. Trajektorien, 22 Embodiments, Aggregat aus 60 Datensätzen. Reported. Balkenlängen sind nur Größenordnung — die Aussage ist, wie aufwendig reale Robotik-Daten zu erheben sind und dass sie als DC-Storage anfallen. Rohdaten: assets/data/robotik-demonstrationsdaten.csv.

Wie Vision & Perzeption — Storage-relevant (Training/Sim), aber geringer Datacenter-HBM/DRAM-Beitrag. Das ist eine Grenze der Memory-These: Robotik treibt die Storage-Seite (NAND), nicht die HBM/DRAM-Seite des Datacenter-Speichers (siehe Arbeitsspeicher).

Kennzahlen

Quantitative Anker — vor Eintrag belegen (Quelle, Zeitraum, Einheit, reported/geschätzt).

KennzahlWertZeitraumQuelle
DROID — reale Demonstrations-Trajektorien76.000 (= 350 Std.)2024DROID, RSS 2024
Open X-Embodiment — aggregierte Trajektorien>1 Mio. (22 Embodiments)2023arXiv 2310.08864
Edge-Onboard-Speicher (Nvidia Jetson AGX Thor)128 GB LPDDR5X (273 GB/s)2025NVIDIA Jetson Thor
Edge-Onboard-AI-Compute (Jetson AGX Thor)2.070 TFLOPS (FP4, sparse), 40–130 W2025NVIDIA Jetson Thor
Marktgröße Robotik / Humanoidek. A. — Recherche ausstehendk. A.Recherche ausstehend
PB Simulations-/Sensordaten je Programmk. A. — Recherche ausstehendk. A.Recherche ausstehend
Anteil DC-Training vs. Edge-Inferenz (Compute)k. A. — Recherche ausstehendk. A.Recherche ausstehend
Stückzahlen ausgerollter Systeme (Humanoide / AV)k. A. — Recherche ausstehendk. A.Recherche ausstehend

Belegt: Datensatz-Größenordnungen (DROID, OXE) und Jetson-Thor-Spezifikation. Übrige Zeilen sind Platzhalter — belegte Rohdaten nach assets/data/ legen und mit dieser Tabelle synchron halten. Rohdaten: assets/data/robotik-demonstrationsdaten.csv, assets/data/robotik-edge-compute.csv. DROID und OXE bilden einen Robotertyp bzw. ein Aggregat ab — keine Markt-/Flottenzahl, sondern Indikator für den Aufwand realer Datenerhebung.

Edge vs. Datacenter

Inferenz am Edge — die laufende Policy (gelernte Steuerungsstrategie) und der Perception-Stack werden auf dem Gerät ausgeführt (Roboter, Fahrzeug, Drohne), typisch auf einer NPU bzw. einem System-on-Module. Konkretes Beispiel: der Nvidia Jetson AGX Thor trägt 128 GB LPDDR5X-Speicher und 2.070 TFLOPS (FP4) direkt im Gerät, bei 40–130 W — der gesamte Inferenz-Speicher sitzt also am Edge, nicht im Rechenzentrum. Das Datacenter ist zuständig für Training und Simulation: Weltmodelle, Policy-Training (auch per VLA-Modellen), große Simulations-Batches. Der Datacenter-Anteil ist zeitlich konzentriert (Trainingskampagnen) statt gleichmäßig verteilt. Genau deshalb erzeugt eine wachsende Roboterflotte heute kaum aggregierte DC-HBM/DRAM-Last.

Bedeutung für die Speicher-/Storage-These

Robotik & physische KI ist ein Storage-Treiber (Training, Simulation, Sensor- und Demonstrationsdaten im Datacenter) und ein Edge-Compute-Treiber, aber kein nennenswerter Treiber für Datacenter-HBM (High Bandwidth Memory) oder -DRAM im laufenden Betrieb. Das stützt die Storage-/NAND-Seite der These (NAND-Spieler Kioxia und SanDisk; Micron mit DRAM- und NAND-Standbein), nicht die HBM/DRAM-Seite (siehe Arbeitsspeicher). Profil ähnelt Vision & Perzeption — beide haben Inferenz am Edge und Training/Sim im DC. Nüchtern eingeordnet: hohe IP-Intensität IP-Intensität: hoch (VLA-Modelle, Demonstrationsdaten, R&D) und früher Reifegrad bedeuten gerade nicht eine entsprechend hohe unmittelbare DC-Speicher-Last — der Beitrag zur Memory-These ist heute klein und vor allem auf der Storage-Seite zu suchen.

Beobachten / offene Fragen

  • Skalierung der Humanoiden-Programme: Stückzahlen, Zeitpläne und Kosten je Einheit als Indikatoren für die Adoptionsgeschwindigkeit.
  • Volumen der Simulations- und Sensordaten: Wächst es proportional zur Flottengröße oder gibt es Effizienzgewinne durch bessere Sim-to-Real-Methoden? (Bessere Sim-to-Real-Übertragung kann den Bedarf an teurer Teleoperation senken.)
  • Sim-to-Real-Fortschritt: Wie viel synthetische vs. reale Demonstrationsdaten brauchen VLA-/Weltmodelle? Das bestimmt den Storage-Bedarf maßgeblich (vgl. DROID-/OXE-Größenordnung im Diagramm).
  • Ob Weltmodell-Training (Foundation Models für Robotik, d. h. breit vortrainierte Basismodelle) große, stetige DC-Trainingsflotten erfordert — das würde den Datacenter-Compute- und damit indirekt den HBM/DRAM-Beitrag erhöhen.

Quellen & Update-Log

Quellen mit klickbaren Links (Primär- bzw. anbieternah vor Sekundärquellen):

VLA-/Sim-to-Real-Methodenaussagen und Reifegrad bleiben Einschätzungen. Markt-/Flottenzahlen (Stückzahlen Humanoide/AV, PB je Programm) sind weiterhin offen — vor Verwendung in der These mit Primärquellen härten.

DatumÄnderung
2026-05-21Akronyme inline aufgelöst (VLA, Sim-to-Real, Policy, Teleoperation, IMU, LiDAR, AV, Edge, NPU, HBM, DRAM, NAND, Embodied AI). Querverweise (Micron/Kioxia/SanDisk, Data-Center/Chip-Fertigung/Nvidia, Vision-Schwesterseite) gesetzt. Engpass- und IP-Intensität-Pills ergänzt. Balkendiagramm Demonstrationsdaten (DROID vs. OXE) und belegte Kennzahlen (DROID, OXE, Jetson Thor) eingetragen; Rohdaten-CSVs angelegt.
2026-05-20Seite als Gerüst angelegt (Template, Bedarfssignatur, Platzhalter-Kennzahlen).