CXL-Technologie: Eine skalierbare Lösung zur Steigerung der Rechenzentrumsleistung

cxl

Denis Petronenko

Von Denis Petronenko, Leiter des Bereichs Telekommunikation bei Promwad. Hier teilen wir seine Gastkolumne, die auf thefastmode.com veröffentlicht wurde, einer führenden unabhängigen Forschungs- und Medienmarke, die aktuelle Nachrichten, Analysen und Einblicke für den globalen IT-/Telekommunikationssektor liefert.

 

Da KI-Modelle immer komplexer werden, benötigen sie mehr Speicher und schnellere Verarbeitungsgeschwindigkeiten. Das Trainieren von KI-Modellen wie ChatGPT verbraucht so viel Energie wie Tausende von Haushalten. Nach Angaben der Internationalen Energieagentur (IEA) entfallen auf Rechenzentren etwa 1-1,5 % des weltweiten Stromverbrauchs.

Rechenzentren können nicht immer mit der Belastung Schritt halten und benötigen intelligentere Lösungen. Wir beweisen, dass die CXL-Technologie helfen kann, Daten- und Energieprobleme zu bewältigen.

 

Was ist CXL und wie verwaltet es Daten?

Ziel der Ingenieure ist es, skalierbare Systeme wie Supercomputer zu bauen, die jede Aufgabe bewältigen können. NVIDIA dominiert den Markt dank seiner skalierbaren Architektur, die auf GPUs für komplexe Aufgaben basiert, und der aktiven Nutzung von Open-Source-Code. Dies ist jedoch nicht die endgültige Lösung. Der Erfolg von NVIDIA beruht auf der hohen Nachfrage nach Rechenressourcen, KI, Kryptowährungen und Cloud-Diensten, basiert aber auf seiner proprietären Architektur.

CXL, das für Compute Express Link steht, bietet eine flexible und skalierbare Alternative. Es ist ein offener Standard für die Verbindung von CPUs, Geräten und Speicher mit hoher Geschwindigkeit und Kapazität. PCI Express (PCIe)-Technologie, die interne Komponenten wie Grafikkarten und Speichercontroller mit dem Motherboard verbindet, bildet die Grundlage von CXL.

Ein Konsortium von Technologieunternehmen, darunter Intel, AMD und Arm, entwickelte diese Technologie, wobei Microchip Technology eine dominante Rolle spielt.

CXL ist nicht auf ein bestimmtes Werkzeug beschränkt und kann mit verschiedenen Plattformen arbeiten, einschließlich NVIDIA-Produkten und anderen Chips. Es kombiniert verschiedene Tools zu einer einzigen skalierbaren Plattform.

Im Vergleich zu anderen Architekturen punktet CXL in Sachen Skalierbarkeit. Viele Unternehmen stellen zwar elektronische Chips her, aber die Verwaltung dieser Chips mit Software ist eine Herausforderung. CXL verknüpft alle Knoten zu einer einheitlichen Architektur und optimiert jeden Teil. Neueste CXL-Updates umfassen neue Standards und Chips, die dies ermöglichen. Daten bewegen sich Punkt-zu-Punkt mit hoher Geschwindigkeit und minimalem Energieverbrauch – einer der Hauptvorteile von CXL.

Mit der neuen CXL 3.1-Spezifikation werden frühere Versionen mit verbesserter Ressourceneffizienz erweitert. Die Technologie bietet zudem sichere On-Demand-Rechenumgebungen, erweitert die Speicherpartitionierung und -pools zur Minimierung ungenutzten Speichers und unterstützt die gemeinsame Nutzung von Speicher zwischen GPU-Beschleunigern.

 

CXL-Komponenten

Der CXL-Standard umfasst drei Hauptprotokolle:

  1. CXL.cache ermöglicht es der GPU oder FPGA, Daten vorübergehend zu speichern, Aufgaben auszuführen und diese dann zur weiteren Datenverarbeitung an den Hauptprozessor zurückzusenden.
  2. CXL.mem konfiguriert den über CXL verbundenen Speicher und vereinfacht dessen Nutzung für Software, ähnlich wie bei normalem Speicher, jedoch mit deutlich weniger Latenz.
  3. CXL.io bezieht sich auf den bestehenden PCIe-Standard, jedoch mit Anpassungen zur Leistungsverbesserung in CXL-Anwendungen.

 

Vorteile von CXL

CXL ist flexibel und wechselt automatisch zwischen PCIe- und CXL-Protokollen, je nach den Bedürfnissen der angeschlossenen Geräte. Auf diese Weise können eine Vielzahl von Konfigurationen mit derselben Hardware erstellt werden.

Was ist noch zu erwarten?

  • Verbesserte Kapazität und dynamische Ressourcenteilung
  • Optimierte Leistung für KI/ML und Analysen
  • Reduzierte Latenz
  • Flexible, skalierbare Infrastruktur
  • Energieeffizienz
  • Einsparung von Budgets
  • Optimiertes Ressourcenmanagement
  • Systemresilienz
  • Kohärenter Speicherzugriff
  • Kompatibilität mit neuen Technologien

Mit CXL erhalten Rechenzentren Hochgeschwindigkeitsverbindungen mit geringer Latenzzeit zwischen Prozessoren, Speicher und Netzwerkgeräten.

 

CXL-Anwendungsfälle

Die CXL-Technologie eignet sich für Rechenzentren und Hochleistungscomputer.

Ein Cloud-Dienstanbieter könnte CXL nutzen, um Speicherressourcen von vielen Servern zu bündeln und sie auf verschiedene virtuelle Maschinen aufzuteilen. CXL vereinfacht das Training von KI-Modellen, wodurch es zu einem unverzichtbaren Werkzeug für Forschungslabore wird, die KI-Modelle entwickeln. In Unternehmen kann CXL Arbeitslasten vereinfachen und groß angelegte Anwendungen verwalten.

CXL eignet sich gut für verschiedene Zwecke der Videoverarbeitung, aber es gibt gewisse Einschränkungen. Zum Beispiel ist die Verteilung von 8K-Panorama- und stereoskopischen Bildern derzeit auf Hardware- und Transportsysteme beschränkt. Nutzer können einige Sekunden Verzögerung tolerieren, um qualitativ hochwertige Bilder zu erhalten, aber in der Praxis kann dies ohne ein leistungsstarkes Laborsystem problematisch sein. Wenn ein Anbieter ein Kernsystem auf einer skalierbaren Architektur aufgebaut hat, ist es einfach, skalierbare Dienste anzubieten.

Neben 8K-Videos können Sie auch latenzkritische Verarbeitungsanwendungen spezifizieren: Handels-/Börsen-/Bankenverarbeitungszentren, Krypto- und Rechnungsverarbeitungszentren.

CXL-Anwendungsfälle

Bildnachweis: MicroChip Technology Inc.
 

Vergleich von CXL mit bestehenden Technologien

Merkmal

CXL

PCIe-basiertes Multi-CPU-Host

NVLink

OpenCAPI

Ethernet-basiertes Multi-Host

Direkte Kommunikation zwischen CPU und Beschleuniger

Ja

Nein (normalerweise ist gezieltes DPDK für den Host erforderlich)

Ja

Ja

Nein (zusätzliche Anstrengungen und nicht flexible Hardware erforderlich mit RDMA/DPDK/SPDK)

Speicherzugriff

Geteilt, Beschleuniger, CPU, Netzwerk

CPU

Beschleuniger

Geteilt, Beschleuniger, CPU

Nein (zusätzliche Anstrengungen und nicht flexible Hardware erforderlich mit RDMA/DPDK/SPDK)

Skalierbarkeit

Hoch

Hoch, kann jedoch begrenzt werden

Hoch

Hoch

Hoch

Flexibilität

Hoch

Hoch

Moderat (hauptsächlich für NVIDIA GPUs)

Hoch

Hoch für allgemeine Netzwerkanwendungen

Energieeffizienz

Gut

Moderat

Gut

Gut

Moderat

Zielanwendungsfälle

KI, ML, HPC

Allgemeiner I/O

KI, ML, HPC (hauptsächlich NVIDIA GPUs)

KI, ML, HPC

Allgemeines Networking

 

CXL bietet eine effizientere, flexiblere und skalierbarere Lösung zur Verbindung von CPUs mit Beschleunigern. Die direkte Kommunikation, geteilte Speicher und höhere Bandbreiten machen es unverzichtbar für Workloads in den Bereichen KI/ML und Hochleistungscomputern.

 

Hochleistungsrechnen mit CXL in der Praxis

Schauen wir uns ein konkretes Anwendungsbeispiel an, das mit CXL implementiert werden könnte. Anbieter von Lösungen für Hochleistungscomputern und Cloud-Infrastruktur stehen vor einer Herausforderung: der wachsenden Nachfrage nach Hochgeschwindigkeitsdatenverarbeitung und der Unfähigkeit, diese mit der bestehenden Infrastruktur, die auf traditionellen PCIe-Verbindungen basiert, zu bewältigen.

CXL ermöglicht die Entwicklung eines skalierbaren Serversystems, um diese Probleme zu lösen. Die Hardware- und Softwarelösung kann auf dem COM-HPC-Standard und Switchtec™ Gen 5 PCIe-Switches von Microchip, GPUs und Mellanox NIC PCIe-Karten von Nvidia basieren.

Das Ergebnis ist ein leistungsstarkes und zuverlässiges Serversystem, das hohen Belastungen standhält und sich an wachsende Anforderungen anpassen lässt. Hier ist ein Beispiel für erreichbare Leistungsmerkmale eines solchen Systems:

  • Datenübertragungsraten von bis zu 800 Gbps;
  • Speicherkapazität von bis zu 8192 TB;
  • Unterstützung mehrerer Geräte über einen einzigen Host dank CXL 2.0;
  • Reduzierter Stromverbrauch durch optimierten Speicherzugriff und Ressourcenzuweisung.

 

 

Fazit

Die CXL-Technologie bietet Rechenzentren eine Möglichkeit, die Leistung zu steigern und gleichzeitig die Energiekosten zu senken, und positioniert sich als kosteneffiziente Alternative zu anderen Lösungen. Diese Technologie erhöht Geschwindigkeit und Effizienz und eignet sich gut in Fällen, in denen keine umfangreiche Rechenleistung für das Training von Generativen KI-Modellen (GenAI) erforderlich ist. Zusätzlich hilft CXL Unternehmen, Energiekosten zu senken und unterstützt nachhaltige Technologieinitiativen.