Neue Ära der Supercomputer: Oracle und Colossus im Technologieduell

Kategorien:
No items found.
Freigegeben:
September 13, 2024
Supercomputer-Wettrennen: Oracle im Wettstreit mit Colossus

Supercomputer-Wettrennen: Oracle im Wettstreit mit Colossus

Einführung

Das Wettrennen um den leistungsstärksten Supercomputer der Welt geht in die nächste Runde. Während Elon Musks xAI mit dem Supercomputer Colossus die Spitze erklommen hat, plant Oracle bereits ein System, das die bisherigen Rekorde in den Schatten stellen könnte. Im ersten Halbjahr 2025 soll Oracles neuer Supercomputer, ausgestattet mit 131.072 Blackwell-GPUs von Nvidia, fertiggestellt werden. Dieser Artikel beleuchtet die technischen Details, die Herausforderungen und die potenziellen Auswirkungen auf die Technologiebranche.

Technische Details des Oracle-Supercomputers

Oracles neuer Supercomputer wird größtenteils aus fertigen Server-Racks von Nvidia bestehen, die GB200 NVL72. Jedes dieser wassergekühlten Racks besteht aus 36 GB200-Boards mit ebenso vielen Grace-ARM-Prozessoren (je 72 CPU-Kerne) und 72 B200-Beschleunigern. Der Vorteil für Oracle: Nvidia liefert die komplette Netzwerktechnik, inklusive Nvlink-Switches, um die Hardware untereinander zu verschalten. Dies ermöglicht eine beispiellose Anzahl an Prozessoren, was Oracle einen großen Vorteil verschafft.

Leistung und Kapazität

Die Leistung des Systems ist beeindruckend: 131.072 Blackwell-Beschleuniger schaffen rein rechnerisch 5,9 Exaflops bei Gleitkomma-Operationen mit doppelter Genauigkeit (FP64). Zum Vergleich: Der derzeit schnellste Supercomputer, Frontier mit AMD-Hardware, erreicht 1,7 Exaflops. Oracles System ist speziell auf das Training von KI-Algorithmen ausgelegt, bei denen die Anforderungen an die Genauigkeit wesentlich geringer sind. Hierbei werden 2,4 Zetaflops (2400 Exaflops) erreicht.

Herausforderungen und Energiebedarf

Die immense Rechenleistung hat allerdings ihren Preis: Jeder GB200 NVL72 benötigt eine elektrische Leistungsaufnahme von 120 Kilowatt. Zusammen genommen benötigen die Grace-CPUs und B200-GPUs knapp 220 Megawatt. Hinzu kommt der noch höhere Energiebedarf für die Kühlung und das Netzwerk. Oracle plant deshalb, kleine Atomkraftwerke (Small Modular Reactor, SMR) zur Energieversorgung einzusetzen. Laut Oracles Technikchef Lawrence Ellison hat ein Energiepartner bereits die Genehmigung zum Bau von drei solchen SMR erhalten.

Vergleich mit Colossus

Colossus, der von Elon Musks xAI entwickelt wurde, verwendet rund 100.000 H100-Beschleuniger aus Nvidias Hopper-Generation. Diese erreichen rechnerisch 3,4 FP64-Exaflops bzw. 396 FP8-Exaflops. Im Vergleich dazu könnte Oracle mit seinem neuen System die Leistung von Colossus deutlich übertreffen. Während Colossus im Jahr 2025 weiter ausgebaut werden soll, plant Oracle bereits ein weiteres Rechenzentrum mit 65.536 H200-Beschleunigern.

Potenzielle Auswirkungen

Der Bau solcher Supercomputer hat weitreichende Auswirkungen auf die Technologiebranche. Sie ermöglichen es, komplexe KI-Modelle schneller und effizienter zu trainieren, was zu schnelleren Innovationen und neuen Anwendungen führen kann. Unternehmen wie Oracle, Meta und xAI stehen in direkter Konkurrenz, was den technologischen Fortschritt weiter vorantreiben dürfte.

Fazit

Das Wettrennen um den leistungsstärksten Supercomputer der Welt ist in vollem Gange. Während Colossus derzeit die Spitze hält, könnte Oracles neuer Supercomputer diese Position im Jahr 2025 übernehmen. Die technischen Details und Herausforderungen sind enorm, doch die potenziellen Vorteile für die Technologiebranche sind ebenfalls immens. Es bleibt spannend zu beobachten, wie sich dieses Wettrennen weiterentwickelt und welche Innovationen daraus hervorgehen.

Bibliographie

- https://newstral.com/de/article/de/1257825749/supercomputer-wettrennen-oracle-%C3%BCbertrumpft-colossus-supercomputer-wettrennen-oracle-%C3%BCbertrumpft-colossus - https://www.heise.de/ - https://newstral.com/de/articles
Was bedeutet das?