LANL installiert den neuesten Supercomputer Crossroads
HeimHeim > Blog > LANL installiert den neuesten Supercomputer Crossroads

LANL installiert den neuesten Supercomputer Crossroads

Sep 20, 2023

31. August 2023

31. August 2023 – In der ersten Juniwoche brachte eine Karawane von Sattelzugmaschinen die benötigten Komponenten, um mit der Installation von Crossroads – dem neuesten Supercomputer des Los Alamos National Laboratory – zum Strategic Computing Complex (SCC) zu beginnen. Etwa zwei Wochen später, als die letzten sechs Rechenschränke und die dazugehörigen Wasserkühlungseinheiten eingetroffen waren, war die gesamte für die Montage und Installation des Systems erforderliche Hardware vorhanden.

Tage später stellte ein Team des Systemanbieters Hewlett Packard Enterprise (HPE) vor Ort den Anschluss von Crossroads an die Strom- und Kühlverteilungssysteme des Labors fertig. Nachdem die Integration in diese kritische Infrastruktur abgeschlossen war, wurden Glasfaserkabel in das Hochleistungs-Computing-Netzwerk (HPC) des Labors eingebunden.

„Crossroads ist ein Sinnbild für die Zukunft“, sagte Irene Qualters, stellvertretende Laborleiterin für Simulation und Berechnung. „Mit der Einführung eines wichtigen Codesign-Elements, des Speichers mit hoher Bandbreite, wird Crossroads bei unseren anspruchsvollsten Haldensimulationscodes eine vier- bis achtmal bessere Leistung als Trinity liefern.“ Und wir erwarten zusätzliche Leistungs- und Wiedergabetreuesteigerungen bei zukünftigen Systemen.“

Robuste Supercomputing-Fähigkeiten sind für die Beurteilung des Zustands der Atomwaffenbestände des Landes von entscheidender Bedeutung. Moderne Experimente erzeugen sehr große Datensätze, die mit Simulationsvorhersagen verglichen werden müssen, damit Wissenschaftler und Ingenieure fundierte Entscheidungen über die nukleare Abschreckungsmission des Landes treffen können. Um all diese Informationen zu analysieren, benötigt das Labor erstklassige Rechenmodelle, Plattformen und Visualisierungsmöglichkeiten.

„Crossroads stellt einen erheblichen Fortschritt in der Fähigkeit des Landes dar, die Sicherheit und Zuverlässigkeit der Lagerbestände zu beurteilen“, sagte Charlie Nakhleh, stellvertretender Laborleiter für Waffenphysik, „und modernisiert die Abschreckung, um einer neuen nationalen Sicherheitslandschaft gerecht zu werden.“

Seit 2015 bietet der Trinity-Supercomputer Benutzern aus den drei Labors der National Nuclear Security Administration (NNSA) (Los Alamos, Sandia und Lawrence Livermore) diese Möglichkeit, und Crossroads ist sein Nachfolger.

Derzeit führen Laborteams und HPE erste Diagnosen für das gesamte Crossroads-System durch, das den Benutzern voraussichtlich im Herbst in drei NNSA-Laboren zur Verfügung stehen wird.

Über das System

Als Teil der Computerstrategie für das Advanced Simulation and Computing Program der NNSA werden Advanced Technology Systems (ATS) eingesetzt, um modernste Simulationsfähigkeiten zur Unterstützung der Verwaltung von Kernwaffenbeständen bereitzustellen.

„Der Einsatz eines Weltklasse-Supercomputers erfordert eine Symphonie an Fachwissen und den Zusammenschluss einer vielfältigen Armee qualifizierter Fachkräfte“, sagte Jim Lujan, Crossroads-Projektleiter für das Labor. „Von visionären Planern und Hardware-Ingenieuren bis hin zu Software-Architekten und Netzwerk-Experten ist es ein Beweis für die Kraft der brillanten Zusammenarbeit bei der Gestaltung der Zukunft der Rechenmöglichkeiten.“

Jeder Supercomputer wird durch eine ihm zugeordnete fortlaufende ATS-Nummer repräsentiert. Schließlich erhält jedes ATS einen eindeutigen Namen.

Zuerst hatte das Los Alamos National Laboratory Trinity (ATS-1). Sierra (ATS-2) befand sich im Lawrence Livermore National Laboratory. Crossroads (ATS-3) befindet sich jetzt in Los Alamos.

„Crossroads ist die neueste ATS-Plattform – also im Moment der Star der Show“, sagte AmandaBonnie, eine Laborprojektmanagerin für Crossroads.

Schließlich wird El Capitan (ATS-4) in Lawrence Livermore stationiert sein und ein demnächst erscheinender ATS-5 – noch unbenannt – wird in Los Alamos stationiert sein.

Geschwindigkeit und Effizienz sind nicht dasselbe

Da die mit der Verwaltung von Lagerbeständen verbundenen Simulationen so anspruchsvoll sind, verlangt das Büro des Advanced Simulation and Computing Program, dass ATS-Maschinen nicht nur groß und schnell sein sollten, sondern, was noch wichtiger ist, sie sollten über eine auf ihre spezifischen Bedürfnisse zugeschnittene Speichergröße und Speicherzugänglichkeit verfügen.

„Angesichts des Geredes in der Presse über den ‚schnellsten Computer der Welt‘ könnte man meinen, wir sollten Computer mit den meisten FLOPS kaufen“, erklärte Gary Grider, Leiter der Abteilung High Performance Computing des Labors. „Jede Problemklasse erfordert ein anderes Gleichgewicht zwischen FLOPS, Speichergröße und Speicherzugriff. Bei den Problemen, an denen wir arbeiten, wird die Zeit, die benötigt wird, um ein Ergebnis zu erhalten, hauptsächlich von der Speichergröße und dem Speicherzugriff bestimmt, nicht von FLOPS.“ (FLOPS ist eine Einheit zur Messung der Anzahl der Gleitkommaoperationen, die ein Computer in einer Sekunde ausführen kann.)

Diese Philosophie bedeutet, dass sich das Labor häufig mit einigen der zukunftsweisenden Bereiche des HPC-Marktes befasst: einem neuen Netzwerktyp, einem neuen Prozessortyp oder im Fall von Crossroads einer neuen Speichertechnologie.

Speicher mit hoher Bandbreite bringt Speicher direkt auf den Verarbeitungschip und ermöglicht eine schnellere „Kommunikation“ zwischen CPU und Speicher. Bei vielen Lab-Codes ist die Speicherbandbreite begrenzt, daher macht es Sinn, dass dies etwas ist, worüber HPC begeistert ist.

Erste Tests haben gezeigt, dass Crossroads im Vergleich zu Trinity voraussichtlich eine vier- bis achtfache Verbesserung der Gesamteffizienz liefern wird.

„Im Computerbereich kommt es kaum vor, dass man auf ein neues System umsteigen und enorme Vorteile erzielen kann, ohne die Codes zu ändern“, sagte Grider. „Aber der Wechsel von Trinity zu Crossroads wird genau das bewirken.“

Rocinante, Razorback und Tycho: Supercomputer-Subsysteme

„Mit diesen größeren ATS-Beschaffungen sind ganz normale Systeme verbunden“, sagte Bonnie. „Es gibt das Hauptsystem selbst, in diesem Fall Crossroads, und dann kleinere unterstützende Systeme.“

Für Crossroads sind diese Hilfssysteme Rocinante, Razorback und Tycho – benannt nach Raumschiffen aus dem Science-Fiction-Buch und der Fernsehserie „The Expanse“.

Da Codeentwickler einen Teil ihrer Arbeit in einer nicht klassifizierten Umgebung erledigen, ist eine „Mini-Me“-Version von Crossroads mit derselben Architektur – nur in kleinerem Maßstab – eine Schlüsselkomponente. Es wird als Application Regression System bezeichnet und ermöglicht es Benutzern, Codes zu entwickeln und in einer offenen Umgebung zu arbeiten. Rocinante dient diesem Zweck, Crossroads zu unterstützen.

Ebenso gibt es eine kleine Testumgebung nur für Systemadministratoren. Razorback, auf das normale Benutzer keinen Zugriff haben, ist eine noch kleinere Version des Systems, mit der Administratoren Upgrades, Patches und andere Änderungen vorbereiten und testen, bevor sie sie auf die größeren Maschinen anwenden.

Endlich ist da noch Tycho. Tycho wurde Ende letzten Jahres mit fast der gleichen Architektur wie Crossroads ausgeliefert, mit dem Unterschied, dass die Rechenknoten über mehr konventionellen Speicher als über die fortschrittliche Speichertechnologie mit hoher Bandbreite verfügten. Dies bietet Zyklen für Benutzer der Vorratssimulation, die sonst möglicherweise auf Crossroads gewartet hätten. Im Juni gab HPC bekannt, dass Tycho den drei Trilabs über den Prozess der Advanced Technology Computing Campaign zur Verfügung steht.

Lujan erkennt schnell an, dass die Umsetzung von Crossroads und seinen Subsystemen das Ergebnis einer umfassenden Gruppenarbeit war. „Buchstäblich Dutzende Labormitarbeiter aus jeder der sechs HPC-Gruppen sowie Mitarbeiter aus allen NNSA-Trilabs haben wichtige Beiträge zu diesem Projekt geleistet“, sagte er.

ATS-5 am Horizont

Die großen Systeme, die das Labor entwirft und einsetzt, haben in der Regel eine Planungsvorlaufzeit von vier bis sechs Jahren, mit einer optimalen Betriebslebensdauer von etwa fünf Jahren. Das bedeutet, dass sich Crossroads zwar derzeit in der Installation befindet, HPC jedoch bereits seit einigen Jahren Pläne für den eventuellen Einsatz des noch unbenannten ATS-5-Systems schmiedet.

LA-UR-23-29610

Einen ausführlichen Einblick in die Traummaschinen des Labors aus Vergangenheit, Gegenwart und Zukunft erhalten Sie in der Frühjahrsausgabe 2023 des Magazins 1663.

Quelle: LANL

Über das System,Geschwindigkeit und Effizienz sind nicht dasselbeRocinante, Razorback und Tycho: Supercomputer-SubsystemeATS-5 am Horizont