Große Aufgabe – kleines Modul

Cern setzt bei der Server-Virtualisierung auf Kontron Technologie

Große Aufgabe – kleines Modul

Das Europäische Kernforschungszentrum Cern in Genf suchte für die Virtualisierung der Server, die zur Überwachung eines der Experimente im Teilchenbeschleuniger dienen, smarte Knotenpunkte. Sie sollten nicht nur kompakt, robust und kosteneffizient sein, sondern auch Langzeitverfügbarkeit und eine hohe Skalierbarkeit bieten. Die Lösung: Schlanke 1HE Rack-IPCs mit je vier Prozessormodulen stellen nun sicher, dass die Daten besonders effizient und ausfallsicher verarbeitet werden.
LHCb ist eines von vier Experimenten am Large Hadron Collider (LHC) am Kernforschungszentrum Cern, besser bekannt als Teilchenbeschleuniger. Es erforscht die kleinen Unterschiede zwischen Materie und Antimaterie, um der Frage nachzugehen, warum unser Universum hauptsächlich aus Materie und nicht aus Antimaterie besteht. Diese Experimente laufen noch mindestens bis zum Jahr 2018 und nutzen ein 4.500t schweres Detektorsystem mit circa 1Mio. Sensoren. Diese Sensoren registrieren die unterschiedlichen Teilchen, die bei der Kollision von nahezu lichtschnellen Protonen im rund 27km langen Ringbeschleuniger entstehen. Das Detektorsystem setzt sich aus mehreren Subdetektoren zusammen. Jeder dieser Subdetektoren ist darauf spezialisiert, unterschiedliche Parameter wie Spurverläufe oder Energie-Werte zu messen. Bei 2.000 Ereignissen pro Sekunde entsteht stündlich eine Datenmenge von 250GB.

Das Detektionssystem

Diese Daten werden von den Sensoren der Detektor-Elektronik über Lichtwellenleiter an modulare Rechnersysteme geleitet, die die Daten des Experiments vorverarbeiten. Jedes System hat eine eigene Aufgabe und verarbeitet bis zu 38Gbit/s Rohdaten. Diese sendet es dann über 4GbE-Links zu einem Datenaufnahmesystem. Die real genutzte totale Bandbreite der Rechnersysteme des Detektionssystems beträgt rund 50 bis 60GByte/s und bildet die Datengrundlage für die Analyse und Resultate des Experiments. Ausgeführt sind diese Systeme in rund 100VME- sowie rund 400 ELMB-Systemen (Embedded Local Monitor Board).

Das Condition Monitoring System

Um die Verfügbarkeit des mit 1Mio. Sensoren höchst komplexen Detektionssystems während der ebenfalls nicht minder komplexen Experimente stets sicherzustellen, wird es von einem eigenen Kontrollsystem überwacht. Dieses soll gewährleisten, dass sich alle Elemente des Detektionssystems im vorgeschriebenen Zustand befinden, damit die teuren Experimente nicht umsonst gemacht werden. Zudem erlaubt es das Kontrollsystem, Aktionen auszuführen wie das Ein- und Ausschalten, das Setzen der Ausgangsspannungen, das Setzen der Grenzwerte für Ausgangsströme und die Änderung der Lüftergeschwindigkeit der Systeme. Dabei folgt das Monitoring der VME- und ELMB-Systeme einem einfachen Prinzip: Solange bei der Überwachung der Komponenten keine Anomalität festgestellt wird, werden alle nötigen Parametrierungen des Zustands der Elektronik automatisch ausgeführt. Nur wenn durch die kontinuierliche Überwachung der Komponenten eine Anomalität im System festgestellt wird, muss ein Mitarbeiter eingreifen und den Fehler beheben. In jedem Rechner des Detektionssystems ist hierfür ein CAN-Slave integriert, welcher die lokale Überwachungsinstanz des vernetzten Monitoring Systems darstellt. Diese Slaves wurden in der Vergangenheit über Monitoring-Server mit einer direkten Verbindung (über USB) zu einem CAN-Master überwacht und gesteuert.