Die detaillierte Domänen- und Serverüberwachung auf wichtige Key Performance Indicators (KPIs) wie z.B. Disk usage, Memory, CPU, Network, etc. ist ein unverzichtbarer Teil zur Sicherstellung des störungsfreien Betriebes einer UCS Umgebung. Mit dem UCS Dashboard können sich Administrierende über unterschiedliche Dashboards schnell einen Überblick über den Zustand einer UCS Domäne und deren Server verschaffen.
Unsere Entwicklungsabteilung hat jetzt für UCS eine neue Version des Dashboards herausgegeben. Eine wichtige Neuerung: Der Alertmanager löst das bisher verwendete Tool Nagios ab. In diesem Artikel möchte ich Ihnen einen kurzen Überblick über die Funktionen des Dashboards geben und Ihnen den neuen Alertmanager vorstellen.
Inhaltsverzeichnis
Parameter „Disk usage“ verhindert Systemabstürze
Im Server Dashboard ist zum Beispiel der Kennwert „Disk usage“ ein Parameter, den Sie im Auge behalten sollten. Bei einer vollen Festplatte würde das UCS System nämlich stoppen bzw. im schlimmsten Fall abstürzen. Um solche oder andere Störfaktoren zu verhindern, kann sich der Administrierende mit Hilfe des Dashboards schnell einen Überblick über die wichtigsten Parameter des UCS Systems verschaffen und somit einen störungsfreien Betrieb sicherstellen.
Grafana und Prometheus – Technische Basis des UCS Dashboards
Die App UCS Dashboard steht jetzt auch für UCS 5.0 zur Verfügung. Sie basiert auf den Open-Source-Lösungen Grafana und Prometheus inkl. Node Exporter und sammelt die Daten einzelner Systeme zentral in einer Datenbank. Das Dashboard besteht aus den vier Komponenten:
- UCS Dashboard für die Visualisierung von Daten aus der zentralen Datenbank (Grafana)
- UCS Dashboard Database, eine Zeitserien-Datenbank für die Speicherung der Metriken (Prometheus als Timeseries-Datenbank)
- UCS Dashboard Client für die Bereitstellung der Metriken von Serversystemen (Prometheus Node-Exporter)
- Prometheus Alertmanager (Benachrichtigungsfunktion für das UCS Dashboard)
Mit den letzten Updates der oben aufgezählten Apps für UCS wurden die aktuellen Versionen von Prometheus, Node Exporter und Grafana eingesetzt. So verwendet der in das Dashboard integrierte Node Exporter z.B. nun auch die neuen Namenskonventionen (Metric Name) sowie deren Inhalte.