Die detaillierte Domänen- und Serverüberwachung auf wichtige Key Performance Indicators (KPIs) wie z.B. Disk usage, Memory, CPU, Network, etc. ist ein unverzichtbarer Teil zur Sicherstellung des störungsfreien Betriebes einer UCS Umgebung. Mit dem UCS Dashboard können sich Administrierende über unterschiedliche Dashboards schnell einen Überblick über den Zustand einer UCS Domäne und deren Server verschaffen.

Unsere Entwicklungsabteilung hat jetzt für UCS eine neue Version des Dashboards herausgegeben. Eine wichtige Neuerung: Der Alertmanager löst das bisher verwendete Tool Nagios ab. In diesem Artikel möchte ich Ihnen einen kurzen Überblick über die Funktionen des Dashboards geben und Ihnen den neuen Alertmanager vorstellen.

Parameter „Disk usage“ verhindert Systemabstürze

Im Server Dashboard ist zum Beispiel der Kennwert „Disk usage“ ein Parameter, den Sie im Auge behalten sollten. Bei einer vollen Festplatte würde das UCS System nämlich stoppen bzw. im schlimmsten Fall abstürzen. Um solche oder andere Störfaktoren zu verhindern, kann sich der Administrierende mit Hilfe des Dashboards schnell einen Überblick über die wichtigsten Parameter des UCS Systems verschaffen und somit einen störungsfreien Betrieb sicherstellen.

Grafana und Prometheus – Technische Basis des UCS Dashboards

Die App UCS Dashboard steht jetzt auch für UCS 5.0 zur Verfügung. Sie basiert auf den Open-Source-Lösungen Grafana und Prometheus inkl. Node Exporter und sammelt die Daten einzelner Systeme zentral in einer Datenbank. Das Dashboard besteht aus den vier Komponenten:

  • UCS Dashboard für die Visualisierung von Daten aus der zentralen Datenbank (Grafana)
  • UCS Dashboard Database, eine Zeitserien-Datenbank für die Speicherung der Metriken (Prometheus als Timeseries-Datenbank)
  • UCS Dashboard Client für die Bereitstellung der Metriken von Serversystemen (Prometheus Node-Exporter)
  • Prometheus Alertmanager (Benachrichtigungsfunktion für das UCS Dashboard)

Mit den letzten Updates der oben aufgezählten Apps für UCS wurden die aktuellen Versionen von Prometheus, Node Exporter und Grafana eingesetzt. So verwendet der in das Dashboard integrierte Node Exporter z.B. nun auch die neuen Namenskonventionen (Metric Name) sowie deren Inhalte.

UCS Server Dashboard

Neuerungen beim Dashboard für UCS 5

Als Neuerung im Vergleich zu UCS 4 wurde in UCS 5.0-2 der Alertmanager direkt in Prometheus/Grafana integriert. Dadurch werden nun alle wichtigen KPIs wie Alarme in Prometheus gespeichert und in einem eigenen Dashboard in Grafana dargestellt. Wie gewohnt können Sie die Konfiguration der Alarme weiterhin über den Univention Directory Manager (UDM) vornehmen. Grafana bietet von Haus aus drei vorkonfigurierte Dashboards: Domain Dashboard, Server Dashboard und Alert Dashboard, die nicht verändert werden können. Jedoch haben Sie die Möglichkeit, eigene Dashboards für Ihre Bedarfe zu konfigurieren. Folgende Parameter können beispielsweise zu einem Dashboard hinzugefügt werden: „Server Info“, „NFS Status“, „Join Status“ oder „nmbd running“.

Die neu hinzugekommene App „Prometheus Alertmanager“ ermöglicht es Ihnen nun, Alarme an verschiedene E-Mail-Adressen weiterzuleiten, die Sie schon während der Installation der App konfigurieren können.

Für UCS 5.0 haben wir die Unterstützung für die Serverkomponente Nagios eingestellt. Deren Funktionalität, über Störungen zu informieren, wird jetzt durch den in Prometheus und Grafana integrierten Alertmanager übernommen.

Weiterführende Informationen erhalten Sie in der Dokumentation.

UCS Alert Dashboard
UCS Core Edition jetzt kostenfrei einsetzen!
Zum Downloadbereich

Kommentare

  1. Georg Wallner

    08.08.2022 um 07:28 Uhr

    finde ich nicht gut. Wir verwalten ca. 50 UCS Domainen, mit verschiedensten UCS Member Servern und Windows Memberservern. Um eine Übersicht aller Server auf einen Blick zu erhalten, verwenden wir Thruk, das die Zustände aller Server übersichtlich darstellt.
    Ich hoffe ich kann das auch mit UCS 5 und Grafana/Prometheus.
    Eine einfache Darstellung mit Warnschwellen die in den Farben grün, gelb, rot auf den aktuellen Status der Server hinweisen.

    Antworten
    1. Bianca Scheidereiter

      11.08.2022 um 08:38 Uhr

      Hallo Herr Wallner,

      Prometheus und Grafana sind sehr leistungsstarke Tools. Leider können wir hier auch nicht alle Möglichkeiten dazu wiedergeben. Daher empfehlen wir, die Dokumentationen der Tools anzuschauen oder in unserem Help-Forum in den Austausch mit der Community zu treten.

      Viele Grüße
      Bianca Scheidereiter

      Antworten

Schreiben Sie einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert