Übersicht der Alarme

Mit Alarmen können Sie Probleme in Ihrem System sofort nach ihrem Auftreten erkennen. Indem Sie unbeabsichtigte Änderungen in Ihrem System schnell erkennen, können Sie Unterbrechungen Ihrer Dienste minimieren.

Alerts bestehen aus zwei Teilen:

  • Alert-Regeln - Wann der Alert ausgelöst wird. Alert-Regeln werden durch eine oder mehrere Bedingungen definiert, die regelmäßig von SmartCollect SC² ausgewertet werden.
  • Benachrichtigungskanal - Wie der Alert zugestellt wird. Wenn die Bedingungen einer Alarmregel erfüllt sind, benachrichtigt SmartCollect SC² die für diesen Alarm konfigurierten Kanäle.

Derzeit unterstützt nur die Grafikpanel-Visualisierung Alarme.

Alert-Aufgaben

Sie können die folgenden Aufgaben für Alerts durchführen:

Clustering

Currently alerting supports a limited form of high availability. Since v4.2.0 of SmartCollect SC², alert notifications are deduped when running multiple servers. This means all alerts are executed on every server but no duplicate alert notifications are sent due to the deduping logic. Proper load balancing of alerts will be introduced in the future.

Benachrichtigungen

Sie können auch Alarmregel-Benachrichtigungen zusammen mit einer detaillierten Nachricht über die Alarmregel festlegen. Die Nachricht kann alles Mögliche enthalten: Informationen darüber, wie Sie das Problem lösen können, einen Link zum Runbook usw.

Die eigentlichen Benachrichtigungen werden konfiguriert und von mehreren Alerts gemeinsam genutzt.

Ausführung des Alarms

Alert-Regeln werden im SmartCollect SC²-Backend in einem Scheduler und einer Abfrageausführungsmaschine ausgewertet, die Teil des Kerns von SmartCollect SC² ist. Momentan werden nur einige Datenquellen unterstützt. Dazu gehören MySQL, PostgreSQL und MSSQL.

Metriken aus der Alert Engine

Description Type Metric name
Total number of alerts counter alerting.active_alerts
Alert execution result counter alerting.result
Notifications sent counter counter alerting.notifications_sent
Alert execution timer timer alerting.execution_time