Übersicht der Alarme
Mit Alarmen können Sie Probleme in Ihrem System sofort nach ihrem Auftreten erkennen. Indem Sie unbeabsichtigte Änderungen in Ihrem System schnell erkennen, können Sie Unterbrechungen Ihrer Dienste minimieren.
Alerts bestehen aus zwei Teilen:
- Alert-Regeln - Wann der Alert ausgelöst wird. Alert-Regeln werden durch eine oder mehrere Bedingungen definiert, die regelmäßig von SmartCollect SC² ausgewertet werden.
- Benachrichtigungskanal - Wie der Alert zugestellt wird. Wenn die Bedingungen einer Alarmregel erfüllt sind, benachrichtigt SmartCollect SC² die für diesen Alarm konfigurierten Kanäle.
Derzeit unterstützt nur die Grafikpanel-Visualisierung Alarme.
Sie können die folgenden Aufgaben für Alerts durchführen:
- Hinzufügen oder Bearbeiten eines Alert-Benachrichtigungskanals
- Eine Alarmregel erstellen
- Vorhandene Alarmregeln und ihren aktuellen Status ansehen
- Alarmregeln testen und Fehler beheben
Derzeit unterstützt die Alarmierung eine begrenzte Form der Hochverfügbarkeit. Seit v4.2.0 von SmartCollect SC² werden Alarmbenachrichtigungen dedupiert, wenn mehrere Server betrieben werden. Das bedeutet, dass alle Alarme auf jedem Server ausgeführt werden, aber aufgrund der Dedupierungslogik keine doppelten Alarmbenachrichtigungen gesendet werden. Ein angemessener Lastausgleich von Alarmen wird in Zukunft eingeführt werden.
Sie können auch Alarmregel-Benachrichtigungen zusammen mit einer detaillierten Nachricht über die Alarmregel festlegen. Die Nachricht kann alles Mögliche enthalten: Informationen darüber, wie Sie das Problem lösen können, einen Link zum Runbook usw.
Die eigentlichen Benachrichtigungen werden konfiguriert und von mehreren Alerts gemeinsam genutzt.
Alert-Regeln werden im SmartCollect SC²-Backend in einem Scheduler und einer Abfrageausführungsmaschine ausgewertet, die Teil
des Kerns von SmartCollect SC² ist. Momentan werden nur einige Datenquellen unterstützt. Dazu gehören MySQL, PostgreSQL und MSSQL.
| Description | Type | Metric name |
|---|---|---|
| Total number of alerts | counter | alerting.active_alerts |
| Alert execution result | counter | alerting.result |
| Notifications sent counter | counter | alerting.notifications_sent |
| Alert execution timer | timer | alerting.execution_time |