[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Cronjobs überwachen



Hi,

danke schon mal für deinen Input. So kompliziert möchte ich das gar nicht. Sondern nur "lief Script X ohne fehler durch". Warum, weshalb schau ich mir dann manuell an. Die Einträge brauche ich nicht überwachen, die legt puppet fest und das alle 5 Minuten.

Monitoring als Prävention auch ja, aber auch rückwirkend. Wir haben bisher 200 Jobs ingesamt. Da können wir nicht mir Cronmails arbeiten, bzw. möchten wir nicht.Das sind nur cronjobs. Hinzu kommen noch alle Festplatten- und Net- IO - Werte, dann Datenbank-Backups und eine menge mehr. Der aktuelle "Health"-Status ist derzeit wichtig.

Wegen check_mk: interessant, aber PRTG hat allein schon 9x soviel automatische Checks. Das einzige System, dass das in seiner Einfachheit und Vielfalt übertrifft ist: SCOM. Was der tatsächlich einzige Konkurrent derzeit ist.

rprengel <ralf.prengel@rprengel.de> schrieb am Do., 20. Okt. 2016 um 18:52 Uhr:


Am 20.10.2016 um 17:39 schrieb Bjoern Meier:
> Heiho,
>
> einige von euch werden sicherlich PRTG kennen. Ich würde gern überprüfen
> ob die Scripte ( z. B. Backup) gelaufen sind.
>
> Wie würdet ihr das angehen. Ich brauche lediglich Inspirationen. Ich
> möchte gern vermeiden ledesmal irgendwelche Statusfiles abzulegen.
>
> Gruß,
> Björn


Hallo,
aus meiner Sicht musst du die Überwachung aufsplitten um alle
potetiellen Probleme im Vorfed zu bemerken
Check Nummer
1)
ist der Eintrag in der Crondatei unverändert
2)
ist der Cronjob zur erwarteten Zeit gestartet
3)
ist der Cronjob sauber durchgelaufen
4)
Ist das Resulat des Cronjob das was erwartet wird

1)
so werden im Vorfeld Fehler bemerkt wenn die Datei neu angefasst wird
2)
Fehler im Syntax der übesehen wird und den Start verhindert, eine Zeile
sollte sich in einer System-Logdatei finden
3)
da muss dein Script was liefern
4)
z.B. ob das Dateidatum von kopierten Dateien in einem Backup-ordner
nicht älter als x Stunden ist.

Ich würde das Script in eine eigene Datei logen lassen und daraus meine
checks ableiten.
Monitoring soll ja im Idealfall schon präventiv auf sich anbahnende
Probleme hinweisen also melden "es wird demnächst krachen" und nicht "es
hat gerade gekracht".


Nebenbei:
Falls du PRTG (läuft och unter Windows) mal gegen eine Linux-Lösung
vergleichen willst schau dir check_mk mal an.

Gruss


Reply to: