Haupt-Konfigurationsdatei


Bemerkung:

Wenn Sie die Konfigurationsdateien erstellen oder editieren, müssen Sie folgendes im Kopf behalten:

  1. Zeilen die mit einem '#'-Zeichen beginnen sind Kommentare und werden von Nagios nicht bearbeitet
  2. Variablen MÜSSEN am Anfang der entsprechenden Zeile ohne Leerzeichen stehen
  3. Variablen sind case-sensitive

Beispiel-Konfiguration

Eine Beispieldatei der Haupt-Konfigurationsdatei wird im Hauptverzeichnis der Nagios-Distribution erstellt, wenn Sie das "configure"-Skript laufen lassen. Der Standard-Name der Haupt-Konfigurationsdatei lautet nagios.cfg und wird normalerweise in das etc/-Verzeichnis der Nagios-Installation (z.B. /usr/local/nagios/etc/) abgelegt.

Options-Index

Log file
Object configuration file
Object configuration directory
Resource file
Temp file

Status file
Aggregated status updates option
Aggregated status data update interval

Nagios user
Nagios group

Notifications option
Service check execution option
Passive service check acceptance option
Event handler option

Log rotation method
Log archive path

External command check option
External command check interval
External command file

Comment file
Downtime file
Lock file

State retention option
State retention file
Automatic state retention update interval
Use retained program state option

Syslog logging option
Notification logging option
Service check retry logging option
Host retry logging option
Event handler logging option
Initial state logging option
External command logging option
Passive service check logging option

Global host event handler
Global service event handler

Inter-check sleep time
Inter-check delay method
Service interleave factor
Maximum concurrent service checks
Service reaper frequency
Timing interval length

Agressive host checking option

Flap detection option
Low service flap threshold
High service flap threshold
Low host flap threshold
High host flap threshold

Soft service dependencies option

Service check timeout
Host check timeout
Event handler timeout
Notification timeout
Obsessive compulsive service processor timeout
Performance data processor command timeout

Obsess over services option
Obsessive compulsive service processor command

Performance data processing option

Orphaned service check option

Service freshness checking option
Service freshness checking option

Administrator email address
Administrator pager

Log File

Format: log_file=<Dateiname>
Beispiel: log_file=/usr/local/nagios/var/nagios.log

Diese Variable gibt an, wo Nagios seine Haupt-Logdate erstellt. Diese Angabe sollte die erste Variable in der Konfigurationsdatei sein, da Nagios bei einem Fehler in der Konfigurationsdatei seine Meldungen in diese Logdatei schreibt. Falls Sie die log rotation aktiviert haben, wird diese Datei automatisch nach jeder Stunde, Tag, Woche oder Monat archiviert.

Object Configuration File

Format: cfg_file=<Dateiname>
Beispiel: cfg_file=/usr/local/nagios/etc/hosts.cfg
cfg_file=/usr/local/nagios/etc/services.cfg
cfg_file=/usr/local/nagios/etc/commands.cfg

Diese Directive wird benutzt um eine Objekt-Konfigurationsdatei anzugeben, die Nagios für die Überwachung benutzt. Diese Datei wird traditionell die "Host"- Konfigurationsdatei genannt, obwohl es weitaus mehr Informationen enthalten kann, als nur Host-Informationen.
Objekt-Konfigurationsdateien enthalten Definitionen für Hosts, Hostgruppen, Kontakte, Kontaktgruppen, Dienste, Kommandos, etc. Sie können Ihre Konfigurations-Informationen in mehrere Dateien aufteilen, müssen dann aber auch für jede der Konfigurationsdatei ein cfg_file=-Statements angeben.

Object configuration directory

Format: cfg_dir=<Verzeichnis>
Beispiel: cfg_dir=/usr/local/nagios/etc/commands
cfg_dir=/usr/local/nagios/etc/services
cfg_dir=/usr/local/nagios/etc/hosts

Diese Directive können Sie benutzen, um ein Verzeichnis anzugeben, welches Objekt-Konfigurationsdateien enthält, die Nagios für die Überwachung benutzen soll. Alle Dateien in diesem Verzeichnis mit einer .cfg-Endung werden von Nagios als Objekt-Konfigurationsdateien behandelt.
Sie können ihre Konfigurationsdateien auch in mehrere Verzeichnis verteilen, müssen dann aber für jedes Verzeichnis ein cfg_dir=-Statement angeben, damit alle Dateien in jedem Verzeichnis bearbeitet werden.

Resource File

Format: resource_file=<Dateiname>
Beispiel: resource_file=/usr/local/nagios/etc/resource.cfg

Diese Variable gibt eine optionale Ressourcen-Datei an, die die $USERn$ Macro-Definitionen enthält. $USERn$ Macros sind sehr nützlich um Usernamen, Passwörter und andere sensible Informationen wie Verzeichnisse, etc. zu speichern.
Die CGIs werden diese Datei nicht lesen, so dass Sie sehr restriktive Dateirechte (z.B. 600 oder 660) auf diese Ressourcen-Datei setzen können.
Sie können mehrere Ressourcen-Dateien mit mehreren "resource_file"-Statements angeben. Beachten Sie die Beispiel resource.cfg-Datei in dem Nagios-Hauptverzeichnis, in dem einige $USERn$-Macros angegeben sind.

Temp File

Format: temp_file=<Dateiname>
Beispiel: temp_file=/usr/local/nagios/var/nagios.tmp

Dies ist eine temporäre Datei, die Nagios zeitweise erstellt, wenn es Kommentare, Status-Informationen, etc. updated. Diese Datei wird automatisch gelöscht, wenn Sie nicht mehr benötigt wird.

Status File

Format: status_file=<file_name>
Beispiel: status_file=/usr/local/nagios/var/status.log

Diese Datei benutzt Nagios um die aktuelle Status-Informationen für alle überwachten Dienste zu speichen. Die Stati der Hosts, die mit den entsprechenden Diensten assoziiert sind, werden ebenfalls hier aufgezeichnet.
Diese Datei wird von den CGIs benutzt, um die Informationen im Web-Interface darzustellen. Die CGIs müssen also Lese-Zugriff auf diese Datei haben, um richtig zu funktionieren. Diese Datei wird gelöscht, wenn der Nagios-Prozess beendet wird und wird erstellt, wenn er wieder startet.

Aggregated Status Updates Option

Format: aggregate_status_updates=<0/1>
Beispiel: aggregate_status_updates=1

Diese Option gibt an, ob Nagios die Aktualisierungen für Host-, Dienst- und Programm-Stati aggregiert oder nicht.
Falls Sie diese Option nicht aktivieren, werden die Status-Daten sofort nach jeder Host- oder Dienst-Überprüfung aktualisiert. Wenn Sie eine vielzahl von Diensten und Hosts überprüfen, kann dies zu einer hohen CPU-Last und Datei-I/Os führen.
Wenn Sie wollen, dass Nagios die Status-Daten (in der Status-Datei) nur alle paar Sekunden (wie in der status_update_interval- Option angegeben) aktualisiert, müssen Sie diese Option aktivieren.
Falls Sie sofortige Aktualisierung der Stati wollen, deaktivieren Sie diese Option.

Ich kann die Benutzung der aggregierten Aktualisierungen (auch in kurzen Intervallen) sehr empfehlen, außer es gibt einen wichtigen Grund dies nicht zu tun.

Folgende Werte sind gültig:

Aggregated Status Update Interval

Format: status_update_interval=<Sekunden>
Beispiel: status_update_interval=15

Diese Option gibt an, wie oft Nagios (in Sekunden) die Status-Informationen in der Status-Datei aktualisiert. Das kleinste Aktualisierungs-Interfal liegt bei fünf Sekunden.
Wenn Sie aggregierte Status-Aktualisierungen (mit der aggregate_status_updates-Option) deaktiviert haben, hat diese Option keinen Effekt.

Nagios User

Format: nagios_user=<Username/UID>
Beispiel: nagios_user=nagios

Diese Option wird benutzt, um den User anzugeben, unter dem der Nagios-Prozess laufen soll. Nach dem initialen Programm-Start und bevor Nagios anfängt irgendwas zu überwachen, gibt Nagios seine preveligierten Rechte auf und läuft nur noch unter diesem User.
Sie können hier entweder einen Usernamen oder eine UID angeben.

Nagios Group

Format: nagios_group=<Gruppenname/GID>
Beispiel: nagios_group=nagios

Diese Option wird benutzt, um die Gruppe anzugeben, unter dem der Nagios-Prozess laufen soll. Nach dem initialen Programm-Start und bevor Nagios anfängt irgendwas zu überwachen, gibt Nagios seine preveligierten Rechte auf und läuft nur noch unter dieser Gruppe.
Sie können hier entweder einen Gruppennamen oder eine GID angeben.

Notifications Option

Format: enable_notifications=<0/1>
Beispiel: enable_notifications=1

Diese Option gibt an, ob Nagios Benachrichtigungen verschickt wenn es (re)startet. Wenn Sie diese Option deaktivieren, wird Nagios keine Benachrichtigungen für Hosts und Dienste versenden.
Hinweis: Wenn Sie "state retention" aktiviert haben, wird Nagios diese Option ignorieren, und die letzte bekannte Einstellung (wie in der "state retention"-Datei gespeichert) benutzen, außer Sie deaktivierern die use_retained_program_state-Option.
Wenn Sie diese Einstellung ändern wollen, wenn "state retention" aktiviert ist (und use_retained_program_state aktiviert ist), müssen Sie die entsprechenden externen Kommandos benutzen oder die Einstellung über das Web-Interface verändern.

Folgende Werte sind gültig:

Service Check Execution Option

Format: execute_service_checks=<0/1>
Beispiel: execute_service_checks=1

Diese Option gibt an, ob Nagios Dienst-Überprüfungen ausführt wenn es (re)startet oder nicht. Wenn Sie diese Option deaktivieren, wird Nagios keine Dienste aktiv überprüfen und verbleibt in einer Art "sleep"-Modus. Nagios kann in dieser Einstellung aber trotzdem die Ergebnisse von passiven Überprüfunfen entgegennehmen, ausser Sie haben auch dieses deaktiviert.
Diese Option wird meistens benutzt, um redundanze Backup-Monitoring-Server zu konfigurieren, wie in der Redundanz-Dokumentation beschrieben, oder um eine verteilte Überwachungs-Umgebung aufzubauen.
Hinweis: Wenn Sie "state retention" aktiviert haben, wird Nagios diese Option ignorieren, und die letzte bekannte Einstellung (wie in der "state retention"-Datei gespeichert) benutzen, außer Sie deaktivierern die use_retained_program_state-Option.
Wenn Sie diese Einstellung ändern wollen, wenn "state retention" aktiviert ist (und use_retained_program_state aktiviert ist), müssen Sie die entsprechenden externen Kommandos benutzen oder die Einstellung über das Web-Interface verändern.

Folgende Werte sind gültig:

Passive Service Check Acceptance Option

Format: accept_passive_service_checks=<0/1>
Beispiel: accept_passive_service_checks=1

Diese Option gibt an, ob Nagios die Ergebnisse von passiven Dienst-Überprüfungen entgegennimmt oder nicht, wenn es (re)startet. Wenn Sie diese Option deaktivieren, wird Nagios keinerlei Ergebnisse von passiven Dienst-Überprüfungen entgegennehmen.

Hinweis: Wenn Sie "state retention" aktiviert haben, wird Nagios diese Option ignorieren, und die letzte bekannte Einstellung (wie in der "state retention"-Datei gespeichert) benutzen, außer Sie deaktivierern die use_retained_program_state-Option.
Wenn Sie diese Einstellung ändern wollen, wenn "state retention" aktiviert ist (und use_retained_program_state aktiviert ist), müssen Sie die entsprechenden externen Kommandos benutzen oder die Einstellung über das Web-Interface verändern.

Folgende Werte sind gültig:

Event Handler Option

Format: enable_event_handlers=<0/1>
Beispiel: enable_event_handlers=1

Diese Option gibt an, ob Nagios Event-Handler ausführt oder nicht, wenn der Prozess (re)startet wird. Wenn Sie diese Option deaktivieren, wird Nagios keiner Event-Handler für Hosts oder Dienste ausführen.

Hinweis: Wenn Sie "state retention" aktiviert haben, wird Nagios diese Option ignorieren, und die letzte bekannte Einstellung (wie in der "state retention"-Datei gespeichert) benutzen, außer Sie deaktivierern die use_retained_program_state-Option.
Wenn Sie diese Einstellung ändern wollen, wenn "state retention" aktiviert ist (und use_retained_program_state aktiviert ist), müssen Sie die entsprechenden externen Kommandos benutzen oder die Einstellung über das Web-Interface verändern.

Folgende Werte sind gültig:

Log Rotation Method

Format: log_rotation_method=<n/h/d/w/m>
Beispiel: log_rotation_method=d

Diese Option gibt an, wie oft die Log-Dateien von Nagios in das Archiv-Verzeichnis verschoben werden.

Folgende Werte sind gültig:

Log Archive Path

Format: log_archive_path=<Pfad>
Beispiel: log_archive_path=/usr/local/nagios/var/archives/

Diese Direktive gibt an in welches Verzeichnis Nagios die Logdateien verschiebt und archiviert. Diese Option wird ignoriert, wenn Sie die Archivierung der Logdateien deaktiviert lassen.

External Command Check Option

Format: check_external_commands=<0/1>
Beispiel: check_external_commands=1

Mit dieser Option entscheiden Sie, ob Nagios die externe Befehls-Datei nach internen Kommandos überprüft und diese ausführt oder nicht.
Diese Option muss aktiviert sein, wenn Sie das Befehls-CGI nutzen wollen, um Nagios über das Web-Interface zu steuern. Weitere externe Programme können auch in die externe Befehls-Datei schreiben, wenn es die entsprechenden Dateirechte (wie in dieser FAQ beschrieben) gesetzt hat.

Weitere Informationen über externe Befehle finden Sie hier.

External Command Check Interval

Format: command_check_interval=<xxx>
Beispiel: command_check_interval=1

Hier wird die Zahl der "Zeiteinheiten" angegeben, die zwischen den Überprüfungen der externen Befehls-Datei gewartet wird. Jedes Mal wenn Nagios diese Datei überprüft wird es alle Befehle in der Datei bearbeiten, bevor Nagios mit anderen Dingen fortfährt.

Weitere Informationen über externe Befehle finden Sie hier.

External Command File

Format: command_file=<Dateiname>
Beispiel: command_file=/usr/local/nagios/var/rw/nagios.cmd

Hier geben Sie die Datei an, die Nagios auf externe Befehle hin überprüft. Außerdem schreibt das Befehls-CGI in diese Datei.
Andere externe Programme können auch in diese Datei schreiben, wenn Sie Ihr die entsprechenden Dateirechte (wie in dieser FAQ beschrieben) gesetzt haben.

Die externe Befehlsdatei ist als "named pipe" (FIFO) implementiert und wird von Nagios erstellt, wenn der Prozess startet und entfernt, wenn sich Nagios beendet. Falls diese Datei existiert wenn Nagios startet, wird sich der Nagios-Prozess mit einer Fehlermeldung beenden.

Weitere Informationen über externe Befehle finden Sie hier.

Downtime File

Format: downtime_file=<Dateiname>
Beispiel: downtime_file=/usr/local/nagios/var/downtime.log

Dies ist die Datei, die von Nagios benutzt wird um Informationen über geplante Ausfallzeiten von Hosts und Diensten zu speichen. Diese können sowohl für Hosts als auch für Dienste über das "extended information"-CGI gelesen und hinzugefügt werden.

Comment File

Format: comment_file=<Dateiname>
Beispiel: comment_file=/usr/local/nagios/var/comment.log

In dieser Datei speichert Nagios alle Kommentare zu Hosts und Diensten. Diese können sowohl für Hosts als auch für Dienste über das "extended information"-CGI gelesen und hinzugefügt werden.

Lock File

Format: lock_file=<Dateiname>
Beispiel: lock_file=/tmp/nagios.lock

Diese Option gibt den Ort der Lock-Datei für den Nagios-Prozess an. Diese wird von Nagios erstellt, wenn es als Daemon (-d Argument in der Kommandozeile) läuft. Die Lock-Datei enthält die Prozess-ID (PID) des laufenden Nagios-Prozess.

State Retention Option

Format: retain_state_information=<0/1>
Beispiel: retain_state_information=1

Diese Option gibt an, ob Nagios Status-Informationen über Hosts und Dienste zwischen einen Prozess-Restart übernimmt oder nicht.
Falls Sie diese Option aktivieren, sollten Sie einen Wert in der state_retention_file-Variable angegeben haben. Wenn aktiviert, speichert Nagios alle Status-Informationen über Hosts und Dienste bevor es sich beendet (oder neu startet) und wird diese gespeicherten Informationen wieder einlesen, wenn Nagios wieder gestartet wurde.

State Retention File

Format: state_retention_file=<Dateiname>
Beispiel: state_retention_file=/usr/local/nagios/var/status.sav

Dies ist die Datei in die Nagios alle Informationen für die Übernahme der Stati für Hosts und Dienste speichert, bevor es sich beendet. Wenn Nagios neu gestartet wird, wird es die hier gespeicherten Informationen aus dieser Datei wieder einlesen um die initialen Stati für die Überwachung zu setzen.
Diese Datei wird von Nagios gelöscht, nachdem es die Status-Informationen bei einem Programmstart hieraus gelesen hat. Um diese Feature zu nutzen, müssen Sie die retain_state_information-Option aktiviert haben.

Automatic State Retention Update Interval

Format: retention_update_interval=<Minuten>
Beispiel: retention_update_interval=60

Diese Einstellung gibt an, wie häufig (in Minuten) Nagios automatisch die Übernahme-Daten während einem normalen Betrieb speichert. Wenn Sie diesen Wert auf 0 setzen, wird Nagios die Übernahme-Daten nicht während dem regulären Betrieb, sondern nur bei seiner Beendigung speichern.
Falls Sie die Status-Übernahme (mit der retain_state_information-Option) deaktiviert haben, hat diese Einstellung keinerlei Effekt.

Use Retained Program State Option

Format: use_retained_program_state=<0/1>
Beispiel: use_retained_program_state=1

Diese Einstellung gibt an, ob Nagios auch diverse programmweite Status-Variablen in der Status-Übernahmedatei speichert oder nicht.
Einige dieser Variablen die übernommen werden sind die enable_notifications-, enable_flap_detection-, enable_event_handlers-, execute_service_checks- und die accept_passive_service_checks-Optionen. Wenn Sie die Status-Übernahme nicht aktiviert haben, hat diese Option natürlich keinen Effekt.

Syslog Logging Option

Format: use_syslog=<0/1>
Beispiel: use_syslog=1

Diese Variable gibt an, ob Nagios Prozess-Nachrichten an die syslog-Facility des lokalen Hosts schicken soll oder nicht.

Gültige Werte sind:

Notification Logging Option

Format: log_notifications=<0/1>
Beispiel: log_notifications=1

Diese Variable gibt an ob Benachrichtigungen mitgeloggt werden oder nicht. Falls Sie also eine Vielzahl von Kontakten haben die benachrichtigt werden oder Sie eine hohe Zahl von Dienst-Fehlern haben, wird Ihr Logfile bei Aktivierung dieser Einstellung dementsprechend schnell wachsen.

Service Check Retry Logging Option

Format: log_service_retries=<0/1>
Beispiel: log_service_retries=1

Diese Variable gibt an, ob die Wiederholungen von Dienst-Überprüfungen mitgeloggt werden oder nicht. Dienst-Überprüfungen werden wiederholt, wenn das Ergebnis einer Überprüfung einen nicht-OK-Status ergibt, Sie aber Nagios so konfiguriert haben, dass es die Überprüfung wiederholt bevor es endgültig auf diesen Status reagiert.
Das Logging von Wiederholungen von Dienst-Überprüfungen ist am sinnvollsten wenn Sie versuchen Nagios zu debuggen oder Sie Event-Handler für Dienste testen.

Host Check Retry Logging Option

Format: log_host_retries=<0/1>
Beispiel: log_host_retries=1

Diese Option gibt an ob die Wiederholungen von Host-Überprüfungen mitgeloggt werden oder nicht. Das loggen von Wiederholungen von Host-Überprüfungen ist am sinnvollsten, wenn Sie Nagios debuggen oder Event-Handler für Hosts ausprobieren.

Event Handler Logging Option

Format: log_event_handlers=<0/1>
Beispiel: log_event_handlers=1

Diese Variable gibt an, ob die Ausführung von Event-Handler von Hosts und/oder Diensten protokolliert werden oder nicht. Event-Handler sind optionale Befehle, die ausgeführt werden können, wenn sich der Status eines Hosts oder Dienstes ändert. Das Protokollieren von Event-Handler ist sinnvoll, wenn Sie Nagios debuggen oder Ihre Event-Handler-Skripte ausprobieren.

Initial States Logging Option

Format: log_initial_states=<0/1>
Beispiel: log_initial_states=1

Diese Variable gibt an ob Nagios die Protokollierung von allen initialen Host- und Dienst-Stati erzwingt oder nicht, auch wenn Ihr Status OK ist. Initiale Host- und Dienst-Stati werden normalerweise nur mitgeloggt, wenn es Probleme mit der ersten Überprüfung gibt.
Die Aktivierung dieser Einstellung ist sinnvoll, wenn Sie eine Applikation einsetzen, die die Logdateien auswertet um eine Langzeit-Statistik für Hosts und Dienste zu generieren.

External Command Logging Option

Format: log_external_commands=<0/1>
Beispiel: log_external_commands=1

Diese Variable gibt an ob Nagios die externen Befehle, die es von der externen Befehlsdatei empfängt, mitprotokolliert oder nicht.

Hinweis: Diese Option kontrolliert nicht ob passive Dienst-Überprüfungen (die auch eine Art von externen Befehlen sind) protokolliert werden. Um die Protokollierung von passiven Überprüfungen zu aktivieren oder zu deaktivieren, müssen Sie die log_passive_service_checks-Option benutzen.

Passive Service Check Logging Option

Format: log_passive_service_checks=<0/1>
Beispiel: log_passive_service_checks=1

Diese Variable gibt an, ob Nagios die passiven Dienst-Überprüfungen, die es von der externen Befehlsdatei empfängt, mitprotokolliert oder nicht.
Falls Sie eine verteilte Überwachungs-Umgebung aufsetzen oder planen regulär eine hohe Zahl von passiven Überprüfungen zu verarbeiten, wollen Sie diese Option evtl. deaktivieren, damit Ihre Logdatei nicht zu gross wird.

Global Host Event Handler Option

Format: global_host_event_handler=<command>
Beispiel: global_host_event_handler=log-host-event-to-db

Diese Option erlaubt es Ihnen ein Event-Handler-Befehl anzugeben, der bei jeder Status-Änderung jeden Hosts ausgeführt wird. Der globale Event-Handler wird vor dem Event-Handler ausgeführt, den Sie optional für jeden Host einzeln definieren können.
Das command-Argument ist der Kurz-Name für den Befehl, den Sie in Ihrer Objekt-Konfigurationsdatei angeben haben. Die maximale Dauer die dieser Befehl laufen kann wird von der event_handler_timeout-Option kontrolliert.

Weitere Informationen über Event-Handler finden Sie hier.

Global Service Event Handler Option

Format: global_service_event_handler=<command>
Beispiel: global_service_event_handler=log-service-event-to-db

Diese Option erlaubt es Ihnen ein Event-Handler-Befehl anzugeben, der bei jeder Status-Änderung jedes Dienstes ausgeführt wird. Der globale Event-Handler wird vor dem Event-Handler ausgeführt, den Sie optional für jeden Dienst einzeln definieren können.
Das command-Argument ist der Kurz-Name für den Befehl, den Sie in Ihrer Objekt-Konfigurationsdatei angeben haben. Die maximale Dauer die dieser Befehl laufen kann wird von der event_handler_timeout-Option kontrolliert.

Weitere Informationen über Event-Handler finden Sie hier.

Inter-Check Sleep Time

Format: sleep_time=<Sekunden>
Beispiel: sleep_time=1

Dies ist die Anzahl von Sekunden die Nagios wartet, bevor es mit der nächsten Überprüfungen in der Queue fortfährt. Beachten Sie das Nagios nur mit Überprüfungen abwartet, wenn es sich im Zeitplan befindet und alle aufgestauten Überprüfungen abgearbeitet hat.

Inter-Check Delay Method

Format: inter_check_delay_method=<n/d/s/x.xx>
Beispiel: inter_check_delay_method=s

Diese Option erlaubt es Ihnen zu kontrollieren, wie Dienst-Überprüfungen in der Queue verteilt werden. Wenn Sie die "smart delay calculation" (der Standard) benutzen, wird Nagios einen durchschnittlichen Überprüfungs-Intervall errechnen und alle initialen Dienst-Überprüfungen aufgrund dieses Intervalls über die Queue verteilen. So werden z.B. CPU-Lastspitzen vermieden.

Die Deaktivierung ist nicht empfohlen, außer Sie haben die parallelen Dienst-Überprüfungen ausprobiert. Falls Sie keinen Delay setzen, wird dies dazu führen, dass alle Dienst-Überprüfungen zu genau der gleichen Zeit ausgeführt werden. Das bedeutet, dass Sie immer hohe CPU-Lastspitzen zu verzeichnen haben, wenn die Dienste überprüft werden.

Weitere Informationen wie man den "inter-check delay" berechnet, finden Sie hier.

Gültige Werte sind:

Service Interleave Factor

Format: service_interleave_factor=<s|x>
Beispiel: service_interleave_factor=s

Diese Variable gibt an wie Dienst-Überprüfungen ausgelassen werden. Die Auslassung erlaubt eine gleichmässige Verteilung von Dienst-Überprüfungen, verringert die Last auf remote Hosts und eine führt zu einer schnelleren Erkennung von Host-Problemen.
Mit der Einführung von paralellen Dienst-Überprüfungen und ohne eine Auslassung konnten remote Hosts mit Überprüfungen geradezu bombardiert werden. Dies konnte dazu führen, dass Service-Überprüfungen fehlschlugen oder einen falschen Status zurückmeldeten, da der remote Host mit der Vielzahl von Überprüfungen überfordert wurde.
Wenn Sie diesen Wert auf 1 setzen werden Dienst-Überprüfungen nicht ausgelassen (so wie Nagios vor der Version 0.0.5 arbeitete). Setzen Sie den Wert auf s (smart), damit Nagios den Auslassungs-Faktor automatisch errechnet, außer Sie haben einen bestimmten Grund diesen Wert zu verändern.
Der beste Wegum die Auslassung von Dienst-Überprüfungen zu verstehen ist, sich das Status-CGI (detaillierte Ansicht) anzuschauen, wenn Nagios gerade gestartet wurde. Sie sollten sehen können, dass die Ergebnisse von Dienst- Überprüfungen verteilt auftauchen.

Weitere Informationen über die Auslassung können Sie hier finden.

Maximum Concurrent Service Checks

Format: max_concurrent_checks=<max_checks>
Beispiel: max_concurrent_checks=20

Diese Option erlaubt es Ihnen anzugeben, wieviele Dienst-Überprüfungen maximal parallel laufen können. Geben Sie einen Wert von 1 an, um zu verhindern, dass die Dienst-Überprüfungen parallel ablaufen. Geben Sie einen Wert von 0 (der Standard) an, um keinerlei Restriktion auf die Anzahl von paralellen Überprüfungen zu setzen. Sie sollten diesen Wert auf Basis der verfügbaren System-Ressourcen des Servers auf dem Sie Nagios installiert haben, verändern, da es direkt die maximale Last auf dem System (Prozessor-Benutzung, Speicher, usw.) beeinflusst.

Weitere Informationen wie Sie die Anzahl von gleichzeitigen Überprüfungen berechnen, finden Sie hier.

Service Reaper Frequency

Format: service_reaper_frequency=<Frequenz_In_Sekunden>
Beispiel: service_reaper_frequency=10

Diese Option erlaubt es Ihnen die Frequenz in Sekunden der "Reapers"-Events zu kontrollieren. Die "Reaper"-Events bearbeitet die Ergebnisse der paralellen Dienst- Überprüfungen, wenn diese sich beendet haben. Diese Events stellen den Kern der Überwachungs-Logik von Nagios dar.

Timing Interval Length

Format: interval_length=<Sekunden>
Beispiel: interval_length=60

Dies ist die Anzahl von Sekuden pro "Intervall-Einheit", die benutzt wird um den Zeitplan der Überprüfungs-Queue, der Benachrichtigungen, usw. zu planen. "Intervall-Einheiten" werden benutzt um in der Host-Konfigurationsdatei anzugeben, wie oft eine Dienst-Überprüfung läuft, wie oft ein Kontakt erneut benachrichtig wird, usw.

Wichtig: Der Standard-Wert ist auf 60 gesetzt, was bedeutet, dass ein "Einheits-Wert" von 1 in der Host-Konfigurationsdatei 1 Minute (60 Sekunden) bedeutet. Ich habe in dieser Variable noch keine anderen Werte ausprobiert, deshalb ist die Veränderung dieser Variable auf eigene Gefahr!

Agressive Host Checking Option

Format: use_agressive_host_checking=<0/1>
Beispiel: use_agressive_host_checking=0

Nagios versucht intelligent bei der Überprüfung eines Hosts-Status vorzugehen. Wird diese Option deaktiviert, erlaubt man Nagios wesentlich intelligentere Entscheidungen bei der Überprüfung von Hosts zu treffen. Dies führt dazu, dass die Überprüfung von Hosts auch schneller abläuft.
Die Aktivierung diesr Option wird die Zeit erhöhen, die Nagios benötigt, um einen Host zu überprüfen, wird aber auch die Verlässlichkeit dieser Überprüfungen noch ein bischen erhöhen.
So lange Sie aber keine Probleme damit haben, dass Nagios das recovern von Hosts nicht erkennt, sollten Sie diese Option nicht aktivieren.

Flap Detection Option

Format: enable_flap_detection=<0/1>
Beispiel: enable_flap_detection=0

Diese Option gibt an, ob Nagios versuchen soll das "flappen" von Hosts oder Diensten zu erkennen. Flapping kommt vor, wenn ein Host oder Dienst seinen Status zu oft ändert, was dazu führt, dass die Kontakte zu häufig mit Benachrichtigungen überflutet werden.
Wenn Nagios einen Host oder Dienst erkennt, der flappt, wird es kurzzeitig die Benachrichtigung für diesen Dienst/Host unterdrücken, bis der Host oder Dienst aufhört zu flappen.
Die Flap-Erkennung ist noch sehr experimentell, deshalb sollte man diese Feature mit Vorsicht benutzen!

Weitere Informationen darüber wie die Flap-Erkennung arbeitet, finden Sie hier.

Hinweis: Wenn Sie "state retention" aktiviert haben, wird Nagios diese Option ignorieren, und die letzte bekannte Einstellung (wie in der "state retention"-Datei gespeichert) benutzen, außer Sie deaktivierern die use_retained_program_state-Option.
Wenn Sie diese Einstellung ändern wollen, wenn "state retention" aktiviert ist (und use_retained_program_state aktiviert ist), müssen Sie die entsprechenden externen Kommandos benutzen oder die Einstellung über das Web-Interface verändern.

Low Service Flap Threshold

Format: low_service_flap_threshold=<percent>
Beispiel: low_service_flap_threshold=25.0

Diese Option wird benutzt, um den unteren Schwelle für die Erkennung eines flappenden Dienstes anzugeben.

Weitere Informationen darüber wie die Flap-Erkennung arbeitet, finden Sie hier.

High Service Flap Threshold

Format: high_service_flap_threshold=<percent>
Beispiel: high_service_flap_threshold=50.0

Diese Option wird benutzt, um den obere Schwelle für die Erkennung eines flappenden Dienstes anzugeben.

Weitere Informationen darüber wie die Flap-Erkennung arbeitet, finden Sie hier.

Low Host Flap Threshold

Format: low_host_flap_threshold=<percent>
Beispiel: low_host_flap_threshold=25.0

Diese Option wird benutzt, um den untere Schwelle für die Erkennung eines flappenden Hosts anzugeben.

Weitere Informationen darüber wie die Flap-Erkennung arbeitet, finden Sie hier.

High Host Flap Threshold

Format: high_host_flap_threshold=<percent>
Beispiel: high_host_flap_threshold=50.0

Diese Option wird benutzt, um den obere Schwelle für die Erkennung eines flappenden Hosts anzugeben.

Weitere Informationen darüber wie die Flap-Erkennung arbeitet, finden Sie hier.

Soft Service Dependencies Option

Format: soft_state_dependencies=<0/1>
Beispiel: soft_state_dependencies=0

Diese Option gibt an, ob Nagios auch die "soften" Status-Informationen bei der Überprüfung von Dienst-Abhängigkeiten verwerten soll. Normalerweise verwertet Nagios nur den letzten harten Status, wenn es Abhängigkeiten überprüft.
Falls Sie wollen, dass Nagios den letzten Status - egal ob es ein softer oder harter Status-Typ ist - verwenden soll, aktivieren Sie diese Option.

Service Check Timeout

Format: service_check_timeout=<Sekunden>
Beispiel: service_check_timeout=60

Dies ist die maximale Anzahl von Sekunden, die Nagios für eine Dienst-Überprüfung erlaubt. Falls eine Überprüfung diese Zeit überschreitet, wird diese sofort beendet und ein kritischer Status zurückgegeben. Außerdem wird ein timeout-Fehler protokolliert.

Es herrscht oft Verwirrung darüber, was diese Option nun wirklich tut. Sie ist als letzte Kontroll-Instanz für Plugins gedacht, die eine Fehlfunktion haben und sich nicht in der vorgegebenen Art und Weise beenden. Der Wert sollte relativ hoch gesetzt werden (z.B. 60 Sekunden oder höher), so dass sich jede Überprüfung in diesem Zeitraum normalerweise beendet haben sollte. Falls ein Überprüfungs-Plugin länger als der hier angegebene Wert läuft, wird Nagios die Überprüfung als "fehlerhaft" betrachten und beenden.

Host Check Timeout

Format: host_check_timeout=<Sekunden>
Beispiel: host_check_timeout=60

Dies ist die maximale Anzahl von Sekunden, die Nagios für eine Host-Überprüfung erlaubt. Falls eine Überprüfung diese Zeit überschreitet, wird diese sofort beendet und ein kritischer Status zurückgegeben. Außerdem wird ein timeout-Fehler protokolliert.

Es herrscht oft Verwirrung darüber, was diese Option nun wirklich tut. Sie ist als letzte Kontroll-Instanz für Plugins gedacht, die eine Fehlfunktion haben und nicht sich nicht in der vorgegebenen Art und Weise beenden. Der Wert sollte relativ hoch gesetzt werden (z.B. 60 Sekunden oder höher), so das sich jede Überprüfung in diesem Zeitraum normalerweise beendet haben sollte. Falls ein Überprüfungs-Plugin länger als der hier angegebene Wert läuft, wird Nagios die Überprüfung als "fehlerhaft" betrachten und beenden.

Event Handler Timeout

Format: event_handler_timeout=<Sekunden>
Beispiel: event_handler_timeout=60

Dies ist die maximale Anzahl von Sekunden, die Nagios für einen Event-Handler erlaubt. Falls eine Überprüfung diese Zeit überschreitet, wird diese sofort beendet und ein kritischer Status zurückgegeben. Außerdem wird ein timeout-Fehler protokolliert.

Es herrscht oft Verwirrung darüber, was diese Option nun wirklich tut. Sie ist als letzte Kontroll-Instanz für Event-Handler gedacht, die eine Fehlfunktion haben und nicht sich nicht in der vorgegebenen Art und Weise beenden. Der Wert sollte relativ hoch gesetzt werden (z.B. 60 Sekunden oder höher), so das sich jeder Event-Handler in diesem Zeitraum normalerweise beendet haben sollte. Falls ein Event-Handler länger als der hier angegebene Wert läuft, wird Nagios den Event-Handler als "fehlerhaft" betrachten und beenden.

Notification Timeout

Format: notification_timeout=<Sekunden>
Beispiel: notification_timeout=60

Dies ist die maximale Anzahl von Sekunden, die Nagios für eine Benachrichtigung erlaubt. Falls eine Überprüfung diese Zeit überschreitet, wird diese sofort beendet und ein kritischer Status zurückgegeben. Außerdem wird ein timeout-Fehler protokolliert.

Es herrscht oft Verwirrung darüber, was diese Option nun wirklich tut. Sie ist als letzte Kontroll-Instanz für Benachrichtigungen gedacht, die eine Fehlfunktion haben und nicht sich nicht in der vorgegebenen Art und Weise beenden. Der Wert sollte relativ hoch gesetzt werden (z.B. 60 Sekunden oder höher), so das sich jede Benachrichtigung in diesem Zeitraum normalerweise beendet haben sollte. Falls ein Benachrichtigung länger als der hier angegebene Wert läuft, wird Nagios die Benachrichtigung als "fehlerhaft" betrachten und beenden.

Obsessive Compulsive Service Processor Timeout

Format: ocsp_timeout=<Sekunden>
Beispiel: ocsp_timeout=5

Dies ist die maximale Anzahl von Sekunden, die Nagios für einen "obsessive compulsive service processor"-Befehl erlaubt. Falls eine Überprüfung diese Zeit überschreitet, wird dieser sofort beendet und ein timeout-Fehler protokolliert.

Performance Data Processor Command Timeout

Format: perfdata_timeout=<Sekunden>
Beispiel: perfdata_timeout=5

Dies ist die maximale Anzahl von Sekunden, die Nagios für einen "host performance data processor"-Befehl erlaubt. Falls eine Überprüfung diese Zeit überschreitet, wird dieser sofort beendetund ein timeout-Fehler protokolliert.

Obsess Over Services Option

Format: obsess_over_services=<0/1>
Beispiel: obsess_over_services=1

Dieser Wert gibt an, ob Nagios die Ergebnisse von Dienst-Überprüfungen verfolgt und den "obsessive compulsive service processor"-Befehl - den Sie angeben - ausführen soll, oder nicht.
Ich weiß - lustiger Name - aber etwas besseres fiel mir hierfür nicht ein. Die Option ist nützlich, um z.B. eine verteilte Überwachungs-Umgebung aufzusetzen. Falls Sie keine verteilte Überwachungsstruktur haben, sollten Sie diese Option nicht aktivieren.

Obsessive Compulsive Service Processor Command

Format: ocsp_command=<befehl>
Beispiel: ocsp_command=obsessive_service_handler

Diese Option erlaubt es Ihnen einen Befehl anzugeben, der nach jeder Dienst-Überprüfung ausgeführt wird. Dies kann z.B. in verteilten Monitoring-Umgebungen nützlich sein.
Der Befehl wird nach jedem Event-Handler oder Benachrichtigungs-Befehl ausgeführt. Das befehl-Argument ist der Kurzname der Befehls-Definition, die Sie in Ihrer Konfiguration definiert haben.
Die maximale Dauer, die solch ein Befehl laufen kann, wird von der ocsp_timeout-Option kontrolliert.

Weitere Information über verteilte Monitoring-Umgebungen finden Sie hier.

Performance Data Processing Option

Format: process_performance_data=<0/1>
Beispiel: process_performance_data=1

Dieser Wert gibt an, ob Nagios die Performance-Daten von Host- und Dienst-Überprüfungen bearbeiten soll.

Orphaned Service Check Option

Format: check_for_orphaned_services=<0/1>
Beispiel: check_for_orphaned_services=0

Diese Option erlaubt es Ihnen die Überprüfung nach verweisten Dienst-Überprüfungen zu aktivieren oder zu deaktivieren.
Verweiste Dienst-Überprüfungen sind Überprüfungen, die ausgeführt wurden und aus der Queue entfernt wurden, aber seit einem langen Zeitraum keine Ergebnisse mehr geliefert haben. Da kein Ergebnis von der Überprüfung zurückkam, kann diese Überprüfung nicht in die Queue eingeplant werden. Dies kann dazu führen, dass einzelne Dienst-Überprüfungen nicht mehr ausgeführt werden.
Normalerweise kommt dieses sehr selten vor, z.B. wenn ein externer User oder Prozess den Prozess beendet hat, der für die Überprüfung verwendet wurde.
Wenn diese Option aktiviert ist und Nagios erkennt, dass eine bestimmte Dienst-Überprüfung keine Ergebnisse mehr liefert, wird Nagios eine Fehlermeldung protokollieren und die Überprüfungen neu in die Queue einplanen.
Falls Sie Dienst-Überprüfungen erkennen, die anscheinend nicht mehr neu ausgeführt werden, sollten Sie diese Option aktivieren und nach Nachrichten über diesen Dienst in den Logdateien schauen.

Service Freshness Checking Option

Format: check_service_freshness=<0/1>
Beispiel: check_service_freshness=0

Diese Option gibt an, ob Nagios periodisch die "frische" von Dienst-Überprüfungen überprüfen soll. Die Aktivierung ist hilfreich, wenn man garantieren will, dass passive Dienst-Überprüfungen zeitgerecht empfangen werden.

Weitere Informationen über die "Frische-Überprüfung" finden Sie hier.

Service Freshness Check Interval

Format: freshness_check_interval=<Sekunden>
Beispiel: freshness_check_interval=60

Diese Option gibt an, wie oft Nagios die "frische" von Server-Überprüfungen testen soll. Falls der "Frische-Dienst" deaktiviert ist (siehe check_service_freshness option), so hat diese Option keine Bedeutung. Mehr Informationen finden Sie hier.

Administrator Email Address

Format: admin_email=<email_addresse>
Beispiel: admin_email=root@localhost.localdomain

Dies ist die eMail-Adresse des Administrators der lokalen Maschine (auf der Nagios läuft). Dieser Wert kann in den Benachrichtigungs-Befehlen mit dem $ADMINEMAIL$-
Macro benutzt werden.

Administrator Pager

Format: admin_pager=<pager_number_or_pager_email_gateway>
Beispiel: admin_pager=pageroot@localhost.localdomain

Dies ist die Pagernummer (oder Pager-eMail-Gateway) für den Administrator der lokalen Maschine (auf der Nagios läuft). Die Pagernummer, bzw. -Adresse kann mit dem $ADMINPAGER$-Macro benutzt werden.