Nagios

From A-Eskwiki
Revision as of 18:08, 15 October 2014 by Albertp (Talk | contribs)

Jump to: navigation, search

Nagios gebruiken we om op alle computers en virtuele machines een aantal belangrijke zaken in de gaten te houden. Het draait op de vm-nagios; op de andere machines staat nrpe geïnstalleerd om de checks te kunnen uitvoeren die niet op afstand gedaan kunnen worden.

vm-nagios

In de map /etc/nagios/conf.d/ staan de instellingen voor Nagios.
Als het goed is zijn alle hosts (computers en vm's) en services goed geordend in bestanden voor workstations (centos), server(s) en vm's.
Alle wijzigingen hier moeten in salt gezet worden. Gebruik hiervoor:
scp bestandsnaam1 bestandsnaam2 (...) root@vm-salt-master:/srv/salt/centos/vm-nagios/conf.d/
Het is een goede gewoonte om dan op vm-salt-master naar deze map te gaan en svn ci uit te voeren om je wijzigingen te committen.

NRPE

De commando's die nrpe gebruikt om deze checks uit te voeren zijn gedefinieerd in bestanden in de map /etc/nrpe.d/. Ook is configuratie in /etc/nagios/nrpe.cfg en /etc/nagios/nrpe_local.cfg mogelijk maar het is mooier om die niet te gebruiken. Na het aanpassen hiervan moet nrpe opnieuw gestart worden met een van de volgende commando's:
CentOS: service nrpe restart
Debian (Haskell en oud systeem): service nagios-nrpe-server restart

Op CentOS 6 is het mogelijk om "service nrpe reload" te doen, maar dat commando werkt niet! NRPE zal stoppen met een fout in /var/log/messages als je dit doet. Op CentOS 7 is het dan ook niet mogelijk om service nrpe reload te doen.

SMART check

Om op de workstations de SMART status te checken, moet je dit commando uitvoeren wat op dit moment (1 oktober 2014) nog niet in salt gebeurt:
chmod +x /usr/lib64/nagios/plugins/check_ide_smart

Kernel check (Haskell)

Als Haskell met een andere kernel opstart geeft Nagios hiervan een melding. Als de nieuwe kernel goed werkt en mag blijven, pas dan op Haskell in /etc/nagios/nrpe.d/haskell.cfg de kernelversie aan en voer service nagios-nrpe-server restart uit.