Munin: monitoring and email

Munin

Aperçu

Accès: https://munin.entreprise.api.gouv.fr

Le Master est installé sur watchdoge et possède 3 nodes: production1, production2, sirene.

Munin monitore de nombreuses valeurs système et envoie un mail de warning|critical lors du dépassement des seuils.

Munin récupère toutes ces informations toutes les 5 minutes auprès de ses nodes sur le port 4949 (uniquement depuis l'IP de watchdoge).

Il n'est pas possible de réduire le temps de rafraichissement de Munin (mais possible de le forcer).

Mailing

L'envoie de mail par Munin se grâce à sendmail, les mails sont interceptés par postfix qui les envoie au relai smtp de mailjet.com.

Plugins

La liste des plugins actifs peut être trouvée par:

ls /etc/munin/plugins

La liste des plugins disponibles :

sudo munin-node-configure --suggest

Commandes utiles:

Run un plugin en particulier pour visualiser les fields disponibles et leurs valeurs

munin-run <plugin_name>

Pour avoir plus d'informations:

munin-run <plugin_name> debug

Forcer l'update de Munin:

su - munin --shell=/bin/bash -c "munin-cron"

Forcer l'envoie de mail warning/critical pour tester les seuils:

su - munin --shell=/bin/bash -c "/usr/share/munin/munin-limits --contact email --force"

Les données des graphiques sont stockées dans (peuvent être supprimés à la main et édités):

/var/lib/munin/<node_name>/*.rrd

Known issues

General

De nombreux changements nécessitent de relancer munin-node donc:

sudo service munin-node restart

Sendmail

sendmail n'arrive parfois pas à envoyer les mails car le port 25 est déjà occupé par une autre instance de sendmail... La solution est de kill ce processus et de relancer le service sendmail:

netstat -pel | grep smtp
kill <process_id>
sudo service postfix restart

Liens utiles

Last updated