Outils pour utilisateurs

Outils du site


monitoring

Ceci est une ancienne révision du document !


Monitoring & Métrologie

Shinken a été choisi comme outils de monitoring. Pour la métrologie, nous avons décidé de reposer sur une interface à rrdtool, pnp4nagios peut être un bon candidat

plugin nagios

afin de garder une consistence entre chacun de nos outils, et mieux maitriser notre techno. nous allons developpez nos propre plugin nagios.

Sur le choix de la technologie employé, nos allons resté sur du python quand on doit les écrire. Autrement, nous utiliserons les plugins qui viennent par défaut avec shinken

Configuration

commun

Chaque serveur Faimaison est monitoré sur les points suivant :

  • load : load average
  • CPU : récupération des différents état d'un cpu (idle, user, iowait, etc)
  • réseau : débit des interfaces
  • ram & swap : utilisation de la ram et swap
  • disk : espace disque de chaque partition
  • ntp : vérifie décalage par rapport à un server ntp donné

services

Services à monitorer :

  • HTTP : pour le site (test port 80 + parse page index)
  • DNS : résolution de nom de faimaison.net
  • SSH : test de connexion ssh (test port 22)
  • GIT+SSH : accès aux dépôts git
  • GIT : accès aux dépôts git (read-only)

Active et Passive checks

Différent type de récupération des données peuvent être faites. nous pouvons sois demander au serveur monitoré d'envoyer de lui-même ces propre tests sur un intervalle défini (passive checks) ou alors shinken peut interroger le serveur à intervalle régulier (active checks).

Il existe plusieurs méthode pour réaliser des active checks.

type de check description
check_by_ssh execute une commande distante par ssh
nrpe protocole particulier qui va interroger le serveur avec un agent
check_mk comme nrpe mais en plus efficace FIXME

De manière générale, il faut éviter les connexion inutile. Le principe de check passif est interessant mais demande à mettre à jour chaque serveurs si une modification commune doit être faite. nrpe et check_mk centralise la chose sur le serveur shinken, et pourrait être plus simple à gérer dans le cadre de l'association.

Haute Disponibilité

En cas d'indisponibilité du serveur principal, un spare peut prendre le relais. Mais ceci reste à définir.

Backup

Shinken dispose de son propre système de backup. Ce qui est sauvegardé n'est que les fichiers plat de configuration. Pour cela faire la commande suivante :

/usr/local/shinken/install -b

Par défaut, les sauvegardes sont faites dans le répertoire /opt/backup. Pour l'isoler d'autre backup nous préciserons le le mettre dans /opt/backup/shinken

lister le backup

pour voir toutes les backup faites :

/usr/local/shinken/install -l
monitoring.1332681742.txt.gz · Dernière modification : 2013/01/01 22:59 (modification externe)