Quelle est la meilleure façon de soumettre un patch pour réparer tous les dégâts causés par LP: # 600941 ?
Je demande parce que LP: # 600941 a été mis dans toutes les versions d'Ubuntu toujours prises en charge à ce moment. Dois-je choisir une version particulière et l'exécuter ubuntu-bug
? Cette version doit-elle être le LTS ou Oneiric ou Precise (comment puis-je obtenir Precise si j'en ai besoin?)
L'histoire est qu'après sa sortie, tous nos systèmes ont commencé à subir des échecs de redémarrage de Nagios nrpe.
Des commandes comme /etc/init.d/nagios-nrpe-server restart
entraînerait l'arrêt de nrpe mais pas son redémarrage.
J'ai suivi cela jusqu'à la façon dont le /etc/init.d/nagios-nrpe-server
script appelle start-stop-daemon
.
Le problème est que la strophe "stop" du /etc/init.d/nagios-nrpe-server
script appelle d'abord start-stop-daemon qui envoie SIGTERM à nrpe et n'attend ensuite qu'une seconde.
Si nrpe n'est pas sorti à ce moment-là, le fichier pid existera toujours et le /etc/init.d/nagios-nrpe-server
script le supprimera.
Pire si /etc/init.d/nagios-nrpe-server restart
est utilisé non seulement le fichier pid sera supprimé, la tentative de redémarrage de nrpe échouera à condition que le démon nrpe soit encore en retard dans l'arrêt.
La tentative de démarrage dans ces circonstances échouera car nrpe sera toujours lié à un socket et la deuxième tentative de liaison entraînera l'abandon du démarrage de nrpe.
Ils auraient dû se demander pourquoi il y avait un commentaire sur "parfois le fichier pid n'est pas supprimé".
Ils devraient avoir testé sur des systèmes qui ont une forte charge et donc des temps de réponse nrpe lents.
Le correctif consiste à ajouter --retry 10
ou autre à l'invocation destart-stop-daemon ... --stop ...
Merci