Sur plusieurs plates-formes de production, nous avons observé des symptômes qui semblent suggérer que l'heure du jour saute périodiquement vers l'avant ou vers l'arrière. Les sauts durent généralement environ 1 seconde, s'annulent généralement (sautent en avant puis en arrière très peu de temps après) et se produisent environ 50 fois par jour. Cette dérive est plus visible pendant les périodes d'utilisation maximale des applications et pendant les périodes d'opérations d'E / S de disque élevées telles que les sauvegardes quotidiennes. Ces dérives affectent notre application sensible sensible en temps réel.
Les systèmes sont des serveurs Oracle Netra X4250 et Netra X4270 exécutant SLES 11SP2 avec un noyau par défaut 3.0.58-0.6.6.
$ cat /sys/devices/system/clocksource/clocksource0/available_clocksource
tsc hpet acpi_pm
$ cat /sys/devices/system/clocksource/clocksource0/current_clocksource
tsc
Nous avons désactivé NTP , mais cela n'a eu aucun effet sur les dérives. Existe-t-il des outils qui mesurent la dérive de l'heure de la journée? Comment éviter cela?
Ce sont des plates-formes de production, et nous ne pouvons pas recréer le problème dans nos laboratoires, donc ma capacité à expérimenter est limitée. Si je le laisse à mes propres appareils, j'écrirai un outil pour mesurer la dérive et peut-être expérimenterai avec une source d'horloge HPET .
ntpdate(8)
ountpd(8)
).