Nous nous apprêtons à effectuer une mise à niveau importante sur nos serveurs SQL et constatons un comportement inhabituel avec les groupes de disponibilité distribuée que j'essaie de résoudre avant d'aller de l'avant.
Le mois dernier, j'ai mis à niveau un serveur secondaire distant de SQL Server 2016 vers SQL Server 2017. Ce serveur fait partie de plusieurs groupes de disponibilité distribués (DAG) et d'un groupe de disponibilité (AG) distinct . Lorsque nous avons mis à niveau ce serveur, nous ne savions pas qu'il entrerait dans un état illisible , donc au cours du dernier mois, nous nous sommes uniquement appuyés sur le serveur principal.
Dans le cadre de la prochaine mise à niveau, j'ai appliqué le patch CU 4 au serveur et l' ai redémarré. Lorsque le serveur est revenu en ligne, le secondaire juste corrigé a montré que tous les DAG / AG se synchronisaient sans aucun problème.
Cependant, le primaire montrait une histoire très différente. Il rapportait que
- l'AG séparé se synchronisait sans aucun problème
- mais les DAG étaient dans un non à une synchronisation / pas en bonne santé État
Après avoir paniqué initialement, j'ai tenté les choses suivantes pour que les choses se synchronisent à nouveau dans les DAG:
- Depuis le primaire, j'ai arrêté et repris le mouvement des données. Cela n'a pas commencé à synchroniser les données.
- Sur le secondaire (celui que je viens de patcher), j'ai couru
ALTER DATABASE [<database] SET HADR RESUME;
- qui s'exécute sans erreur, mais n'a repris aucune synchronisation
Ma dernière tentative de synchronisation des données a été de me connecter au secondaire et de redémarrer manuellement le service SQL Server. Le redémarrage manuel du service semble un peu extrême, car je m'attendrais à ce que le serveur en cours de redémarrage soit suffisant.
Quelqu'un a-t-il rencontré ce problème lorsqu'un DAG ne démarre pas la synchronisation avec un secondaire après un redémarrage? Si oui, comment a-t-il été résolu?
J'ai vérifié à la fois le journal des erreurs de SQL Server et l'observateur d'événements sur le serveur secondaire, il n'y avait rien d'extraordinaire que je pouvais voir.