Aujourd'hui, un certain nombre de machines ont cessé d'avoir accès à Internet. Après beaucoup de dépannage, le fil conducteur est qu'ils ont tous renouvelé leur bail DHCP aujourd'hui (nous sommes en location de 8 jours ici).
Tout ce que vous attendez semble bon après le renouvellement du bail: ils ont une adresse IP valide, un serveur DNS et une passerelle. Ils ont accès aux ressources internes (partages de fichiers, intranet, imprimantes, etc.). Un peu plus de dépannage révèle qu'ils ne peuvent pas envoyer de ping ou tracert à notre passerelle, mais ils peuvent accéder à notre commutateur core layer3 juste en face de la passerelle. L'attribution d'une adresse IP statique à la machine fonctionne comme une solution temporaire.
Un dernier inconvénient est que jusqu'à présent, les rapports ne sont parvenus que pour les clients sur le même vlan que la passerelle. Notre personnel administratif et notre faculté sont sur le même vlan que les serveurs et les imprimantes, mais les téléphones, les porte-clés / caméras, les étudiants / wifi et les laboratoires ont chacun leurs propres vlans et pour autant que je n'ai rien vu sur aucun des autres vlans a encore eu un problème.
J'ai un ticket séparé avec le fournisseur de la passerelle, mais je soupçonne qu'ils vont retirer la facilité et me dire que le problème est ailleurs sur le réseau, donc je pose la question ici également. J'ai effacé les caches d'arp sur la passerelle et le commutateur principal. Toutes les idées sont les bienvenues.
Mise à jour:
j'ai essayé de faire un ping depuis la passerelle vers certains hôtes affectés, et la chose étrange est que j'ai obtenu une réponse: à partir d'une adresse IP complètement différente. J'en ai essayé quelques autres au hasard et j'ai finalement obtenu ceci:
Ven. 02 sept. 2011 13:08:51 GMT-0500 (heure avancée du Centre) PING 10.1.1.97 (10.1.1.97) 56 (84) octets de données. 64 octets à partir du 10.1.1.105: icmp_seq = 1 ttl = 255 time = 1,35 ms 64 octets à partir du 10.1.1.97: icmp_seq = 1 ttl = 255 temps = 39,9 ms (DUP!)
10.1.1.97 est la cible réelle prévue du ping. 10.1.1.105 est censé être une imprimante dans un autre bâtiment. Je n'ai jamais vu de DUP dans une réponse ping auparavant.
Ma meilleure supposition pour le moment est un routeur wifi escroc dans l'une de nos dortoirs sur le sous-réseau 10.1.1.0/24 avec une mauvaise passerelle.
...a continué. J'ai maintenant éteint l'imprimante incriminée et les pings vers un hôte affecté depuis la passerelle échouent complètement.
Mise à jour 2:
je vérifie les tables d'arp sur une machine affectée, la passerelle et chaque commutateur entre elles. À chaque point, les entrées pour ces appareils étaient toutes correctes. Je n'ai pas vérifié toutes les entrées du tableau, mais toutes les entrées susceptibles d'avoir un impact sur le trafic entre l'hôte et la passerelle étaient correctes. L'ARP n'est pas le problème.
Mise à jour 3:
Les choses fonctionnent pour le moment, mais je ne vois rien de ce que j'ai fait pour les réparer et je n'ai donc aucune idée si cela pourrait être juste une accalmie temporaire. Quoi qu'il en soit, il n'y a pas grand-chose que je puisse faire pour diagnostiquer ou dépanner maintenant, mais je mettrai à jour plus s'il se brise à nouveau.