Récemment, après avoir mis à niveau plusieurs circuits MetroE (connectivité L2) de 100 Mbits / s à 1 Gbit / s, j'ai remarqué que les transferts de fichiers volumineux échouaient entre certains sites; cependant, le transfert échoue seulement dans le sens. Par exemple, considérons l'exemple suivant.
De -> à
A -> B = Échec
B -> A = Succès
A -> C = Succès
C -> A = Succès
B -> C = Succès
C -> B = Succès
Chaque site est un segment routé derrière un commutateur L3 situé sur le site. Le commutateur L3 se connecte au convertisseur de média CPE du fournisseur, qui à son tour se connecte au réseau du fournisseur via la fibre. Le routage statique est utilisé entre les commutateurs L3.
*Site A* *Site B*
L3 Switch <-> CPE <--- Provider ---> CPE <-> L3 Switch
|
CPE
|
L3 Switch
*Site C*
Le fournisseur a effectué des tests de bout en bout des circuits des CPE et n'a signalé aucune perte. Cependant, je vois de nombreux ACK en double dans une capture de paquets sur les hôtes avant l'échec du transfert.
Si je supprime les commutateurs L3 de l'équation et connecte deux hôtes directement au périphérique CPE sur chaque site, le transfert de fichiers se termine avec succès.
Host A <-> CPE <--- Provider ---> CPE <-> Host B
Si je place des hôtes de chaque côté d'un commutateur L3, le routage interVLAN fonctionne sans accroc et le transfert de fichiers se termine avec succès.
Host A1 <-> L3 Switch <-> Host A2
Le problème ne semble se produire que lorsque les données traversent le fournisseur entre deux segments routés.
Host A <-> L3 Switch <-> CPE <--- Provider ---> CPE <-> L3 Switch <-> Host B
J'ai vérifié un certain nombre de choses - les statistiques d'interface sont propres (pas d'erreurs), l'utilisation du processeur et de la mémoire est faible, la vitesse et la correspondance duplex (client et CPE), les tables MAC et ARP sont correctes, etc.
Quel pourrait être le problème?
Mise à jour 1
Les captures de paquets des hôtes A et B se trouvent à l'URL suivante:
https://www.dropbox.com/sh/5m2yohgxieelo59/AADed-0EWOkdmFIe0qT45_uQa
Le problème est survenu à l'origine à l'aide de commutateurs Juniper EX3200 exécutant 12.3R6.6. J'ai par la suite rétrogradé les commutateurs à 11.4R6.6, mais cela n'a pas résolu le problème.
J'ai pu reproduire le problème à l'aide des commutateurs Juiper EX2200 exécutant 12.3R6.6 et 11.4R6.6. J'ai également pu répliquer le problème à l'aide des commutateurs Dell 6224 exécutant 3.3.11.2.
Actuellement, seul le CPE (ge-0/0/0) et un seul hôte (ge-0/0/1) sont connectés à un Juniper EX3200 sur chaque site. Lors du dépannage du problème, j'ai supprimé la configuration de tous les paramètres étrangers, donc la configuration est assez basique. La configuration est essentiellement la même à chacun, mais avec des adresses IP différentes. Ci-dessous, un extrait.
# show interfaces
ge-0/0/0 {
unit 0 {
family ethernet-switching {
port-mode access;
vlan {
members WAN;
}
}
}
}
ge-0/0/1 {
unit 0 {
family ethernet-switching {
port-mode access;
vlan {
members LAN;
}
}
}
}
vlan {
unit 10 {
description WAN;
family inet {
address 192.168.X.X/27;
}
}
unit 100 {
description LAN;
family inet {
targeted-broadcast;
address 172.X.X.1/22;
}
}
}
# show vlans
WAN {
vlan-id 10;
l3-interface vlan.10;
}
LAN {
vlan-id 100;
l3-interface vlan.100;
}
Update 2
Aujourd'hui, j'ai remarqué que si je scp un fichier du commutateur L3, Juniper EX3200, sur le site A vers le commutateur L3, Juniper EX3200, sur le site B, le transfert scp est également affecté par le problème.
Je trouve cela particulièrement intéressant car le transfert provient de l'interface orientée CPE sur le VLAN WAN, car si je jette un VLAN entre les sites affectés via les commutateurs EX3200, les transferts de fichiers commutés se terminent avec succès entre les hôtes des sites A et B.