Actuellement, je compare deux ensembles de données, qui contiennent des StoreKey/ProductKeycombinaisons uniques .
Le premier ensemble de données contient les StoreKey/ProductKeycombinaisons uniques de ventes entre début janvier 2012 et fin mai 2014 (résultat = 450 000 lignes). Le deuxième ensemble de données a les StoreKey/ProductKeycombinaisons uniques , pour des ventes débutant juin 2014, jusqu'à aujourd'hui (résultat = 190K lignes).
Je cherche les StoreKey/ProductKeycombinaisons qui se trouvent dans le 2ème set, mais pas dans le 1er set - c'est-à-dire les nouveaux produits vendus à partir de début juin.
Jusqu'à présent, j'ai vidé les deux ensembles de données dans des tables temporaires, créé des index pour les deux tables sur les deux clés et utilisé l' EXCEPTinstruction pour trouver des éléments uniques.
Quelle est la manière la plus efficace de comparer des ensembles de données aussi volumineux? Existe-t-il un moyen plus efficace de faire ce type de comparaison à grande échelle?