Parce que est assez général, et le changement de similitude cosinus dépend des et et de leur relation avec , aucune formule définie n'est possible. Cependant, il existe des limites pratiquement calculables à combien la similitude cosinus peut changer . On peut les trouver en extrémisant l'angle entre et étant donné que la similitude en cosinus entre et est une valeur spécifiée, disons (où est l'angle entre et ). La réponse nous indique combien d'angleA B M M A M B A B cos ( 2 ϕ ) 2 ϕ A B 2 ϕ MMABMMAMBABcos(2ϕ)2ϕAB2ϕpeut éventuellement être courbé par la transformation .M
Les calculs menacent d'être désordonnés. Certains choix astucieux de notation, ainsi que quelques simplifications préliminaires, réduisent l'effort. Il s'avère que la solution en deux dimensions révèle tout ce que nous devons savoir. Il s'agit d'un problème traitable, dépendant uniquement d'une variable réelle , qui est facilement résolu en utilisant des techniques de calcul. Un simple argument géométrique étend cette solution à n'importe quel nombre de dimensions .nθn
Préliminaires mathématiques
Par définition, le cosinus de l'angle entre deux vecteurs et quelconques est obtenu en les normalisant à la longueur unitaire et en prenant leur produit. Donc,BAB
A′B(A′A)(B′B)−−−−−−−−−−√=cos(2ϕ)
et, en écrivant , le cosinus de l'angle entre les images de et sous la transformation estA B MΣ=M′MABM
( MA )′( MB )( ( MA )′( MA ) )( ( MB )′( MB ) )-----------------------√= A′Σ B( A′Σ A ) ( B′Σ B )------------√.(1)
Notez que seul compte dans l'analyse,Σ pas lui-même. Nous pouvons donc exploiter la décomposition en valeurs singulières (SVD) de pour simplifier le problème. Rappelons que cela exprime comme un produit (de droite à gauche) d'une matrice orthogonale , d'une matrice diagonale et d'une autre matrice orthogonale :M M V ′ D UMMMV′réU
M= UréV′.
En d'autres termes, il existe une base de vecteurs privilégiés (les colonnes de ) sur lesquels agit en redimensionnant chaque séparément par l' entrée diagonale de (que j'appellerai ) et ensuite appliquer une rotation (ou anti-rotation) au résultat. Cette rotation finale ne changera aucune longueur ou angle et ne devrait donc pas affecter . Vous pouvez le voir formellement avec le calcul V M e i i th D d i U Σe1, … , EnVMejejeeréréjeUΣ
Σ = M′M= ( UD V′)′( UD V′) = VD ( U′U) D V′=VD2V′.
Par conséquent, pour étudier nous pouvons remplacer librement par toute autre matrice qui produit les mêmes valeurs dans . En ordonnant le sorte que le diminue en taille (et en supposant que n'est pas identique à zéro), un bon choix de estM ( 1 ) e i d i M MΣM(1)eidiMM
M= 1ré1D V′.
Les éléments diagonaux de sont( 1 / j1) D
1 = d1/ d1≥ λ2= d2/ d1≥ λ3= d3/ d1≥ ⋯ ≥ λn= dn/ d1≥ 0.
Plus précisément, l'effet de (que ce soit dans sa forme originale ou modifiée) sur tous les angles est complètement déterminé par le fait queM
Meje= λjeeje.
Analyse d'un cas particulier
Soit . Parce que changer les longueurs des vecteurs ne change pas l'angle entre eux, nous pouvons supposer que et sont des vecteurs unitaires. Dans le plan, tous ces vecteurs peuvent être désignés par l'angle qu'ils font avec , ce qui nous permet d'écrireA B e 1n = 2UNEBe1
A = cos( θ - ϕ ) e1+ péché( θ - ϕ ) e2.
Donc
B=cos(θ+ϕ)e1+sin(θ+ϕ)e2.
(Voir la figure ci-dessous.)
L'application de est simple: elle fixe les premières coordonnées de et et multiplie leurs secondes coordonnées par . Par conséquent, l'angle de à estA B λ 2 M A M BMABλ2MAMB
f(θ)=arctan(λ2tan(θ+ϕ))−arctan(λ2tan(θ−ϕ)).
Parce que est une fonction continue, cette différence d'angles est une fonction continue de . En fait, c'est différentiable. Cela nous permet de trouver les angles extrêmes en inspectant les zéros de la dérivée . Cette dérivée est simple à calculer: c'est un rapport de fonctions trigonométriques. Les zéros ne peuvent apparaître que parmi les zéros de son numérateur, donc ne nous donnons pas la peine de calculer le dénominateur. On obtientθ f ′ ( θ )Mθf′(θ)
f′(θ)=λ2(1−λ2)(λ2+1)sin(2θ)sin(2ϕ)∗.
Les cas particuliers de , et sont faciles à comprendre: ils correspondent aux situations où est de rang réduit (et écrase donc tous les vecteurs sur une ligne); où est un multiple de la matrice d'identité; et où et sont parallèles (d'où l'angle entre eux ne peut pas changer, indépendamment de ). Le cas est exclu par la condition .λ 2 = 1 ϕ = 0 M M A B θ λ 2 = - 1 λ 2 ≥ 0λ2=0λ2=1ϕ=0MMABθλ2=−1λ2≥0
En dehors de ces cas particuliers, les zéros ne se produisent que lorsque : c'est-à-dire ou . Cela signifie que la ligne déterminée par bissecte l'angle . Nous savons maintenant que les valeurs extrêmes de l'angle entre et doivent se situer parmi les valeurs de , alors calculons-les:θ = 0 θ = π / 2 e 1 A B M A M B f ( θ )sin(2θ)=0θ=0θ=π/2e1ABMAMBf(θ)
f(0)f(π/2)=arctan(λ2tan(ϕ))−arctan(λ2tan(−ϕ))=2arctan(λ2tan(ϕ));=arctan(λ2tan(π/2+ϕ))−arctan(λ2tan(π/2−ϕ))=2arctan(λ2cot(−ϕ)).
Les cosinus correspondants sont
cos(f(0))=1−λ22tan(ϕ)21+λ22tan(ϕ)2(2)
et
cos(f(π/2))=1−λ22cot(ϕ)21+λ22cot(ϕ)2=tan(ϕ)2−λ22tan(ϕ)2+λ22.(3)
Souvent, il suffit de comprendre comment déforme les angles droits. Dans ce cas, , conduisant à , que vous pouvez brancher dans les formules précédentes.2 ϕ = π / 2 tan ( ϕ ) = lit bébé ( ϕ ) = 1M2ϕ=π/2tan(ϕ)=cot(ϕ)=1
Notez que plus devient petit , plus ces angles deviennent extrêmes et plus la distorsion est grande.λ2
Cette figure montre quatre configurations des vecteurs et séparés par un angle de . Le cercle unitaire et son image elliptique sous sont ombrés pour référence (avec l'action de uniformément redimensionnée pour faire ). Les en- têtes des figures indiquent la valeur de , le point médian de et . Le plus proche de ces et peut se produire lorsqu'il est transformé par est une configuration comme celle de gauche avecB 2 ϕ = π / 3 M M λ 1 = 1 θ A B A B M θ = 0 θ = π / 2AB2ϕ=π/3MMλ1=1θABABMθ=0. Le plus éloigné possible est une configuration comme celle de droite avec . Deux possibilités intermédiaires sont présentées.θ=π/2
Solution pour toutes les dimensions
Nous avons vu comment agit en développant chaque dimension d'un facteur . Cela déformera la sphère unitaire en un ellipsoïde. Les déterminent ses axes principaux. Les sont les distances de l'origine, le long de ces axes, à l'ellipsoïde. Par conséquent, la plus petite, , est la distance la plus courte (dans toutes les directions) de l'origine à l'ellipsoïde et la plus grande, , est la distance la plus éloignée (dans toutes les directions) de l'origine à l'ellipsoïde.i λ i { AMiλie i λ i λ n λ 1{A|A′A=1}eiλiλnλ1
Dans les dimensions supérieures , et font partie d'un sous-espace bidimensionnel. cartographie le cercle unitaire de ce sous-espace à l'intersection de l'ellipsoïde avec un plan contenant et . Cette intersection, étant une distorsion linéaire d'un cercle, est une ellipse. Évidemment, la distance la plus éloignée de cette ellipse n'est pas supérieure à et la distance la plus courte n'est pas inférieure à .A B M M A M B λ 1 = 1 λ nn>2ABMMAMBλ1=1λn
Comme nous l'avons observé à la fin de la section précédente, la possibilité la plus extrême est lorsque et sont situés dans un plan contenant deux des pour lesquels le rapport des correspondants est aussi petit que possible. Cela se produira dans le plan . Nous avons déjà la solution pour ce cas.B e i λ i e 1 , e nABeiλie1,en
Conclusions
Les extrêmes de similitude cosinus atteignables en appliquant à deux vecteurs ayant une similitude cosinus sont donnés par et . Ils sont atteints en situant et à angles égaux dans une direction dans laquelle allonge au maximum tout vecteur (comme la direction ) et en les séparant dans une direction dans laquelle allonge au minimum tout vecteur ( comme la direction ).M( 2 ) ( 3 ) A B Σ = M ′ M e 1 Σ e ncos(2ϕ)(2)(3)ABΣ=M′Me1Σen
Ces extrêmes peuvent être calculées en fonction de la SVD de .M