Donc, je lisais le document sur SURF (Bay, Ess, Tuytelaars, Van Gool: Speeded-Up Robust Features (SURF) ) et je ne peux pas comprendre ce paragraphe ci-dessous:
En raison de l'utilisation de filtres rectangulaires et d'images intégrales, nous n'avons pas à appliquer de manière itérative le même filtre à la sortie d'un calque précédemment filtré, mais à la place, nous pouvons appliquer des filtres rectangulaires de n'importe quelle taille à exactement la même vitesse directement sur l'image d'origine et même en parallèle (bien que ce dernier ne soit pas exploité ici). Par conséquent, l'espace d'échelle est analysé en augmentant la taille du filtre plutôt qu'en réduisant de manière itérative la taille de l'image, figure 4.
This is figure 4 in question.
PS: Le papier a une explication de l'image intégrale, cependant tout le contenu du papier est basé sur le paragraphe particulier ci-dessus. Si quelqu'un a lu ce document, pouvez-vous brièvement mentionner ce qui se passe ici. Toute l'explication mathématique est assez complexe pour avoir une bonne compréhension d'abord, j'ai donc besoin d'aide. Merci.
Modifier, quelques problèmes:
1.
Chaque octave est subdivisée en un nombre constant de niveaux d'échelle. En raison de la nature discrète des images intégrales, la différence d'échelle minimale entre 2 échelles suivantes dépend de la longueur lo des lobes positifs ou négatifs de la dérivée partielle du second ordre dans la direction de dérivation (x ou y), qui est définie sur un tiers de la longueur de la taille du filtre. Pour le filtre 9x9, cette longueur lo est 3. Pour deux niveaux successifs, il faut augmenter cette taille d'un minimum de 2 pixels (un pixel de chaque côté) afin de garder la taille inégale et ainsi assurer la présence du pixel central . Il en résulte une augmentation totale de la taille du masque de 6 pixels (voir figure 5).
Figure 5
Je ne pouvais pas donner un sens aux lignes dans le contexte donné.
Pour deux niveaux successifs, il faut augmenter cette taille d'un minimum de 2 pixels (un pixel de chaque côté) afin de garder la taille inégale et ainsi assurer la présence du pixel central.
Je sais qu'ils essaient de faire quelque chose avec la longueur de l'image, si c'est même ils essaient de la rendre étrange, de sorte qu'il y ait un pixel central qui leur permettra de calculer le maximum ou le minimum du gradient de pixels. Je suis un peu incertain quant à sa signification contextuelle.
2.
Afin de calculer le descripteur, l'ondelette Haar est utilisée.
Comment la région du milieu a-t-elle un faible mais un.
3.
Quelle est la nécessité d'avoir un filtre approximatif?
4. Je n'ai aucun problème avec la façon dont ils ont découvert la taille du filtre. Ils ont "fait" quelque chose empiriquement. Cependant, j'ai un problème persistant avec ce morceau de ligne
La sortie du filtre 9x9, introduite dans la section précédente, est considérée comme la couche d'échelle initiale, à laquelle nous ferons référence comme échelle s = 1,2 (approximation des dérivées gaussiennes avec σ = 1,2).
Comment ont-ils découvert la valeur de σ. De plus, comment se fait le calcul de la mise à l'échelle montré dans l'image ci-dessous.La raison pour laquelle je dis à propos de cette image est que la valeur de s=1.2
continue à se reproduire, sans indiquer clairement son origine.
5.
La matrice de Hesse représentée en termes de L
laquelle est la convolution du gradient de second ordre du filtre gaussien et de l'image.
Cependant, le déterminant "approximé" ne contiendrait que des termes impliquant un filtre gaussien du second ordre.
La valeur de w
est:
Ma question pourquoi le déterminant est calculé comme celui ci-dessus, et quelle est la relation entre la matrice de Hesse et la matrice de Hesse approximative.