Il existe de nombreuses références dans la littérature statistique aux " données fonctionnelles " (c'est-à-dire les données qui sont des courbes) et, en parallèle, aux " données de haute dimension " (c'est-à-dire lorsque les données sont des vecteurs de grande dimension). Ma question concerne la différence entre les deux types de données.
Lorsque l'on parle de méthodologies statistiques appliquées qui s'appliquent dans le cas 1, cela peut être compris comme une reformulation des méthodologies du cas 2 à travers une projection dans un sous-espace de dimension finie d'un espace de fonctions, il peut s'agir de polynomes, splines, ondelettes, Fourier, ... et traduira le problème fonctionnel en un problème vectoriel de dimension finie (car en mathématique appliquée, tout devient fini à un moment donné).
Ma question est: peut-on dire que toute procédure statistique qui s'applique aux données fonctionnelles peut également être appliquée (presque directement) aux données de grande dimension et que toute procédure dédiée aux données de grande dimension peut être (presque directement) appliquée aux données fonctionnelles?
Si la réponse est non, pouvez-vous illustrer?
MODIFIER / METTRE À JOUR à l'aide de la réponse de Simon Byrne:
- sparsity (hypothèse de S-clairsemée, ballon et faible ballon pour ) est utilisé comme une hypothèse structurale dans l' analyse statistique dimensionnelle élevée.
- la "douceur" est utilisée comme hypothèse structurelle dans l'analyse des données fonctionnelles.
D'un autre côté, la transformée de Fourier inverse et la transformée en ondelettes inverse transforment la rareté en douceur, et la douceur est transformée en rareté par ondelette et transformée de Fourier. Cela fait-il la différence critique mentionnée par Simon pas si critique?