Je suis novice, j'essaie de comprendre OLAP et j'ai quelques questions.
- Question 1: un cube OLAP peut-il stocker des médianes, des modes, des centiles?
- Question 2: Une requête MDX écrite par l'utilisateur peut-elle renvoyer un résumé des données de niveau ligne? (ex:% transactions> 100 $). Ou le concepteur de cube doit-il l'ajouter au cube?
- Question 3: Existe-t-il des produits OLAP qui proposent désormais des mécanismes d'accès aux données de niveau ligne? Lequel?
Notre service informatique recherche des commentaires sur le type de problèmes rencontrés avec un cube ROLAP MS Analsis Services particulier. Nous n'avons pas accès à la base de données relationnelle qui se trouve derrière et nous devons effectuer des calculs qui ne sont pas actuellement disponibles en tant que mesures dans le cube.
Laissez-moi voir si j'ai ce droit.
- Un cube peut fournir des statistiques sur les nombres, les moyennes, les proportions et les écarts-types.
- Si une statistique particulière n'a pas été prise en compte dans une mesure fournie par le concepteur de cube, pouvons-nous écrire une requête MDX pour l'obtenir? Ou doivent-ils modifier le cube afin de le pré-calculer à partir des données de niveau ligne?
- Un cube ne peut pas fournir de statistiques telles que les médianes, les modes ou les centiles, car ces statistiques ne s'agrègent pas correctement.
Je lis la grammaire graphique de Leland Wilkinson et dans son chapitre sur l'exploration de données et OLAP, dit-il
Ces [opérations de cube] fonctionnent bien avec des statistiques comme les nombres, les moyennes, les proportions et les écarts-types. Des agrégations simples sur des sous-classes peuvent être calculées en opérant sur des sommes, des sommes de carrés et d'autres termes qui sont combinés en fonctions linéaires pour produire des statistiques sommaires de base.
Ils ne fonctionnent pas correctement avec des statistiques comme la médiane, le mode et les centiles car l'agrégat de ces statistiques n'est pas la statistique de leurs agrégats. La médiane des médianes n'est pas la médiane de l'agrégat, par exemple.
Il ajoute:
Cependant, un modèle ROLAP plus sophistiqué a récemment vu le jour. Il est possible, grâce à plusieurs technologies, de donner aux algorithmes statistiques l'accès aux données brutes à travers le modèle relationnel en temps réel. Cette approche est plus prometteuse que les agrégations rigides offertes par des structures telles que les cubes de données.
Dans la forme la plus élégante de cette architecture, les applications peuvent demander des connexions à distance pour fournir des informations sur leurs méthodes de traitement des données et prendre les mesures appropriées en fonction des informations renvoyées. Sous cette forme, l'architecture des composants peut réaliser la véritable promesse de l'informatique distribuée: conception et exécution indépendantes du site, du système d'exploitation ou du langage.
Cela a été écrit vers 2005. Quelqu'un connaît-il des produits utilisant cette méthodologie pour permettre l'accès aux données au niveau des lignes?