Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données

3
Interprétation des résultats de spline
J'essaie d'adapter une spline pour un GLM à l'aide de R. Une fois que j'ai ajusté la spline, je veux pouvoir prendre mon modèle résultant et créer un fichier de modélisation dans un classeur Excel. Par exemple, supposons que j'ai un ensemble de données où y est une fonction aléatoire …
20 splines 


1
Quel est l'équivalent non paramétrique d'une ANOVA bidirectionnelle pouvant inclure des interactions?
Salut, j'essaie de trouver l'équivalent non paramétrique d'une ANOVA bidirectionnelle (conception 3x4) qui est capable d'inclure des interactions. D'après ma lecture de Zar 1984 "Analyse biostatistique", cela est possible en utilisant une méthode proposée par Scheirer, Ray et Hare (1976), cependant, selon d'autres articles en ligne, il a été déduit …


2
Conversion d'un modèle linéaire multivarié en régression multiple
La refonte d'un modèle de régression linéaire multivariée en régression linéaire multiple est-elle entièrement équivalente? Je ne parle pas simplement en cours d' exécution régressions distinctes.ttt J'ai lu ceci à quelques endroits (Bayesian Data Analysis - Gelman et al., Et Multivariate Old School - Marden) qu'un modèle linéaire multivarié peut …


3
Intervalle de confiance de RMSE
J'ai pris un échantillon de points de données d'une population. Chacun de ces points a une vraie valeur (connue de la vérité terrain) et une valeur estimée. Je calcule ensuite l'erreur pour chaque point échantillonné, puis calcule le RMSE de l'échantillon.nnn Comment puis-je déduire une sorte d'intervalle de confiance autour …

3
Apprentissage automatique pour prédire les probabilités de classe
Je recherche des classificateurs qui produisent des probabilités que les exemples appartiennent à l'une des deux classes. Je connais la régression logistique et les Bayes naïfs, mais pouvez-vous m'en parler d'autres qui fonctionnent de manière similaire? Autrement dit, les classificateurs qui prédisent non pas les classes auxquelles appartiennent les exemples, …

4
Calculer la moyenne de la variable ordinale
J'ai lu à plusieurs endroits que le calcul de la moyenne d'une variable ordinale est inapproprié. J'essaie de comprendre pourquoi cela pourrait être inapproprié. Je pense que c'est parce que, en général, une variable ordinale n'est pas normalement distribuée et donc le calcul de la moyenne donnera une représentation inexacte. …

4
Différence entre l'ANOVA et le test de Kruskal-Wallis
J'apprends le R et j'ai expérimenté l'analyse de la variance. J'ai couru les deux kruskal.test(depVar ~ indepVar, data=df) et anova(lm(depVar ~ indepVar, data=dF)) Y a-t-il une différence pratique entre ces deux tests? D'après ce que je comprends, ils évaluent tous deux l'hypothèse nulle selon laquelle les populations ont la même …

2
Comment utiliser les fonctions de validation croisée de scikit-learn sur les classificateurs multi-étiquettes
Je teste différents classificateurs sur un ensemble de données où il y a 5 classes et chaque instance peut appartenir à une ou plusieurs de ces classes, j'utilise donc spécifiquement les classificateurs multi-étiquettes de scikit-learn sklearn.multiclass.OneVsRestClassifier. Maintenant, je veux effectuer une validation croisée en utilisant le sklearn.cross_validation.StratifiedKFold. Cela produit l'erreur …

2
Quelle est l'hypothèse multiple dans l'apprentissage semi-supervisé?
J'essaie de comprendre ce que signifie l'hypothèse multiple dans l'apprentissage semi-supervisé. Quelqu'un peut-il expliquer de manière simple? Je ne peux pas obtenir l'intuition derrière cela. Il dit que vos données se trouvent sur un collecteur de faible dimension intégré dans un espace de dimension supérieure. Je n'ai pas compris ce …




En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.