Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données

11
Podcasts statistiques
Quels sont les podcasts liés à l'analyse statistique? J'ai trouvé des enregistrements audio de conférences universitaires sur ITunes U, mais je ne connais aucun podcast statistique. La chose la plus proche que je connaisse est un podcast de recherche opérationnelle The Science of Better . Il touche à des problèmes …
29 references 




6
Procédure de sélection variable pour la classification binaire
Quelle est la sélection de variable / caractéristique que vous préférez pour la classification binaire quand il y a beaucoup plus de variables / caractéristique que d'observations dans l'ensemble d'apprentissage? Le but ici est de discuter de la procédure de sélection des caractéristiques qui réduit le mieux l'erreur de classification. …

3
Comment effectuer une régression orthogonale (total des moindres carrés) via l'ACP?
J'utilise toujours lm()en R pour effectuer une régression linéaire de sur . Cette fonction renvoie un coefficient tel queyyyxxxββ\betay=βx.y=βx.y = \beta x. Aujourd'hui, j'ai appris le nombre total de moindres carrés et cette princomp()fonction (analyse en composantes principales, ACP) peut être utilisée pour l'exécuter. Cela devrait être bon pour moi …

6
Test de variance finie?
Est-il possible de tester la finitude (ou l'existence) de la variance d'une variable aléatoire dans un échantillon? En tant que valeur nulle, soit {la variance existe et est finie} soit {la variance n'existe pas / est infinie} serait acceptable. Sur le plan philosophique (et sur le plan du calcul), cela …

1
Quels sont les défauts de l'erreur moyenne absolue en pourcentage (MAPE)?
L' erreur moyenne absolue en pourcentage ( mape ) est une précision ou une mesure d'erreur courante pour les séries chronologiques ou d'autres prévisions, MAPE = 100n∑t = 1n| UNEt- Ft|UNEt% ,MAPE=100n∑t=1n|At−Ft|At%, \text{MAPE} = \frac{100}{n}\sum_{t=1}^n\frac{|A_t-F_t|}{A_t}\%, où sont des réels et des prévisions ou prédictions correspondantes.F tUNEtAtA_tFtFtF_t Le MAPE est un …
29 accuracy  mape 

3
Qu'est-ce qu'un collecteur?
Dans les techniques de réduction de dimensionnalité telles que l'analyse en composantes principales, LDA, etc., le terme collecteur est souvent utilisé. Qu'est-ce qu'une variété en termes non techniques? Si un point Xxx appartient à une sphère dont je veux réduire la dimension, et s'il y a un bruit yyy et …

1
Intervalle de prédiction de bootstrap
Existe-t-il une technique de bootstrap pour calculer les intervalles de prédiction pour les prédictions ponctuelles obtenues par exemple à partir d'une régression linéaire ou d'une autre méthode de régression (k-plus proche voisin, arbres de régression, etc.)? D'une certaine manière, je pense que la manière parfois proposée de simplement lancer la …

4
Interprétation du pseudo-R2 de McFadden
J'ai un modèle de régression logistique binaire avec un pseudo-R de McFadden de 0,192 avec une variable dépendante appelée paiement (1 = paiement et 0 = pas de paiement). Quelle est l'interprétation de ce pseudo R au carré? S'agit-il d'une comparaison relative pour les modèles imbriqués (par exemple, un modèle …

2
Pourquoi utiliser la validation croisée stratifiée? Pourquoi cela n'endommage-t-il pas les avantages liés à la variance?
On m'a dit qu'il est avantageux d'utiliser la validation croisée stratifiée, en particulier lorsque les classes de réponse sont déséquilibrées. Si l'un des objectifs de la validation croisée est d'aider à rendre compte du caractère aléatoire de notre échantillon de données de formation d'origine, faire en sorte que chaque pli …




En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.