Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données


8
Un livre à lire avant Elements of Statistical Learning?
Sur la base de cet article , je souhaite digérer des éléments d’apprentissage statistique. Heureusement, il est disponible gratuitement et j'ai commencé à le lire. Je n'ai pas assez de connaissances pour le comprendre. Pouvez-vous recommander un livre qui constitue une meilleure introduction aux sujets abordés? Si tout va bien …

6
Est une régression de crête inutile dans les dimensions élevées (
Considérons un bon vieux problème de régression avec prédicteurs et taille d’échantillon . La sagesse habituelle est que l’estimateur OLS va sur-adapter et sera généralement surperformé par l’estimateur de régression de crête:Il est standard d’utiliser la validation croisée pour trouver un paramètre de régularisation optimal . Ici, j'utilise un CV …






2
Existe-t-il une différence entre "contrôler pour" et "ignorer" d'autres variables dans la régression multiple?
Le coefficient d'une variable explicative dans une régression multiple nous indique la relation de cette variable explicative avec la variable dépendante. Tout cela, tout en "contrôlant" les autres variables explicatives. Comment je l'ai vu jusqu'à présent: Lors du calcul de chaque coefficient, les autres variables ne sont pas prises en …

3
Quelle est l'intuition derrière SVD?
J'ai lu sur la décomposition en valeurs singulières (SVD). Dans presque tous les manuels, il est mentionné que la matrice est divisée en trois matrices avec une spécification donnée. Mais quelle est l'intuition derrière la division de la matrice sous une telle forme? La PCA et d’autres algorithmes de réduction …


1
Obtention des valeurs prédites (Y = 1 ou 0) à partir d’un ajustement de modèle de régression logistique
Supposons que j'ai un objet de classe glm(correspondant à un modèle de régression logistique) et j'aimerais transformer les probabilités prédites données en predict.glmutilisant l'argument type="response"en réponses binaires, c'est-à-dire ou Y = 0 . Quel est le moyen le plus rapide et le plus canonique de faire cela en R?Y=1Y=1Y=1Y=0Y=0Y=0 Bien …


4
Pourquoi s'embêter avec le double problème lors de l'installation de SVM?
Étant donné les points de données et les étiquettes , le problème principal de la marge absolue SVM esty 1 , … , y n ∈ { - 1 , 1 }x1,…,xn∈Rdx1,…,xn∈Rdx_1, \ldots, x_n \in \mathbb{R}^dy1,…,yn∈{−1,1}y1,…,yn∈{−1,1}y_1, \ldots, y_n \in \left \{-1, 1 \right\} s.t.minimizew,w012wTwminimizew,w012wTw \text{minimize}_{w, w_0} \quad \frac{1}{2} w^T w …
50 svm 

16
Livres recommandés sur la conception d'expériences?
Quelles sont les recommandations du panel pour les livres sur la conception d'expériences? Idéalement, les livres devraient être encore imprimés ou disponibles en version électronique, bien que cela ne soit pas toujours réalisable. Si vous vous sentez ému d'ajouter quelques mots sur ce qui est si bon dans le livre, …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.