Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données

3
Diagnostic pour la régression logistique?
Pour la régression linéaire, nous pouvons vérifier les tracés de diagnostic (tracés de résidus, tracés QQ normaux, etc.) pour vérifier si les hypothèses de régression linéaire sont violées. Pour la régression logistique, j'ai du mal à trouver des ressources qui expliquent comment diagnostiquer l'ajustement du modèle de régression logistique. En …

29
Exemples d'enseignement: corrélation ne signifie pas causalité
Il existe un vieil adage: "Corrélation ne signifie pas causalité". Quand j'enseigne, j'ai tendance à utiliser les exemples standard suivants pour illustrer ce point: nombre de cigognes et taux de natalité au Danemark; nombre de prêtres en Amérique et alcoolisme; au début du XXe siècle, il existait une forte corrélation …

6
Pourquoi utiliser la descente sur gradient pour la régression linéaire, lorsqu'une solution mathématique de forme fermée est disponible?
Je suis les cours d'apprentissage automatique en ligne et j'ai appris comment utiliser Gradient Descent pour calculer les valeurs optimales de l'hypothèse. h(x) = B0 + B1X pourquoi nous devons utiliser Gradient Descent si nous pouvons facilement trouver les valeurs avec la formule ci-dessous? Cela semble simple et facile aussi. …

5
Qu'est-ce que la régularisation en anglais simplifié?
Contrairement à d'autres articles, j'ai trouvé l' entrée de Wikipédia sur ce sujet illisible pour une personne non mathématique (comme moi). J'ai compris l'idée de base, à savoir que vous favorisiez les modèles avec moins de règles. Ce que je ne comprends pas, c'est comment passer d'un ensemble de règles …


4
Un journal de psychologie interdit les valeurs prédictives et les intervalles de confiance; est-il vraiment sage de cesser de les utiliser?
Le 25 février 2015, la revue Basic and Applied Social Psychology a publié un éditorial interdisant les valeurs et les intervalles de confiance de tous les articles à venir.ppp Plus précisément, ils disent (le formatage et l’accent sont les miens): [...] avant la publication, les auteurs devront supprimer tous les …


6
Modèle de prévision du nombre de vues Youtube de Gangnam Style
Le clip vidéo de PSY "Gangnam style" est populaire. Après un peu plus de deux mois, il compte environ 540 millions de téléspectateurs. La semaine dernière, j’ai appris cela de la part de mes enfants d’âge prés au dîner et la discussion s’est vite engagée sur le point de savoir …
73 modeling  web 




6
Choisir une méthode de clustering
Lorsque vous utilisez l'analyse par grappes sur un ensemble de données pour regrouper des cas similaires, vous devez choisir parmi un grand nombre de méthodes de regroupement et de mesures de distance. Parfois, un choix peut influencer l’autre, mais il existe de nombreuses combinaisons de méthodes possibles. Quelqu'un at-il des …


6
Existe-t-il une bonne raison d'utiliser PCA au lieu de EFA? En outre, l’ACP peut-elle remplacer l’analyse factorielle?
Dans certaines disciplines, l’ACP (analyse en composantes principales) est systématiquement utilisée sans justification, et APC et EFA (analyse factorielle exploratoire) sont considérées comme des synonymes. J'ai donc récemment utilisé PCA pour analyser les résultats d'une étude de validation d'échelle (21 items sur une échelle de Likert en 7 points, supposée …


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.