Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données

2
Qui a d'abord utilisé / inventé les valeurs p?
J'essaie d'écrire une série de billets de blog sur les valeurs p et j'ai pensé qu'il serait intéressant de revenir là où tout a commencé - qui semble être le document de Pearson de 1900. Si vous êtes familier avec ce papier, vous vous souviendrez qu'il couvre les tests d'adéquation. …


2
Existe-t-il un intervalle de confiance non paramétrique fiable pour la moyenne d'une distribution asymétrique?
Des distributions très asymétriques telles que le log-normal n'entraînent pas des intervalles de confiance bootstrap précis. Voici un exemple montrant que les zones arrière gauche et droite sont loin de la valeur idéale de 0,025, quelle que soit la méthode d'amorçage que vous essayez dans R: require(boot) n <- 25 …



2
Apprentissage supervisé, apprentissage non supervisé et apprentissage par renforcement: principes de base du flux de travail
Enseignement supervisé 1) Un humain construit un classificateur basé sur des données d' entrée et de sortie 2) Ce classificateur est formé avec un ensemble de données de formation 3) Ce classificateur est testé avec un ensemble de données de test 4) Déploiement si le résultat est satisfaisant A utiliser …

2
Quelle est la différence entre la censure et la troncature?
Dans le livre Modèles et méthodes statistiques pour les données à vie , il est écrit: Censure: lorsqu'une observation est incomplète en raison d'une cause aléatoire. Troncature: lorsque la nature incomplète de l'observation est due à un processus de sélection systématique inhérent au plan d'étude. Qu'entend-on par «processus de sélection …


13
Quelle est l'intuition derrière la formule de probabilité conditionnelle?
La formule de la probabilité conditionnelle d' AA\text{A} happening étant donné que BB\text{B} est arrivé est la suivante : P(A | B)=P(A∩B)P(B).P(A | B)=P(A∩B)P(B). P\left(\text{A}~\middle|~\text{B}\right)=\frac{P\left(\text{A} \cap \text{B}\right)}{P\left(\text{B}\right)}. Mon manuel explique l'intuition derrière cela en termes de diagramme de Venn. Étant donné que BB\text{B} s'est produit, la seule façon pour AA\text{A} …





6
Si «la corrélation n'implique pas de causalité», alors si je trouve une corrélation statistiquement significative, comment puis-je prouver la causalité?
Je comprends que la corrélation n'est pas une causalité . Supposons que nous obtenions une forte corrélation entre deux variables. Comment vérifiez-vous si cette corrélation est réellement causale? Ou, dans quelles conditions, exactement, pouvons-nous utiliser des données expérimentales pour déduire une relation causale entre deux ou plusieurs variables?

7
Inférence vs estimation?
Quelles sont les différences entre "inférence" et "estimation" dans le contexte de l'apprentissage automatique ? En tant que débutant, je pense que nous déduisons des variables aléatoires et estimons les paramètres du modèle. Ma compréhension est-elle juste? Sinon, quelles sont exactement les différences et quand dois-je les utiliser? De plus, …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.