Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
Je suis très nouveau avec R et les statistiques en général, mais je dois faire un nuage de points qui, je pense, pourrait dépasser ses capacités natives. J'ai quelques vecteurs d'observations et je veux faire un nuage de points avec eux, et chaque paire appartient à une catégorie sur trois. …
J'y pense d'un point de vue des exigences minimales et très basiques. Quelles sont les théories clés qu'un statisticien de l'industrie (et non universitaire) devrait connaître, comprendre et utiliser régulièrement? Un grand qui vient à l'esprit est la loi des grands nombres . Quels sont les plus essentiels pour appliquer …
La version tl; dr Quelles stratégies réussies utilisez-vous pour enseigner la distribution d'échantillonnage (d'une moyenne d'échantillon, par exemple) au niveau de l'introduction au premier cycle? L'arrière-plan En septembre, j'enseignerai un cours d'introduction aux statistiques pour les étudiants de deuxième année en sciences sociales (principalement les sciences politiques et la sociologie) …
J'ai appris qu'une statistique est un attribut que vous pouvez obtenir à partir d'échantillons.En prenant de nombreux échantillons de même taille, en calculant cet attribut pour chacun d'eux et en traçant le pdf, nous obtenons la distribution de l'attribut correspondant ou la distribution des statistiques correspondantes. J'ai aussi entendu dire …
J'ai une tâche de classification où j'ai un certain nombre de prédicteurs (dont l'un est le plus informatif), et j'utilise le modèle MARS pour construire mon classificateur (je suis intéressé par n'importe quel modèle simple, et utiliser glms à des fins d'illustration serait bien aussi). Maintenant, j'ai un énorme déséquilibre …
Je suis tombé sur ce joli tutoriel: Un manuel d'analyses statistiques utilisant R. Chapitre 13. Analyse en composantes principales: L'heptathlon olympique sur la façon de faire l'APC en langage R. Je ne comprends pas l'interprétation de la figure 13.3: Je trace donc le premier vecteur propre contre le deuxième vecteur …
C'est une question élémentaire, mais je n'ai pas pu trouver la réponse. J'ai deux mesures: n1 événements au temps t1 et n2 événements au temps t2, tous deux produits (disons) par des processus de Poisson avec des valeurs lambda éventuellement différentes. Il s'agit en fait d'un article de presse, qui …
J'essaye d'obtenir jusqu'à la vitesse avec R. Je veux finalement utiliser les bibliothèques R pour faire la classification de texte. Je me demandais simplement quelles sont les expériences des gens en ce qui concerne l'évolutivité de R quand il s'agit de faire une classification de texte. Je suis susceptible de …
La probabilité pourrait être définie de plusieurs façons, par exemple: la fonction de qui mappe à ie .LLLΘ×XΘ×X\Theta\times{\cal X}(θ,x)(θ,x)(\theta,x)L(θ∣x)L(θ∣x)L(\theta \mid x)L:Θ×X→RL:Θ×X→RL:\Theta\times{\cal X} \rightarrow \mathbb{R} la fonction aléatoireL(⋅∣X)L(⋅∣X)L(\cdot \mid X) on pourrait aussi considérer que la vraisemblance n'est que la vraisemblance "observée"L(⋅∣xobs)L(⋅∣xobs)L(\cdot \mid x^{\text{obs}}) en pratique, la vraisemblance n'apporte des informations …
Existe-t-il un modèle de visualisation permettant de montrer le chevauchement d'intersections de nombreux ensembles? Je pense à quelque chose comme les diagrammes de Venn, mais cela pourrait se prêter d'une manière ou d'une autre à un plus grand nombre d'ensembles tels que 10 ou plus. Wikipédia montre des diagrammes Venn …
J'ai utilisé le code r suivant pour estimer les intervalles de confiance d'une proportion binomiale parce que je comprends que cela se substitue à un "calcul de puissance" lors de la conception de récepteurs fonctionnant avec des courbes caractéristiques en vue de détecter des maladies dans une population. n est …
Quelle est la différence entre le test de normalité de Shapiro-Wilk et le test de normalité de Kolmogorov-Smirnov? Quand les résultats de ces deux méthodes seront-ils différents?
Si je comprends bien, un intervalle de confiance d'un paramètre est un intervalle construit par une méthode qui donne des intervalles contenant la vraie valeur pour une proportion spécifiée d'échantillons. La «confiance» concerne donc la méthode plutôt que l'intervalle que je calcule à partir d'un échantillon particulier. En tant qu'utilisateur …
Quelle différence le centrage (ou la dé-signification) de vos données fait-il pour l'ACP? J'ai entendu dire que cela rend les calculs plus faciles ou qu'elle empêche le premier PC d'être dominé par les moyens des variables, mais j'ai l'impression que je n'ai pas encore pu saisir fermement le concept. Par …
Je passe en revue les notes de cours d'Andrew Ng sur l'apprentissage automatique. Les notes nous initient à la régression logistique puis au perceptron. Tout en décrivant Perceptron, les notes disent que nous venons de changer la définition de la fonction de seuil utilisée pour la régression logistique. Après cela, …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.