Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
Comment puis-je générer manuellement un nombre aléatoire à partir d'une distribution donnée, comme par exemple, 10 réalisations à partir de la distribution normale standard?
J'espère que quelqu'un pourra fournir un aperçu intuitif de ce qu'est la distribution quasi-binomiale et de ce qu'elle fait. Je suis particulièrement intéressé par ces points: En quoi le quasibinôme diffère de la distribution binomiale. Lorsque la variable de réponse est une proportion (les valeurs d'exemple incluent 0,23, 0,11, 0,78, …
J'espère que c'est une question à laquelle quelqu'un ici peut répondre pour moi sur la nature de la décomposition des sommes de carrés à partir d'un modèle à effets mixtes lmer(à partir du package lme4 R). Tout d'abord, je dois dire que je suis conscient de la controverse liée à …
Je me demandais si quelqu'un pouvait m'éclairer sur les différences actuelles entre ces deux fonctions. J'ai trouvé la question suivante: Comment choisir la bibliothèque nlme ou lme4 R pour les modèles d'effets mixtes? , mais cela remonte à quelques années. C'est toute une vie dans les cercles logiciels. Mes questions …
J'essaie de mettre en place un programme de mathématiques autogéré pour préparer l'apprentissage du data mining et du machine learning. Cela est motivé par le démarrage du cours d'apprentissage automatique d'Andrew Ng sur Coursera et le sentiment qu'avant de continuer, je devais améliorer mes compétences en mathématiques. J'ai obtenu mon …
Je me demande s'il existe un test statistique pour "tester" la signification d'une distribution bimodale. Je veux dire, dans quelle mesure mes données correspondent à la distribution bimodale ou non? Si oui, y a-t-il un test dans le programme R?
Soit B(n,p,r)B(n,p,r)B(n,p,r) la fonction de distribution binomiale (DF) avec les paramètres n∈Nn∈Nn \in \mathbb N et p∈(0,1)p∈(0,1)p \in (0,1) évalués à r∈{0,1,…,n}r∈{0,1,…,n}r \in \{0,1,\ldots,n\} : et soit dénotons le Poisson DF avec le paramètre évalué à r \ in \ {0,1,2, \ ldots \} : F(ν,r)a∈R+r∈{0,1,2,…}F(a,r)=e-ar ∑ i=0ajeB(n,p,r)=∑i=0r(ni)pi(1−p)n−i,B(n,p,r)=∑i=0r(ni)pi(1−p)n−i,\begin{equation} B(n,p,r) = …
Je suis confus au sujet du modèle de correction d'erreur vectorielle ( VECM ). Contexte technique: VECM offre la possibilité d'appliquer le modèle vectoriel autorégressif ( VAR ) à des séries temporelles multivariées intégrées. Dans les manuels, ils citent certains problèmes d'application d'un VAR aux séries chronologiques intégrées, dont le …
Je travaille avec un grand ensemble de données (confidentiel, donc je ne peux pas trop en partager), et suis arrivé à la conclusion qu'une régression binomiale négative serait nécessaire. Je n'ai jamais fait de régression glm auparavant et je ne trouve aucune information claire sur les hypothèses. Sont-ils les mêmes …
J'ai un grand ensemble de données et je veux effectuer une réduction de dimensionnalité. Maintenant, partout où je lis, je peux utiliser PCA pour cela. Cependant, je ne semble toujours pas savoir quoi faire après le calcul / l'exécution de l'ACP. Dans R, cela se fait facilement avec la commande …
Plusieurs fois, j'ai rencontré des avertissements informels contre "l'espionnage des données" (voici un exemple amusant ), et je pense avoir une idée intuitive de ce que cela signifie, et pourquoi cela peut être un problème. D'un autre côté, l '"analyse exploratoire des données" semble être une procédure parfaitement respectable en …
J'ai beaucoup de chaînes d'adresse: 1600 Pennsylvania Ave, Washington, DC 20500 USA Je veux les analyser dans leurs composants: street: 1600 Pennsylvania Ave city: Washington province: DC postcode: 20500 country: USA Mais bien sûr, les données sont sales: elles proviennent de nombreux pays dans de nombreuses langues, écrites de différentes …
Donné un ensemble de données avec des instances avec classes où chaque instance appartient exactement à une classe N x i y iXjeXjex_iNNNXjeXjex_iyjeyjey_i un classificateur multiclasse Après la formation et les tests, j'ai essentiellement une table avec la vraie classe et la classe prédite pour chaque instance dans l'ensemble de …
J'ai un manuscrit sur une méthode bootstrap pour tester les hypothèses d'une moyenne, et je voudrais l'envoyer pour publication, mais j'ai un dilemme moral. J'ai signé la protestation contre Elsevier pour ses pratiques commerciales contraires à l'éthique, et la lecture de toute la question m'a vraiment fait remettre en question …
J'utilise R, je cherchai sur Google et appris que kpss.test(), PP.test()et adf.test()sont utilisées pour savoir sur stationnarité des séries chronologiques. Mais je ne suis pas un statisticien, qui peut interpréter leurs résultats > PP.test(x) Phillips-Perron Unit Root Test data: x Dickey-Fuller = -30.649, Truncation lag parameter = 7, p-value = …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.