Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
Je suis à la recherche de ressources (tutoriels, manuels, webcast, etc.) pour en apprendre davantage sur la chaîne de Markov et les HMM. Mon expérience est en tant que biologiste et je suis actuellement impliqué dans un projet lié à la bioinformatique. En outre, quels sont les connaissances mathématiques nécessaires …
Je trouve les ressources comme le livre de recettes Probability and Statistics et la carte de référence R pour l'exploration de données extrêmement utiles. Ils servent évidemment de références, mais ils m'aident également à organiser mes réflexions sur un sujet et à comprendre le terrain. Q: Existe-t-il des ressources similaires …
En répondant à cette question sur des données discrètes et continues, j'ai clairement affirmé qu'il était rarement logique de traiter des données catégoriques comme continues. À première vue, cela semble aller de soi, mais l’intuition est souvent un mauvais guide pour les statistiques, ou du moins la mienne. Alors maintenant …
J'ai quelques questions sur la régression bayésienne: une régression standard telle que . Si je veux changer cela en une régression bayésienne, ai-je besoin de distributions antérieures à la fois pour et (ou cela ne fonctionne-t-il pas de cette façon)?y=β0+β1x+εy=β0+β1x+εy = \beta_0 + \beta_1 x + \varepsilonβ0β0\beta_0β1β1\beta_1 Dans la régression …
J'ai lu que l'utilisation d'échelles de notation lors de la création de graphiques est appropriée dans certaines circonstances, comme l'axe des ordonnées dans un graphique de séries chronologiques. Cependant, je n'ai pas été en mesure de trouver une explication définitive quant à la raison pour laquelle c'est le cas ou …
Dans quelles circonstances voudriez-vous ou ne voudriez-vous pas mettre à l'échelle ou normaliser une variable avant l'ajustement du modèle? Et quels sont les avantages / inconvénients de la mise à l'échelle d'une variable?
Selon l'article de Wikipedia sur l' estimation non biaisée de l'écart type, l'échantillon SD s=1n−1∑i=1n(xi−x¯¯¯)2−−−−−−−−−−−−−−−√s=1n−1∑i=1n(xi−x¯)2s = \sqrt{\frac{1}{n-1} \sum_{i=1}^n (x_i - \overline{x})^2} est un estimateur biaisé du SD de la population. Il est écrit que .E(s2−−√)≠E(s2)−−−−−√E(s2)≠E(s2)E(\sqrt{s^2}) \neq \sqrt{E(s^2)} NB Les variables aléatoires sont indépendantes et chaquexi∼N(μ,σ2)xi∼N(μ,σ2)x_{i} \sim N(\mu,\sigma^{2}) Ma question est …
J'espère que le titre est explicite. Dans Kaggle, la plupart des gagnants utilisent l’empilement avec parfois des centaines de modèles de base pour réduire au minimum quelques points de pourcentage de MSE, de précision ... En général, selon votre expérience, l’importance de la modélisation sophistiquée telle que l’empilement par rapport …
Première déclaration (S1): "Un décès sur 80 est causé par un accident de voiture." Deuxième déclaration (S2): "Une personne sur 80 meurt des suites d'un accident de voiture." Personnellement, je ne vois pas beaucoup de différence entre ces deux déclarations. En écrivant, je les considèrerais comme interchangeables pour un public …
Je continue à lire ceci et intuitivement je peux le voir, mais comment passer de la régularisation L2 à dire qu’il s’agit d’un Prior gaussien analytiquement? Il en va de même pour dire que L1 est équivalent à un précédent laplacien. Toute autre référence serait géniale.
La PCA et l’auto-encodeur peuvent tous deux réduire la démence. Quelle est la différence entre eux? Dans quelle situation devrais-je utiliser l'un plutôt que l'autre?
Je suis en train de prédire un résultat binaire en utilisant 50 variables continues explicatives (la gamme de la plupart des variables est à ∞ ). Mon ensemble de données contient près de 24 000 lignes. Quand je cours en R, je reçois:−∞−∞-\infty∞∞\inftyglm Warning messages: 1: glm.fit: algorithm did not …
Je me demandais s'il existait de bonnes bibliothèques R pour les réseaux de neurones d'apprentissage en profondeur? Je sais qu'il ya la nnet, neuralnetet RSNNS, mais aucun d' entre eux semblent mettre en œuvre des méthodes d'apprentissage en profondeur. Je suis particulièrement intéressé par les activités non supervisées suivies par …
J'ai trouvé des informations discordantes sur la question: " Si l'on construit un intervalle de confiance (IC) à 95% d'une différence de moyennes ou d'une différence de proportions, toutes les valeurs de l'IC sont-elles également probables? Ou bien, l'estimation ponctuelle est-elle la plus probable? , avec des valeurs proches des …
Il existe une certaine école de pensée selon laquelle l'approche la plus répandue du test statistique est un "hybride" entre deux approches: celle de Fisher et celle de Neyman-Pearson; La revendication affirme que ces deux approches sont "incompatibles" et que, par conséquent, "hybride" est un "méli-mélo incohérent". Je fournirai une …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.