Statistiques et Big Data

11

Ressources pour apprendre la chaîne de Markov et les modèles de Markov cachés

Je suis à la recherche de ressources (tutoriels, manuels, webcast, etc.) pour en apprendre davantage sur la chaîne de Markov et les HMM. Mon expérience est en tant que biologiste et je suis actuellement impliqué dans un projet lié à la bioinformatique. En outre, quels sont les connaissances mathématiques nécessaires …

57 references markov-process hidden-markov-model bioinformatics

17

Livre de recettes / carte de référence / aide-mémoire d'apprentissage automatique?

Je trouve les ressources comme le livre de recettes Probability and Statistics et la carte de référence R pour l'exploration de données extrêmement utiles. Ils servent évidemment de références, mais ils m'aident également à organiser mes réflexions sur un sujet et à comprendre le terrain. Q: Existe-t-il des ressources similaires …

57 machine-learning references

8

Est-il utile de traiter les données catégoriques de manière continue?

En répondant à cette question sur des données discrètes et continues, j'ai clairement affirmé qu'il était rarement logique de traiter des données catégoriques comme continues. À première vue, cela semble aller de soi, mais l’intuition est souvent un mauvais guide pour les statistiques, ou du moins la mienne. Alors maintenant …

57 categorical-data data-transformation ordinal-data continuous-data

2

Régression de Bayes: comment cela se fait-il par rapport à la régression standard?

J'ai quelques questions sur la régression bayésienne: une régression standard telle que . Si je veux changer cela en une régression bayésienne, ai-je besoin de distributions antérieures à la fois pour et (ou cela ne fonctionne-t-il pas de cette façon)?y=β0+β1x+εy=β0+β1x+εy = \beta_0 + \beta_1 x + \varepsilonβ0β0\beta_0β1β1\beta_1 Dans la régression …

57 regression bayesian

3

Quand les échelles de log sont-elles appropriées?

J'ai lu que l'utilisation d'échelles de notation lors de la création de graphiques est appropriée dans certaines circonstances, comme l'axe des ordonnées dans un graphique de séries chronologiques. Cependant, je n'ai pas été en mesure de trouver une explication définitive quant à la raison pour laquelle c'est le cas ou …

57 data-visualization data-transformation

3

Les variables sont souvent ajustées (par exemple normalisées) avant de créer un modèle - quand est-ce une bonne idée et quand est-ce une mauvaise?

Dans quelles circonstances voudriez-vous ou ne voudriez-vous pas mettre à l'échelle ou normaliser une variable avant l'ajustement du modèle? Et quels sont les avantages / inconvénients de la mise à l'échelle d'une variable?

57 modeling predictive-models feature-selection theory standardization

3

Pourquoi l'écart type de l'échantillon est-il un estimateur biaisé de ?

Selon l'article de Wikipedia sur l' estimation non biaisée de l'écart type, l'échantillon SD s=1n−1∑i=1n(xi−x¯¯¯)2−−−−−−−−−−−−−−−√s=1n−1∑i=1n(xi−x¯)2s = \sqrt{\frac{1}{n-1} \sum_{i=1}^n (x_i - \overline{x})^2} est un estimateur biaisé du SD de la population. Il est écrit que .E(s2−−√)≠E(s2)−−−−−√E(s2)≠E(s2)E(\sqrt{s^2}) \neq \sqrt{E(s^2)} NB Les variables aléatoires sont indépendantes et chaquexi∼N(μ,σ2)xi∼N(μ,σ2)x_{i} \sim N(\mu,\sigma^{2}) Ma question est …

57 estimation standard-deviation

7

Défis industrie vs Kaggle. Est-ce que collecter plus d'observations et avoir accès à plus de variables est plus important que la modélisation de fantaisie?

J'espère que le titre est explicite. Dans Kaggle, la plupart des gagnants utilisent l’empilement avec parfois des centaines de modèles de base pour réduire au minimum quelques points de pourcentage de MSE, de précision ... En général, selon votre expérience, l’importance de la modélisation sophistiquée telle que l’empilement par rapport …

56 large-data stacking collecting-data kaggle

9

Est-il erroné de reformuler «1 décès sur 80 est dû à un accident de voiture» car «1 personne sur 80 meurt des suites d'un accident de voiture?

Première déclaration (S1): "Un décès sur 80 est causé par un accident de voiture." Deuxième déclaration (S2): "Une personne sur 80 meurt des suites d'un accident de voiture." Personnellement, je ne vois pas beaucoup de différence entre ces deux déclarations. En écrivant, je les considèrerais comme interchangeables pour un public …

56 interpretation risk

6

La régularisation L2 est équivalente au Prior Gaussien

Je continue à lire ceci et intuitivement je peux le voir, mais comment passer de la régularisation L2 à dire qu’il s’agit d’un Prior gaussien analytiquement? Il en va de même pour dire que L1 est équivalent à un précédent laplacien. Toute autre référence serait géniale.

56 regression references regularization

4

Quelles sont les différences entre PCA et autoencoder?

La PCA et l’auto-encodeur peuvent tous deux réduire la démence. Quelle est la différence entre eux? Dans quelle situation devrais-je utiliser l'un plutôt que l'autre?

56 machine-learning pca neural-networks autoencoders

1

La régression logistique en R a conduit à une séparation parfaite (phénomène de Hauck-Donner). Maintenant quoi?

Je suis en train de prédire un résultat binaire en utilisant 50 variables continues explicatives (la gamme de la plupart des variables est à ∞ ). Mon ensemble de données contient près de 24 000 lignes. Quand je cours en R, je reçois:−∞−∞-\infty∞∞\inftyglm Warning messages: 1: glm.fit: algorithm did not …

56 r regression logistic separation

8

R bibliothèques pour l'apprentissage en profondeur

Je me demandais s'il existait de bonnes bibliothèques R pour les réseaux de neurones d'apprentissage en profondeur? Je sais qu'il ya la nnet, neuralnetet RSNNS, mais aucun d' entre eux semblent mettre en œuvre des méthodes d'apprentissage en profondeur. Je suis particulièrement intéressé par les activités non supervisées suivies par …

56 r neural-networks deep-learning rbm deep-belief-networks

4

Toutes les valeurs comprises dans un intervalle de confiance de 95% sont-elles également probables?

J'ai trouvé des informations discordantes sur la question: " Si l'on construit un intervalle de confiance (IC) à 95% d'une différence de moyennes ou d'une différence de proportions, toutes les valeurs de l'IC sont-elles également probables? Ou bien, l'estimation ponctuelle est-elle la plus probable? , avec des valeurs proches des …

56 confidence-interval

6

L ’« hybride »entre les approches de Fisher et de Neyman-Pearson en matière de test statistique est-il vraiment un« méli-mélo incohérent »?

Il existe une certaine école de pensée selon laquelle l'approche la plus répandue du test statistique est un "hybride" entre deux approches: celle de Fisher et celle de Neyman-Pearson; La revendication affirme que ces deux approches sont "incompatibles" et que, par conséquent, "hybride" est un "méli-mélo incohérent". Je fournirai une …

56 hypothesis-testing statistical-significance p-value type-i-and-ii-errors history