Statistiques et Big Data

4

Existe-t-il une implémentation populaire de champs aléatoires conditionnels en Python ? Je n'arrive pas à en trouver qui soient largement utilisés et populaires!

32 machine-learning classification python conditional-random-field

6

Comment démarrer avec les réseaux de neurones

Je suis complètement nouveau dans les réseaux de neurones mais très intéressé à les comprendre. Cependant, ce n'est pas facile du tout de commencer. Quelqu'un pourrait-il recommander un bon livre ou tout autre type de ressource? Y a-t-il une lecture obligatoire? Je suis reconnaissant pour tout type de pourboire.

32 machine-learning neural-networks references

3

Comment calculer la variance regroupée de deux groupes ou plus à partir des variances de groupe connues, des moyennes et de la taille des échantillons?

Supposons qu'il existe éléments divisés en deux groupes ( et ). La variance du premier groupe est et la variance du deuxième groupe est . Les éléments eux-mêmes sont supposés inconnus, mais je connais les moyens et .m+nm+nm+nmmmnnnσ2mσm2\sigma_m^2σ2nσn2\sigma^2_nμmμm\mu_mμnμn\mu_n Existe-t-il un moyen de calculer la variance combinée ?σ2(m+n)σ(m+n)2\sigma^2_{(m+n)} La variance ne …

32 variance pooling

2

Existe-t-il un exemple de l’inégalité unilatérale de Chebyshev?

Je suis intéressé par la version unilatérale suivante de Cantelli de l'inégalité de Chebyshev : P(X−E(X)≥t)≤Var(X)Var(X)+t2.P(X−E(X)≥t)≤Var(X)Var(X)+t2. \mathbb P(X - \mathbb E (X) \geq t) \leq \frac{\mathrm{Var}(X)}{\mathrm{Var}(X) + t^2} \,. En gros, si vous connaissez la moyenne et la variance de la population, vous pouvez calculer la limite supérieure de la …

32 probability mathematical-statistics probability-inequalities mean

6

Que serait un modèle bayésien robuste pour estimer l’échelle d’une distribution approximativement normale?

Il existe un certain nombre d' estimateurs d'échelle robustes . Un exemple notable est l’écart absolu médian qui se rapporte à l’écart type sous la forme . Dans un cadre bayésien, il existe un certain nombre de moyens pour estimer de manière fiable l' emplacement d'une distribution à peu près …

32 r bayesian estimation standard-deviation robust

1

Pourquoi R renvoie-t-il NA sous forme de coefficient lm ()?

J'adapte un lm()modèle à un ensemble de données comprenant des indicateurs pour le trimestre financier (T1, T2, T3, Q4 par défaut). En utilisant lm(Y~., data = data) je reçois un NAcomme coefficient pour Q3, et un avertissement indiquant qu’une variable a été exclue à cause de singularités. Dois-je ajouter une …

32 r regression

1

Variance sur la somme des valeurs prédites à partir d'un modèle à effets mixtes sur une série temporelle

J'ai un modèle à effets mélangés (en fait, un modèle mélangé additif généralisé) qui me donne des prévisions pour une série temporelle. Pour contrer l'autocorrélation, j'utilise un modèle corCAR1, compte tenu du fait qu'il me manque des données. Les données sont supposées me donner une charge totale, je dois donc …

32 mixed-model variance random-variable

6

Quelle est la différence entre la régression logistique et les réseaux de neurones?

Comment pouvons-nous expliquer la différence entre la régression logistique et le réseau de neurones à un public qui n'a pas de formation en statistiques?

32 logistic neural-networks

7

Existe-t-il des algorithmes permettant de calculer les paramètres de régression linéaire ou logistique «en cours d'exécution»?

Un article intitulé «Calcul précis de la variance courante», disponible à l' adresse http://www.johndcook.com/standard_deviation.html, montre comment calculer la moyenne courante, la variance et les écarts types. Existe-t-il des algorithmes dans lesquels les paramètres d'un modèle de régression linéaire ou logistique peuvent être mis à jour de manière "dynamique" de manière …

32 regression logistic online

2

Comment trouver des intervalles de confiance pour les notations?

Evan Miller, " Comment ne pas trier par note moyenne ", propose d'utiliser la limite inférieure d'un intervalle de confiance pour obtenir un "score" global raisonnable pour les éléments notés. Cependant, cela fonctionne avec un modèle de Bernoulli: les évaluations sont soit les pouces vers le haut, soit les pouces …

32 confidence-interval estimation

5

Comment changer les données entre les formats large et long en R? [fermé]

Vous pouvez avoir des données en format large ou en format long. C'est une chose assez importante, car les méthodes utilisables sont différentes, en fonction du format. Je sais que vous devez travailler avec melt()et à cast()partir du package de remodelage, mais il semble que certaines choses ne me soient …

32 data-transformation r

3

Comment dessiner des polygones nets autour des régions du diagramme de dispersion dans ggplot2 [fermé]

Comment ajouter un polygone net autour d'un groupe de points sur un diagramme de dispersion? J'utilise ggplot2 mais je suis déçu des résultats de geom_polygon. Le jeu de données est là - bas , sous forme de fichier texte délimité par des tabulations. Le graphique ci-dessous montre deux mesures d'attitude …

32 ggplot2 scatterplot

3

Importance variable de SVM

Comment obtenir une importance variable (attribut) en utilisant SVM?

32 machine-learning feature-selection svm

12

Quel est le concept statistique le plus difficile à saisir?

C'est une question similaire à celle ici , mais suffisamment différente, je pense, pour que cela vaille la peine d'être posée. Je pensais mettre comme point de départ ce que je pense être l’un des plus difficiles à comprendre. Le mien est la différence entre probabilité et fréquence . L'une …

32 teaching

2

Distributions autres que la normale où la moyenne et la variance sont indépendantes

Je me demandais s'il existe des distributions autres que la normale où la moyenne et la variance sont indépendantes l'une de l'autre (ou, en d'autres termes, où la variance n'est pas une fonction de la moyenne).

32 distributions