Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données

4
Comment créer une matrice de covariance arbitraire
Par exemple, dans R, la MASS::mvrnorm()fonction est utile pour générer des données pour illustrer diverses choses dans les statistiques. Il prend un Sigmaargument obligatoire qui est une matrice symétrique spécifiant la matrice de covariance des variables. Comment créer une matrice symétrique n × nn×nn\times n avec des entrées arbitraires?

2
Pourquoi la fonction softmax est-elle utilisée pour calculer les probabilités alors que nous pouvons diviser chaque valeur par la somme du vecteur?
L'application de la fonction softmax sur un vecteur produira des "probabilités" et des valeurs comprises entre et . 000111 Mais nous pouvons également diviser chaque valeur par la somme du vecteur et cela produira des probabilités et des valeurs comprises entre et .000111 J'ai lu la réponse ici mais il …



1
lme () et lmer () donnant des résultats contradictoires
J'ai travaillé avec certaines données qui ont des problèmes avec les mesures répétées. Ce faisant, j'ai remarqué un comportement très différent entre lme()et en lmer()utilisant mes données de test et je veux savoir pourquoi. Le faux ensemble de données que j'ai créé contient des mesures de taille et de poids …

2
FPR (taux de faux positifs) vs FDR (taux de fausses découvertes)
La citation suivante provient du célèbre document de recherche Signification statistique pour les études à l'échelle du génome de Storey et Tibshirani (2003): Par exemple, un taux de faux positifs de 5% signifie qu'en moyenne 5% des caractéristiques vraiment nulles de l'étude seront qualifiées de significatives. Un FDR (False Discovery …

3
Trouver un moyen de simuler des nombres aléatoires pour cette distribution
J'essaie d'écrire un programme en R qui simule des nombres pseudo aléatoires à partir d'une distribution avec la fonction de distribution cumulative: F(x)=1−exp(−ax−bp+1xp+1),x≥0F(x)=1−exp⁡(−ax−bp+1xp+1),x≥0F(x)= 1-\exp \left(-ax-\frac{b}{p+1}x^{p+1}\right), \quad x \geq 0 oùa,b>0,p∈(0,1)a,b>0,p∈(0,1)a,b>0, p \in (0,1) J'ai essayé l'échantillonnage par transformée inverse mais l'inverse ne semble pas résoluble analytiquement. Je serais heureux si …

9
Sur-ajustement et sous-ajustement
J'ai fait des recherches sur le sur-ajustement et le sous-ajustement, et j'ai compris ce qu'ils sont exactement, mais je ne trouve pas les raisons. Quelles sont les principales raisons du sur-ajustement et du sous-ajustement? Pourquoi sommes-nous confrontés à ces deux problèmes dans la formation d'un modèle?




3
Comprendre le paramètre input_shape dans LSTM avec Keras
J'essaie d'utiliser l'exemple décrit dans la documentation Keras nommée "LSTM empilé pour la classification de séquence" (voir le code ci-dessous) et input_shapeje ne peux pas comprendre le paramètre dans le contexte de mes données. J'ai en entrée une matrice de séquences de 25 caractères possibles encodés en nombres entiers pour …
20 lstm  keras  shape  dimensions 

5
Un exemple où le principe de vraisemblance * compte vraiment *?
Existe-t-il un exemple où deux tests défendables différents avec des probabilités proportionnelles conduiraient à des inférences nettement différentes (et également défendables), par exemple, où les valeurs de p sont de l'ordre de grandeur très éloignées, mais le pouvoir des alternatives est similaire? Tous les exemples que je vois sont très …


1
Des réseaux bayésiens aux réseaux neuronaux: comment transposer une régression multivariée en un réseau multi-sorties
J'ai affaire à un modèle linéaire hiérarchique bayésien , ici le réseau qui le décrit. YYY représente les ventes quotidiennes d'un produit dans un supermarché (observé). XXX est une matrice connue de régresseurs, y compris les prix, les promotions, le jour de la semaine, la météo, les vacances. 1SSS est …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.