Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
J'ai une matrice de corrélation des retours de titres dont le déterminant est zéro. (Cela est un peu surprenant car la matrice de corrélation d'échantillon et la matrice de covariance correspondante devraient théoriquement être définies positives.) Mon hypothèse est qu'au moins un titre dépend linéairement d'autres titres. Y a-t-il une …
Veuillez fournir le code R qui permet d'effectuer une ANOVA entre sujets avec -3, -1, 1, 3 contrastes. Je comprends qu'il y a un débat concernant le type de somme de carrés (SS) approprié pour une telle analyse. Cependant, comme le type par défaut de SS utilisé dans SAS et …
Je suis nouveau dans R, j'ai ordonné une régression logistique et polr. La section "Exemples" au bas de la page d'aide de polr (qui adapte un modèle de régression logistique ou probit à une réponse factorielle ordonnée) montre options(contrasts = c("contr.treatment", "contr.poly")) house.plr <- polr(Sat ~ Infl + Type + …
J'utilise des modèles de régression LOESS en R, et je veux comparer les sorties de 12 modèles différents avec des tailles d'échantillons variables. Je peux décrire les modèles réels plus en détail si cela aide à répondre à la question. Voici les tailles d'échantillon: Fastballs vs RHH 2008-09: 2002 Fastballs …
Citant la grande réponse de Gung Apparemment, un chercheur a déjà approché Fisher avec des résultats «non significatifs», lui demandant ce qu'il devait faire, et Fisher a déclaré: «Allez chercher plus de données». Du point de vue de Neyman-Pearson, il s'agit d'un hachage flagrant , mais y a-t-il un cas …
Je lis sur la fonction quantile, mais ce n'est pas clair pour moi. Pourriez-vous fournir une explication plus intuitive que celle fournie ci-dessous? Puisque le cdf est une fonction augmentant de façon monotone, il a un inverse; notons ceci par . Si est le cdf de , alors est la …
Ma perte d'entraînement diminue puis augmente à nouveau. C'est très bizarre. La perte de validation croisée suit la perte d'entraînement. Que se passe-t-il? J'ai deux LSTMS empilés comme suit (sur Keras): model = Sequential() model.add(LSTM(512, return_sequences=True, input_shape=(len(X[0]), len(nd.char_indices)))) model.add(Dropout(0.2)) model.add(LSTM(512, return_sequences=False)) model.add(Dropout(0.2)) model.add(Dense(len(nd.categories))) model.add(Activation('sigmoid')) model.compile(loss='binary_crossentropy', optimizer='adadelta') Je l'entraîne pour 100 …
J'ai une question simple concernant la "probabilité conditionnelle" et la "probabilité". (J'ai déjà sondé cette question ici mais en vain.) Cela commence à partir de la page Wikipedia sur la probabilité . Ils disent ceci: La probabilité d'un ensemble de valeurs de paramètres, θθ\theta , compte tenu des résultatsxxx , …
Lors de l'inférence bayésienne, nous opérons en maximisant notre fonction de vraisemblance en combinaison avec les a priori que nous avons sur les paramètres. Parce que la log-vraisemblance est plus pratique, nous maximisons efficacement utilisant un MCMC ou autrement ce qui génère les distributions postérieures (en utilisant un pdf pour …
Est-il possible de trouver la valeur de p dans la corrélation de Pearson dans R? Pour trouver la corrélation Pearson, je fais habituellement ceci col1 = c(1,2,3,4) col2 = c(1,4,3,5) cor(col1,col2) # [1] 0.8315218 Mais comment puis-je trouver la valeur de p de cela?
Dans la régression linéaire, chaque valeur prédite est supposée avoir été choisie dans une distribution normale de valeurs possibles. Voir ci-dessous. Mais pourquoi chaque valeur prédite est-elle supposée provenir d'une distribution normale? Comment la régression linéaire utilise-t-elle cette hypothèse? Que faire si les valeurs possibles ne sont pas normalement distribuées?
Disons que j'ai trois sources indépendantes et chacune d'elles fait des prévisions pour la météo de demain. Le premier dit que la probabilité de pluie demain est de 0, puis le second dit que la probabilité est de 1, et enfin le dernier dit que la probabilité est de 50%. …
D'après ce que je comprends, nous ne pouvons construire qu'une fonction de régression qui se situe dans l'intervalle des données d'entraînement. Par exemple (un seul des panneaux est nécessaire): Comment pourrais-je prédire l'avenir en utilisant un régresseur KNN? Encore une fois, il semble ne se rapprocher que d'une fonction qui …
Tout étudiant qui travaille dur est un contre-exemple de "tous les étudiants sont paresseux". Quels sont les contre-exemples simples pour "si les variables aléatoires et sont pas corrélées, alors elles sont indépendantes"?XXXOuiOuiY
J'essaie d'acquérir une meilleure compréhension intuitive de l'écart-type. D'après ce que je comprends, il est représentatif de la moyenne des différences d'un ensemble d'observations dans un ensemble de données par rapport à la moyenne de cet ensemble de données. Cependant, il n'est PAS réellement égal aux moyennes des différences car …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.