Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
J'applique un modèle linéaire à mes données: yje= β0+ β1Xje+ ϵje,ϵje∼ N( 0 , σ2) .yje=β0+β1Xje+ϵje,ϵje∼N(0,σ2). y_{i}=\beta_{0}+\beta_{1}x_{i}+\epsilon_{i}, \quad\epsilon_{i} \sim N(0,\sigma^{2}). Je voudrais estimer l'intervalle de confiance (CI) des coefficients ( , ) en utilisant la méthode bootstrap. Il y a deux façons d'appliquer la méthode d'amorçage: β 1β0β0\beta_{0}β1β1\beta_{1} Exemple de …
Dans le contexte de l'apprentissage automatique et de la reconnaissance des formes, il existe un concept appelé Kernel Trick . Face à des problèmes où l'on me demande de déterminer si une fonction peut être une fonction noyau ou non, que faire exactement? Dois-je d'abord vérifier si elles ont la …
J'ai le résultat suivant en exécutant la fonction glm. Comment interpréter les valeurs suivantes: Déviance nulle Déviance résiduelle AIC Ont-ils quelque chose à voir avec la qualité de l'ajustement? Puis-je calculer une mesure de la qualité de l'ajustement à partir de ces résultats, comme le carré R ou toute autre …
Quelqu'un peut-il expliquer quelle est l'interprétation naturelle des hyperparamètres LDA? ALPHAet BETAsont des paramètres des distributions de Dirichlet pour les distributions de mots (par document) et (par sujet) de mots respectivement. Cependant, quelqu'un peut-il expliquer ce que signifie choisir des valeurs plus élevées de ces hyperparamètres par rapport à des …
Quelles distributions ont des solutions sous forme fermée pour les estimations du maximum de vraisemblance des paramètres à partir d'un échantillon d'observations indépendantes?
Il est peu probable que cette question aide les futurs visiteurs; il ne s'applique qu'à une petite zone géographique, à un moment précis ou à une situation extraordinairement étroite qui n'est généralement pas applicable au public mondial d'Internet. Pour obtenir de l'aide afin que cette question soit plus largement applicable, …
J'ai exécuté un modèle mixte linéaire généralisé dans R et inclus un effet d'interaction entre deux prédicteurs. L'interaction n'était pas significative, mais les principaux effets (les deux prédicteurs) l'étaient tous les deux. Maintenant, de nombreux exemples de manuels me disent que s'il y a un effet significatif de l'interaction, les …
L'analyse fonctionnelle des composants principaux (FPCA) est quelque chose sur laquelle je suis tombé et que je n'ai jamais compris. C'est à propos de quoi? Voir «Une enquête sur l'analyse des composants principaux fonctionnels» par Shang, 2011 , et je cite: L'ACP rencontre de sérieuses difficultés dans l'analyse des données …
J'ai appris qu'une petite taille d'échantillon peut entraîner une alimentation insuffisante et une erreur de type 2. Cependant, j'ai le sentiment que les petits échantillons ne sont généralement pas fiables et peuvent conduire à tout type de résultat par hasard. Est-ce vrai?
J'ai du mal à comprendre le concept d'une variable aléatoire en tant que fonction. Je comprends la mécanique (je pense) mais je ne comprends pas la motivation ... Disons que est un triple de probabilité, où , est l'algèbre de Borel- sur cet intervalle et est la mesure régulière de …
Contexte L'un des faibles a priori sur variance les plus couramment utilisés est le gamma inverse avec les paramètres (Gelman 2006) .α=0.001,β=0.001α=0.001,β=0.001\alpha =0.001, \beta=0.001 Cependant, cette distribution a un IC à 90% d'environ .[3×1019,∞][3×1019,∞][3\times10^{19},\infty] library(pscl) sapply(c(0.05, 0.95), function(x) qigamma(x, 0.001, 0.001)) [1] 3.362941e+19 Inf À partir de cela, j'interprète que …
Cette question a déjà des réponses ici : Comment un changement dans la fonction de coût peut-il être positif? (1 réponse) Que dois-je faire lorsque mon réseau de neurones n'apprend pas? (5 réponses) Fermé le mois dernier . Je forme un modèle (Recurrent Neural Network) pour classer 4 types de …
Nous définissons une architecture de goulot d'étranglement comme le type trouvé dans le document ResNet où [deux couches conv 3x3] sont remplacées par [une conv 1x1, une conv 3x3 et une autre couche conv 1x1]. Je comprends que les couches conv 1x1 sont utilisées comme une forme de réduction de …
Les données ont de nombreuses fonctionnalités (par exemple 100) et le nombre d'instances est comme 100 000. Les données sont rares. Je veux ajuster les données en utilisant une régression logistique ou svm. Comment savoir si les fonctionnalités sont linéaires ou non linéaires afin de pouvoir utiliser l'astuce du noyau …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.