Statistiques et Big Data

1

Deux façons d'utiliser le bootstrap pour estimer l'intervalle de confiance des coefficients de régression

J'applique un modèle linéaire à mes données: yje= β0+ β1Xje+ ϵje,ϵje∼ N( 0 , σ2) .yje=β0+β1Xje+ϵje,ϵje∼N(0,σ2). y_{i}=\beta_{0}+\beta_{1}x_{i}+\epsilon_{i}, \quad\epsilon_{i} \sim N(0,\sigma^{2}). Je voudrais estimer l'intervalle de confiance (CI) des coefficients ( , ) en utilisant la méthode bootstrap. Il y a deux façons d'appliquer la méthode d'amorçage: β 1β0β0\beta_{0}β1β1\beta_{1} Exemple de …

21 regression bootstrap

1

Quelle fonction pourrait être un noyau?

Dans le contexte de l'apprentissage automatique et de la reconnaissance des formes, il existe un concept appelé Kernel Trick . Face à des problèmes où l'on me demande de déterminer si une fonction peut être une fonction noyau ou non, que faire exactement? Dois-je d'abord vérifier si elles ont la …

21 machine-learning kernel-trick

3

Comment calculer la qualité de l'ajustement en glm (R)

J'ai le résultat suivant en exécutant la fonction glm. Comment interpréter les valeurs suivantes: Déviance nulle Déviance résiduelle AIC Ont-ils quelque chose à voir avec la qualité de l'ajustement? Puis-je calculer une mesure de la qualité de l'ajustement à partir de ces résultats, comme le carré R ou toute autre …

21 r regression generalized-linear-model

2

Interprétation naturelle pour les hyperparamètres LDA

Quelqu'un peut-il expliquer quelle est l'interprétation naturelle des hyperparamètres LDA? ALPHAet BETAsont des paramètres des distributions de Dirichlet pour les distributions de mots (par document) et (par sujet) de mots respectivement. Cependant, quelqu'un peut-il expliquer ce que signifie choisir des valeurs plus élevées de ces hyperparamètres par rapport à des …

21 interpretation prior topic-models hyperparameter

2

Quelles distributions ont des solutions de forme fermée pour l'estimation du maximum de vraisemblance?

Quelles distributions ont des solutions sous forme fermée pour les estimations du maximum de vraisemblance des paramètres à partir d'un échantillon d'observations indépendantes?

21 distributions mathematical-statistics maximum-likelihood

1

Rôle du paramètre n.minobsinnode de GBM dans R [fermé]

Il est peu probable que cette question aide les futurs visiteurs; il ne s'applique qu'à une petite zone géographique, à un moment précis ou à une situation extraordinairement étroite qui n'est généralement pas applicable au public mondial d'Internet. Pour obtenir de l'aide afin que cette question soit plus largement applicable, …

21 r gbm

3

Comment interpréter les effets principaux lorsque l'effet d'interaction n'est pas significatif?

J'ai exécuté un modèle mixte linéaire généralisé dans R et inclus un effet d'interaction entre deux prédicteurs. L'interaction n'était pas significative, mais les principaux effets (les deux prédicteurs) l'étaient tous les deux. Maintenant, de nombreux exemples de manuels me disent que s'il y a un effet significatif de l'interaction, les …

21 logistic mixed-model interaction interpretation regression-coefficients

4

Analyse fonctionnelle en composantes principales (FPCA): de quoi s'agit-il?

L'analyse fonctionnelle des composants principaux (FPCA) est quelque chose sur laquelle je suis tombé et que je n'ai jamais compris. C'est à propos de quoi? Voir «Une enquête sur l'analyse des composants principaux fonctionnels» par Shang, 2011 , et je cite: L'ACP rencontre de sérieuses difficultés dans l'analyse des données …

21 time-series pca dimensionality-reduction

2

Une petite taille d'échantillon peut-elle provoquer une erreur de type 1?

J'ai appris qu'une petite taille d'échantillon peut entraîner une alimentation insuffisante et une erreur de type 2. Cependant, j'ai le sentiment que les petits échantillons ne sont généralement pas fiables et peuvent conduire à tout type de résultat par hasard. Est-ce vrai?

21 hypothesis-testing small-sample

3

Pourquoi les variables aléatoires sont-elles définies comme des fonctions?

J'ai du mal à comprendre le concept d'une variable aléatoire en tant que fonction. Je comprends la mécanique (je pense) mais je ne comprends pas la motivation ... Disons que est un triple de probabilité, où , est l'algèbre de Borel- sur cet intervalle et est la mesure régulière de …

21 probability random-variable measure-theory

2

Pourquoi un avant sur la variance est-il considéré comme faible?

Contexte L'un des faibles a priori sur variance les plus couramment utilisés est le gamma inverse avec les paramètres (Gelman 2006) .α=0.001,β=0.001α=0.001,β=0.001\alpha =0.001, \beta=0.001 Cependant, cette distribution a un IC à 90% d'environ .[3×1019,∞][3×1019,∞][3\times10^{19},\infty] library(pscl) sapply(c(0.05, 0.95), function(x) qigamma(x, 0.001, 0.001)) [1] 3.362941e+19 Inf À partir de cela, j'interprète que …

21 bayesian multilevel-analysis prior

3

La perte d'entraînement augmente avec le temps [doublon]

Cette question a déjà des réponses ici : Comment un changement dans la fonction de coût peut-il être positif? (1 réponse) Que dois-je faire lorsque mon réseau de neurones n'apprend pas? (5 réponses) Fermé le mois dernier . Je forme un modèle (Recurrent Neural Network) pour classer 4 types de …

21 machine-learning neural-networks loss-functions rnn training-error

2

PCA en numpy et sklearn produit des résultats différents

Suis-je mal comprendre quelque chose. C'est mon code en utilisant sklearn import numpy as np import matplotlib.pyplot as plt from mpl_toolkits.mplot3d import Axes3D from sklearn import decomposition from sklearn import datasets from sklearn.preprocessing import StandardScaler pca = decomposition.PCA(n_components=3) x = np.array([ [0.387,4878, 5.42], [0.723,12104,5.25], [1,12756,5.52], [1.524,6787,3.94], ]) pca.fit_transform(x) Production: array([[ …

21 pca python scikit-learn

2

Comment fonctionnent les architectures de goulot d'étranglement dans les réseaux de neurones?

Nous définissons une architecture de goulot d'étranglement comme le type trouvé dans le document ResNet où [deux couches conv 3x3] sont remplacées par [une conv 1x1, une conv 3x3 et une autre couche conv 1x1]. Je comprends que les couches conv 1x1 sont utilisées comme une forme de réduction de …

21 residuals deep-learning conv-neural-network

4

Comment savoir si les données sont séparables linéairement?

Les données ont de nombreuses fonctionnalités (par exemple 100) et le nombre d'instances est comme 100 000. Les données sont rares. Je veux ajuster les données en utilisant une régression logistique ou svm. Comment savoir si les fonctionnalités sont linéaires ou non linéaires afin de pouvoir utiliser l'astuce du noyau …

21 machine-learning logistic svm data-mining