Statistiques et Big Data

1

Calcul de la vraisemblance marginale à partir d'échantillons MCMC

C'est une question récurrente (voir cet article , cet article et cet article ), mais j'ai un tour différent. Supposons que j'ai un tas d'échantillons d'un échantillonneur MCMC générique. Pour chaque échantillon , je connais la valeur du log vraisemblance et du log prior . Si cela aide, je connais …

24 machine-learning bayesian sampling mcmc likelihood

4

ANOVA vs régression linéaire multiple? Pourquoi l'ANOVA est-elle si couramment utilisée dans les études expérimentales?

ANOVA vs régression linéaire multiple? Je comprends que ces deux méthodes semblent utiliser le même modèle statistique. Cependant, dans quelles circonstances dois-je utiliser quelle méthode? Quels sont les avantages et les inconvénients de ces méthodes en comparaison? Pourquoi l'ANOVA est-elle si couramment utilisée dans les études expérimentales et je ne …

24 anova multiple-regression least-squares

2

Sac de mots pour la classification de texte: pourquoi ne pas simplement utiliser des fréquences de mots au lieu de TFIDF?

Une approche courante de la classification des textes consiste à former un classificateur à partir d'un «sac de mots». L'utilisateur prend le texte à classer et compte les fréquences des mots dans chaque objet, suivi d'une sorte de recadrage pour conserver la matrice résultante d'une taille gérable. Souvent, je vois …

24 machine-learning classification text-mining

2

Le paradoxe des données iid (du moins pour moi)

En ce qui concerne ma connaissance globale (et rares) sur les permis de statistiques, je compris que si X1,X2,...,XnX1,X2,...,XnX_1, X_2,..., X_n sont des variables aléatoires iid, alors comme le terme l'indique, elles sont indépendantes et identiquement distribuées. Ce qui me préoccupe ici est l'ancienne propriété des échantillons iid, qui se …

24 sampling conditional-probability independence

3

Évaluation de la régression logistique et de l'interprétation de la qualité de l'ajustement Hosmer-Lemeshow

Comme nous le savons tous, il existe 2 méthodes pour évaluer le modèle de régression logistique et elles testent des choses très différentes Puissance prédictive: Obtenez une statistique qui mesure dans quelle mesure vous pouvez prédire la variable dépendante en fonction des variables indépendantes. Les Pseudo R ^ 2 bien …

24 r logistic goodness-of-fit regression-strategies model-evaluation

2

Passer de la modélisation d'un processus à l'aide d'une distribution de Poisson pour utiliser une distribution binomiale négative?

\newcommand{\P}{\mathbb{P}} Nous avons un processus aléatoire qui peut ou mai ne pas se produire plusieurs fois dans une période de temps définie . Nous avons un flux de données à partir d'un modèle préexistant de ce processus, qui fournit la probabilité qu'un certain nombre d'événements se produisent dans la période …

24 negative-binomial kalman-filter poisson-process state-space-models

1

Quelle est la probabilité que

Étant donné points de données, chacun avec caractéristiques, sont étiquetés comme , les autres sont étiquetés comme . Chaque entité prend une valeur de au hasard (distribution uniforme). Quelle est la probabilité qu'il existe un hyperplan pouvant diviser les deux classes?d n / 2 0 n / 2 1 [ …

24 probability classification mathematical-statistics separation

4

Que pouvons-nous apprendre sur le cerveau humain des réseaux de neurones artificiels?

Je sais que ma question / titre n'est pas très précis, je vais donc essayer de le clarifier: Les réseaux de neurones artificiels ont des conceptions relativement strictes. Bien sûr, généralement, ils sont influencés par la biologie et tentent de construire un modèle mathématique de réseaux neuronaux réels, mais notre …

24 machine-learning neural-networks bioinformatics artificial-intelligence neuroscience

3

Pourquoi les transformations de puissance ou de journaux ne sont-elles pas beaucoup enseignées dans l'apprentissage automatique?

L'apprentissage automatique (ML) utilise fortement les techniques de régression linéaire et logistique. Elle repose également sur des techniques d'ingénierie (fonction feature transform, kerneletc.). Pourquoi rien au sujet variable transformation(par exemple power transformation) mentionné dans ML? (Par exemple, je n'ai jamais entendu parler de la prise de racine ou du journal …

24 regression machine-learning data-transformation

1

Un multinomial (1 / n,…, 1 / n) peut-il être caractérisé comme un Dirichlet discrétisé (1, .., 1)?

Cette question est donc un peu compliquée, mais je vais inclure des graphiques colorés pour compenser cela! D'abord le contexte puis les questions. Contexte Supposons que vous ayez une distribution multinomiale à nnn dimensions avec des probailites égales sur les nnn catégories. Soit π= ( π1, … , Πn)π=(π1,…,πn)\pi = …

24 distributions bayesian bootstrap multinomial dirichlet-distribution

2

Les encodeurs automatiques ne peuvent pas apprendre de fonctionnalités significatives

J'ai 50 000 images comme celles-ci: Ils représentent des graphiques de données. Je voulais extraire des fonctionnalités de ces images, j'ai donc utilisé le code de l'encodeur automatique fourni par Theano (deeplearning.net). Le problème est que ces encodeurs automatiques ne semblent pas apprendre de fonctionnalités. J'ai essayé RBM et c'est …

24 machine-learning neural-networks feature-construction rbm autoencoders

4

Algorithmes pour la détection d'anomalies de séries chronologiques

J'utilise actuellement AnomalyDetection de Twitter dans R: https://github.com/twitter/AnomalyDetection . Cet algorithme fournit une détection d'anomalies de séries chronologiques pour les données avec saisonnalité. Question: existe-t-il d'autres algorithmes similaires à celui-ci (le contrôle de la saisonnalité n'a pas d'importance)? J'essaie de marquer autant d'algorithmes de séries temporelles que possible sur mes …

24 r regression time-series anomaly-detection

2

Lasso bayésien vs lasso ordinaire

Différents logiciels d'implémentation sont disponibles pour le lasso . Je sais que beaucoup de choses ont été discutées entre l'approche bayésienne et l'approche fréquentiste dans différents forums. Ma question est très spécifique au lasso - Quelles sont les différences ou les avantages du lasso baysian par rapport au lasso ordinaire …

24 r machine-learning linear-model lasso

1

Interprétation géométrique du coefficient de corrélation multiple

Je m'intéresse à la signification géométrique de la corrélation multiple et du coefficient de détermination dans la régression , ou en notation vectorielle,R 2 y i = β 1 + β 2 x 2 , i + ⋯ + β k x k , i + ϵ iRRRR2R2R^2yi=β1+β2x2,i+⋯+βkxk,i+ϵiyi=β1+β2x2,i+⋯+βkxk,i+ϵiy_i = \beta_1 …

24 regression correlation multiple-regression r-squared geometry

3

Détection des valeurs aberrantes sur les distributions asymétriques

Dans une définition classique d'une valeur aberrante en tant que point de données en dehors du 1.5 * IQR du quartile supérieur ou inférieur, il y a une hypothèse d'une distribution non asymétrique. Pour les distributions asymétriques (exponentielle, Poisson, géométrique, etc.) est le meilleur moyen de détecter une valeur aberrante …

24 distributions outliers skewness exponential interquartile