Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données

1
Comment décomposer une série chronologique avec plusieurs composantes saisonnières?
J'ai une série chronologique qui contient des composantes saisonnières doubles et je voudrais décomposer la série en composantes chronologiques suivantes (tendance, composante saisonnière 1, composante saisonnière 2 et composante irrégulière). Pour autant que je sache, la procédure STL de décomposition d'une série en R ne permet qu'une seule composante saisonnière, …


2
Comment comparer et / ou valider les modèles à effets mixtes?
Comment les modèles d'effets mixtes (linéaires) sont-ils normalement comparés les uns aux autres? Je sais que des tests de rapport de vraisemblance peuvent être utilisés, mais cela ne fonctionne pas si un modèle n'est pas un «sous-ensemble» de l'autre correct? L'estimation des modèles df est-elle toujours simple? Nombre d'effets fixes …

4
Interprétation de la différence entre la distribution lognormale et la loi de puissance (distribution des degrés de réseau)
Tout d'abord, je ne suis pas statisticien. Cependant, j'ai fait une analyse statistique du réseau pour mon doctorat. Dans le cadre de l'analyse du réseau, j'ai tracé une fonction de distribution cumulative complémentaire (CCDF) des degrés de réseau. Ce que j'ai trouvé, c'est que, contrairement aux distributions de réseau conventionnelles …

1
Calcul de la puissance statistique
Si je comprends bien, j'ai besoin de connaître au moins trois aspects (sur quatre) de mon étude proposée afin d'effectuer une analyse de puissance, à savoir: type de test - J'ai l'intention d'utiliser r et ANCOVA / Regression de Pearson - GLM niveau de signification (alpha) - J'ai l'intention d'utiliser …

2
Meilleure approche pour la sélection de modèles bayésienne ou validation croisée?
Lorsque vous essayez de sélectionner parmi différents modèles ou le nombre de fonctionnalités à inclure, disons la prédiction, je peux penser à deux approches. Divisez les données en ensembles de formation et de test. Mieux encore, utilisez le bootstrapping ou la validation croisée k-fold. Entraînez-vous à chaque fois sur l'ensemble …

2
Sur la «force» des apprenants faibles
J'ai plusieurs questions étroitement liées concernant les apprenants faibles dans l'apprentissage d'ensemble (par exemple, le renforcement). Cela peut sembler stupide, mais quels sont les avantages d'utiliser des apprenants faibles plutôt que des apprenants forts? (par exemple, pourquoi ne pas booster avec des méthodes d'apprentissage "fortes"?) Existe-t-il une sorte de force …

2
Bonne ressource en ligne avec des conseils sur l'association graphique entre deux variables numériques dans diverses conditions
Le contexte: Au fil du temps, j'ai acquis un ensemble d'heuristiques sur la façon de tracer efficacement l'association entre deux variables numériques. J'imagine que la plupart des gens qui travaillent avec des données auraient un ensemble de règles similaire. Des exemples de telles règles peuvent être: Si l'une des variables …






3
Prise en charge de la régression vectorielle pour la prédiction de séries chronologiques multivariées
Quelqu'un a-t-il tenté de prédire des séries chronologiques en utilisant la régression des vecteurs de support? Je comprends les machines à vecteurs de support et je comprends partiellement la régression des vecteurs de support, mais je ne comprends pas comment elles peuvent être utilisées pour modéliser des séries chronologiques, en …

4
Comment garantir les propriétés de la matrice de covariance lors de l'ajustement d'un modèle normal multivarié en utilisant le maximum de vraisemblance?
Supposons que j'ai le modèle suivant yi=f(xi,θ)+εiyi=f(xi,θ)+εiy_i=f(x_i,\theta)+\varepsilon_i où yi∈RKyi∈RKy_i\in \mathbb{R}^K , xixix_i est un vecteur de variables explicatives, θθ\theta est les paramètres de la fonction non linéaire fff et εi∼N(0,Σ)εi∼N(0,Σ)\varepsilon_i\sim N(0,\Sigma) , où ΣΣ\Sigma est naturellement la matrice K×KK×KK\times K Le but est l'habituel d'estimer θθ\theta et ΣΣ\Sigma . Le …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.