Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
J'ai une série chronologique qui contient des composantes saisonnières doubles et je voudrais décomposer la série en composantes chronologiques suivantes (tendance, composante saisonnière 1, composante saisonnière 2 et composante irrégulière). Pour autant que je sache, la procédure STL de décomposition d'une série en R ne permet qu'une seule composante saisonnière, …
Intro: J'ai un ensemble de données avec un problème classique "grand p, petit n". Le nombre d'échantillons disponibles n = 150 tandis que le nombre de prédicteurs possibles p = 400. Le résultat est une variable continue. Je veux trouver les descripteurs les plus "importants", c'est-à-dire ceux qui sont les …
Comment les modèles d'effets mixtes (linéaires) sont-ils normalement comparés les uns aux autres? Je sais que des tests de rapport de vraisemblance peuvent être utilisés, mais cela ne fonctionne pas si un modèle n'est pas un «sous-ensemble» de l'autre correct? L'estimation des modèles df est-elle toujours simple? Nombre d'effets fixes …
Tout d'abord, je ne suis pas statisticien. Cependant, j'ai fait une analyse statistique du réseau pour mon doctorat. Dans le cadre de l'analyse du réseau, j'ai tracé une fonction de distribution cumulative complémentaire (CCDF) des degrés de réseau. Ce que j'ai trouvé, c'est que, contrairement aux distributions de réseau conventionnelles …
Si je comprends bien, j'ai besoin de connaître au moins trois aspects (sur quatre) de mon étude proposée afin d'effectuer une analyse de puissance, à savoir: type de test - J'ai l'intention d'utiliser r et ANCOVA / Regression de Pearson - GLM niveau de signification (alpha) - J'ai l'intention d'utiliser …
Lorsque vous essayez de sélectionner parmi différents modèles ou le nombre de fonctionnalités à inclure, disons la prédiction, je peux penser à deux approches. Divisez les données en ensembles de formation et de test. Mieux encore, utilisez le bootstrapping ou la validation croisée k-fold. Entraînez-vous à chaque fois sur l'ensemble …
J'ai plusieurs questions étroitement liées concernant les apprenants faibles dans l'apprentissage d'ensemble (par exemple, le renforcement). Cela peut sembler stupide, mais quels sont les avantages d'utiliser des apprenants faibles plutôt que des apprenants forts? (par exemple, pourquoi ne pas booster avec des méthodes d'apprentissage "fortes"?) Existe-t-il une sorte de force …
Le contexte: Au fil du temps, j'ai acquis un ensemble d'heuristiques sur la façon de tracer efficacement l'association entre deux variables numériques. J'imagine que la plupart des gens qui travaillent avec des données auraient un ensemble de règles similaire. Des exemples de telles règles peuvent être: Si l'une des variables …
J'ai une question concernant les variables aléatoires. Supposons que nous avons deux variables aléatoires XXX et YYY . Disons que XXX est Poisson distribué avec le paramètre λ1λ1\lambda_1 , et YYY est Poisson distribué avec le paramètre .λ2λ2\lambda_2 Lorsque vous construisez la fracture à partir de et appelez cela une …
Le coefficient de Pearson entre deux variables est assez élevé (r = 0,65). Mais lorsque je classe les valeurs des variables et que j'exécute une corrélation de Spearman, la valeur du café est beaucoup plus faible (r = 0,30). Quelle est l'interprétation de cela?
Je pensais que queue lourde = queue grasse, mais certains articles que j'ai lus m'ont donné l'impression qu'ils ne le sont pas. L'un d'eux dit: queue lourde signifie que la distribution a un instant j infini pour un entier j. De plus, tous les dfs dans le domaine en pot …
J'essayais d'ajuster une série de données temporelles (sans répliques) en utilisant un modèle de régression. Les données se présentent comme suit: > xx.2 value time treat 1 8.788269 1 0 2 7.964719 6 0 3 8.204051 12 0 4 9.041368 24 0 5 8.181555 48 0 6 8.041419 96 0 …
Vous pouvez utiliser le jeu de données de décathlon {FactoMineR} pour le reproduire. La question est de savoir pourquoi les valeurs propres calculées diffèrent de celles de la matrice de covariance. Voici les valeurs propres en utilisant princomp: > library(FactoMineR);data(decathlon) > pr <- princomp(decathlon[1:10], cor=F) > pr$sd^2 Comp.1 Comp.2 Comp.3 …
Quelqu'un a-t-il tenté de prédire des séries chronologiques en utilisant la régression des vecteurs de support? Je comprends les machines à vecteurs de support et je comprends partiellement la régression des vecteurs de support, mais je ne comprends pas comment elles peuvent être utilisées pour modéliser des séries chronologiques, en …
Supposons que j'ai le modèle suivant yi=f(xi,θ)+εiyi=f(xi,θ)+εiy_i=f(x_i,\theta)+\varepsilon_i où yi∈RKyi∈RKy_i\in \mathbb{R}^K , xixix_i est un vecteur de variables explicatives, θθ\theta est les paramètres de la fonction non linéaire fff et εi∼N(0,Σ)εi∼N(0,Σ)\varepsilon_i\sim N(0,\Sigma) , où ΣΣ\Sigma est naturellement la matrice K×KK×KK\times K Le but est l'habituel d'estimer θθ\theta et ΣΣ\Sigma . Le …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.