Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
La statistique est partout. L’usage courant de termes statistiques est cependant souvent flou. Les termes probabilité et probabilité sont utilisés de manière interchangeable en anglais profane malgré leurs expressions mathématiques bien définies et différentes. Ne pas séparer le terme probabilité de probabilité confond systématiquement les médecins qui tentent de quantifier …
J'aimerais connaître votre avis sur les différences entre la validation croisée et l’amorçage pour estimer l’erreur de prédiction. Est-ce qu'on travaille mieux pour de petites tailles de données ou de grands ensembles de données?
J'ai récemment posé une question sur les principes généraux régissant l' examen des statistiques dans les journaux . Ce que je voudrais maintenant demander, c’est ce qui vous énerve particulièrement lorsque vous examinez un document, c’est-à-dire quel est le meilleur moyen d’ennuyer vraiment un arbitre de statistique! Un exemple par …
Dans un modèle linéaire simple avec une seule variable explicative, αi=β0+β1δi+ϵiαi=β0+β1δi+ϵi\alpha_i = \beta_0 + \beta_1 \delta_i + \epsilon_i Je trouve que la suppression du terme d'interception améliore grandement l'ajustement (la valeur de va de 0,3 à 0,9). Cependant, le terme d'interception semble être statistiquement significatif.R2R2R^2 Avec interception: Call: lm(formula = …
Supposons que nous ayons un ensemble d’entraînement pour . Supposons également que nous exécutions un type d'algorithme d'apprentissage supervisé sur l'ensemble d'apprentissage. Les hypothèses sont représentées par . Nous devons trouver les paramètres qui minimisent la "distance" entre et . Soit(x(i),y(i))(x(i),y(i))(x_{(i)}, y_{(i)})i=1,…,mi=1,…,mi = 1, \dots, mhθ(x(i))=θ0+θ1x(i)1+⋯+θnx(i)nhθ(x(i))=θ0+θ1x(i)1+⋯+θnx(i)nh_{\theta}(x_{(i)}) = \theta_0+\theta_{1}x_{(i)1} + \cdots …
Nous avons déjà plusieurs threads étiquetés en tant que valeurs p qui révèlent beaucoup de malentendus à leur sujet. Il y a dix mois, nous avions un fil de discussion sur une revue psychologique qui "interdisait" les valeurs-ppp p ; à présent, l' American Statistical Association (2016) affirme qu'avec notre …
J'ai commencé par Time Series Analysis de Hamilton, mais je suis désespérément perdu. Ce livre est vraiment trop théorique pour que je puisse l’apprendre par moi-même. Quelqu'un a-t-il une recommandation pour un manuel d'analyse de séries chronologiques qui convient à l'auto-apprentissage?
Je travaille sur une nouvelle méthode d'analyse et d'analyse de jeux de données pour identifier et isoler les sous-groupes d'une population sans connaître à l'avance les caractéristiques d'aucun sous-groupe. Bien que la méthode fonctionne assez bien avec des échantillons de données artificiels (c'est-à-dire des ensembles de données créés spécifiquement dans …
Je suis très novice en statistique et j'apprends à comprendre les bases, y compris les valeurs . Mais il y a un grand point d'interrogation dans mon esprit en ce moment et j'espère que ma compréhension est fausse. Voici mon processus de pensée:ppp Toutes les recherches dans le monde ne …
De nombreux classificateurs d'apprentissage machine (par exemple, les machines à vecteurs de support) permettent de spécifier un noyau. Quelle serait une manière intuitive d'expliquer ce qu'est un noyau? Un aspect auquel j'ai pensé est la distinction entre les noyaux linéaires et non linéaires. En termes simples, je pourrais parler de …
Quelqu'un peut-il expliquer les principales différences entre les arbres d'inférence conditionnels ( ctreedu partypaquet dans R) par rapport aux algorithmes d'arbre de décision plus traditionnels (comme rpartdans R)? Qu'est-ce qui différencie les arbres en CI? Forces et faiblesses? Mise à jour: J'ai examiné le document de Horthorn et al auquel …
Le coefficient de corrélation de Pearson de x et y est le même, que vous calculiez pearson (x, y) ou pearson (y, x). Cela suggère que faire une régression linéaire de y étant donné x ou x étant donné y devrait être la même chose, mais je ne pense pas …
Je lis les livres sur la régression linéaire. Il y a quelques phrases sur les normes L1 et L2. Je les connais, mais je ne comprends pas pourquoi la norme L1 pour les modèles clairsemés. Quelqu'un peut utiliser donner une explication simple?
Comment expliqueriez-vous intuitivement ce qu'est une racine unitaire dans le contexte du test de la racine unitaire? Je pense à des façons d’expliquer un peu ce que j’ai fondé dans cette question . Le cas de racine unitaire est que je sais (peu en passant) que le test de racine …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.