Beaucoup de questions / réponses sur ce site pourraient donner des idées pour de bonnes questions. Je vais vous donner une liste avec des liens de ce type que je pense être bons. Les messages pour lesquels j'ai répondu sont surreprésentés, car je les connais mieux, pas parce qu'ils sont nécessairement les meilleurs! Je donne de brefs commentaires à chaque lien afin que vous puissiez décider si vous souhaitez suivre le lien.
Quelle est l'intuition derrière SVD? "Pouvez-vous expliquer à l'un de nos clients comment fonctionne le SVD?"
Estimation du maximum de vraisemblance (MLE) en termes simples "Pouvez-vous expliquer en langage non technique l'idée de l'estimation du maximum de vraisemblance?"
Taleb et le cygne noir "Dites-moi, qu'est-ce qu'un cygne noir, et pourquoi est-ce pertinent? Quand est-il pertinent?"
Inférence statistique lorsque l'échantillon "est" la population "Que pouvez-vous dire de l'inférence statistique lorsque l'échantillon est constitué de la population entière?"
Qualité de l'ajustement et modèle de choix de la régression linéaire ou de Poisson "Nous avons un problème de régression dans lequel la réponse est une variable de comptage. Que choisiriez-vous dans ce contexte, les moindres carrés ordinaires ou la régression de Poisson (ou peut-être une autre)? Expliquez votre choix , quelles sont les principales différences entre ces modèles? "
Quelle est la différence entre variance finie et variance infinie "Pouvez-vous expliquer, dans un langage aussi simple que possible, ce que signifie pour une variable aléatoire une espérance infinie ou une variance infinie? Quelle est l’importance pratique de cette distinction? Expliquez avec un exemple."
Quelles sont les alternatives modernes et facilement utilisables à la régression pas à pas? "Comment construiriez-vous un modèle de régression complexe lorsqu'il existe de nombreuses variables prédictives possibles? Décrivez les différentes stratégies possibles et décrivez les problèmes qui se posent avec chacune d'elles"
Comment gérer la séparation parfaite dans la régression logistique? "Quel est le problème de la séparation dans la régression logistique, ses causes, ses symptômes? Que pouvez-vous faire pour le résoudre, si c'est vraiment un problème?"
Pourquoi la matrice de corrélation doit-elle être positive semi-définie et que signifie-t-elle être ou ne pas être positive semi-définie? et
Que me dit une matrice de covariance définie non positive sur mes données? "Expliquez pourquoi une matrice de covariance doit être positive (semi) définie et ce que cela signifie. Comment utiliser ce fait?"
Quelles sont les versions multidimensionnelles de la médiane "Pouvez-vous proposer un moyen de généraliser la médiane aux données multivariées?"
Interprétation des termes d'interaction dans la régression logit avec des variables catégorielles et Quelles sont les meilleures pratiques d'identification des effets d'interaction? et Deux effets principaux négatifs et un effet d’interaction positif? et Inclure l'interaction mais pas les effets principaux dans un modèle et Comment interpréter les effets principaux lorsque l'effet d'interaction n'est pas significatif? "Expliquez ce que l'on entend par interaction dans les modèles de régression. Plus précisément, qu'est-ce que cela signifie si l'interaction est significative alors que les effets principaux ne le sont pas? Existe-t-il une différence d'interprétation de l'interaction entre régression linéaire ordinaire et régression logistique?"
Quelle pourrait être la raison d'utiliser la transformation de racine carrée sur les données? et Transformation de données appropriée "Quand, comment et pourquoi transformez-vous la variable de réponse en un modèle de régression (ou ANOVA)? Existe-t-il des alternatives?
Puis-je faire confiance aux résultats de l'ANOVA pour une DV non distribuée normalement? "Comment traiteriez-vous une ANOVA avec des résidus non normaux?
Pourquoi les statistiques sont-elles utiles quand beaucoup de choses qui importent sont des choses à un coup?
Comment modéliser efficacement la somme des variables aléatoires de Bernoulli?
Quand utiliser les équations d'estimation généralisées par rapport aux modèles à effets mixtes?
Que se passe-t-il ici lorsque j'utilise la perte au carré dans la régression logistique? "Pourquoi utilisons-nous la probabilité maximale pour la régression logistique? Pourquoi pas les moindres carrés?"