Questions à la recherche de références externes (livres, articles, etc.) sur un sujet particulier. Utilisez toujours en plus une balise plus spécifique.
Je recherche des recommandations de livres sur la notation du crédit. Je suis intéressé par tous les aspects de ce problème, mais surtout par: 1) Les bonnes fonctionnalités. Comment les construire? Lesquels se sont révélés bons? 2) Réseaux de neurones. Leur application au problème de notation de crédit. 3) J'ai …
Comme son titre l'indique, quelqu'un connaît-il un bon livre à jour qui couvre le prétraitement des données en général et en particulier les techniques de détection des valeurs aberrantes? Le livre n'a pas besoin de se concentrer exclusivement sur cela, mais il devrait traiter de manière exhaustive les sujets susmentionnés …
Quelles sont les bonnes ressources en ligne ou hors ligne qui donnent un aperçu de l'historique des statistiques et de la principale percée statistique jusqu'à présent? J'ai lu la page sur l' histoire des statistiques sur Wikipédia .
Pouvez-vous recommander des livres, des articles, des essais, des tutoriels / cours en ligne, etc. qui seraient intéressants et utiles pour un épidémiologiste / biostatisticien pour en apprendre davantage sur la philosophie de la causalité / inférence causale? Je connais assez bien la réalité de l'inférence causale à partir d'un …
J'ai lu plusieurs publications tentant de justifier l'utilisation d'un modèle à effets fixes avec des affirmations du type "le modèle à effets fixes a été choisi parce que l'hétérogénéité était faible". Cependant, je crains qu'il ne s'agisse toujours d'une approche inappropriée de l'analyse des données. Y a-t-il des raisons ou …
Le théorème de Pitman – Koopman – Darmois dit que si un échantillon iid d'une famille paramétrée de distributions de probabilité admet une statistique suffisante dont le nombre de composantes scalaires ne croît pas avec la taille de l'échantillon, alors c'est une famille exponentielle. Existe-t-il des manuels ou des documents …
Dans plusieurs réponses, j'ai vu des utilisateurs de CrossValidated suggérer à OP de trouver les premiers articles sur Lasso, Ridge et Elastic Net. Pour la postérité, quelles sont les œuvres phares sur Lasso, Ridge et Elastic Net?
Je suis un scientifique des données travaillant avec une solide expérience en régression, en autres algorithmes de type d'apprentissage automatique et en programmation (à la fois pour l'analyse de données et le développement de logiciels en général). La majeure partie de ma vie professionnelle s'est concentrée sur la création de …
Je lis un exemple donné dans le livre, Machine Learning for Hackers . Je vais d'abord développer l'exemple, puis parler de ma question. Exemple : Prend un ensemble de données pour 10 ans de 25 actions. Exécute PCA sur les 25 cours de bourse. Compare la composante principale avec l'indice …
J'ai eu dans le passé un certain nombre de questions posées à mon sujet concernant des articles publiés dans un certain nombre de domaines où des régressions (et des modèles connexes, tels que des modèles de panel ou des GLM) sont utilisées sur des données d'observation (c'est-à-dire des données non …
Je suis presque sûr d'avoir déjà vu le résultat suivant dans les statistiques mais je ne me souviens pas où. Si est une variable aléatoire positive et alors lorsque , où est le cdf de .E ( X ) < ∞ ε F - 1 ( 1 - ε ) …
Dans, par exemple, le manuel BUGS ou le prochain livre de Lee et Wagenmakers ( pdf ) et dans de nombreux autres endroits, un type de notation est utilisé qui me semble très flexible en ce qu'il peut être utilisé pour décrire succinctement la plupart des modèles statistiques. Un exemple …
Je suis intéressé par une bonne référence pour les résultats concernant les propriétés asymptotiques des estimateurs du maximum de vraisemblance. Considérons un modèle où est une densité à dimensions, et est le MLE basé sur un exemple de où est la "vraie" valeur de . Il y a deux irrégularités …
Je procède à une régression logistique avec un résultat binaire (démarrage et non démarrage). Ma combinaison de prédicteurs sont toutes des variables continues ou dichotomiques. En utilisant l'approche Box-Tidwell, l'un de mes prédicteurs continus viole potentiellement l'hypothèse de linéarité du logit. Rien dans les statistiques de qualité de l'ajustement n'indique …
Pour un exemple simple, supposons qu'il existe deux modèles de régression linéaire Modèle 1 a trois prédicteurs, x1a, x2betx2c Le modèle 2 a trois prédicteurs du modèle 1 et deux prédicteurs supplémentaires x2aetx2b Il existe une équation de régression de la population où la variance de la population expliquée est …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.