Statistiques et Big Data references

3

Bons livres / articles sur la notation du crédit

Je recherche des recommandations de livres sur la notation du crédit. Je suis intéressé par tous les aspects de ce problème, mais surtout par: 1) Les bonnes fonctionnalités. Comment les construire? Lesquels se sont révélés bons? 2) Réseaux de neurones. Leur application au problème de notation de crédit. 3) J'ai …

11 references finance credit-scoring

3

Bons livres couvrant le prétraitement des données et les techniques de détection des valeurs aberrantes

Comme son titre l'indique, quelqu'un connaît-il un bon livre à jour qui couvre le prétraitement des données en général et en particulier les techniques de détection des valeurs aberrantes? Le livre n'a pas besoin de se concentrer exclusivement sur cela, mais il devrait traiter de manière exhaustive les sujets susmentionnés …

11 dataset data-mining references outliers

4

Quelles sont les bonnes ressources fournissant un historique des statistiques?

Quelles sont les bonnes ressources en ligne ou hors ligne qui donnent un aperçu de l'historique des statistiques et de la principale percée statistique jusqu'à présent? J'ai lu la page sur l' histoire des statistiques sur Wikipédia .

11 references history

4

Ressources en ligne pour la philosophie de la causalité pour l'inférence causale

Pouvez-vous recommander des livres, des articles, des essais, des tutoriels / cours en ligne, etc. qui seraient intéressants et utiles pour un épidémiologiste / biostatisticien pour en apprendre davantage sur la philosophie de la causalité / inférence causale? Je connais assez bien la réalité de l'inférence causale à partir d'un …

11 references causality philosophical

2

Justifications d'un modèle à effets fixes vs à effets aléatoires en méta-analyse

J'ai lu plusieurs publications tentant de justifier l'utilisation d'un modèle à effets fixes avec des affirmations du type "le modèle à effets fixes a été choisi parce que l'hétérogénéité était faible". Cependant, je crains qu'il ne s'agisse toujours d'une approche inappropriée de l'analyse des données. Y a-t-il des raisons ou …

10 references meta-analysis meta-analysis-fixed-effects meta-analysis-random-effects

1

Preuves de premier cycle du théorème de Pitman – Koopman – Darmois

Le théorème de Pitman – Koopman – Darmois dit que si un échantillon iid d'une famille paramétrée de distributions de probabilité admet une statistique suffisante dont le nombre de composantes scalaires ne croît pas avec la taille de l'échantillon, alors c'est une famille exponentielle. Existe-t-il des manuels ou des documents …

10 mathematical-statistics references

2

Quels sont les «premiers articles» les plus importants sur les méthodes de régularisation?

Dans plusieurs réponses, j'ai vu des utilisateurs de CrossValidated suggérer à OP de trouver les premiers articles sur Lasso, Ridge et Elastic Net. Pour la postérité, quelles sont les œuvres phares sur Lasso, Ridge et Elastic Net?

10 references lasso regularization ridge-regression elastic-net

2

Demande de référence: statistiques classiques pour les scientifiques travaillant sur les données

Je suis un scientifique des données travaillant avec une solide expérience en régression, en autres algorithmes de type d'apprentissage automatique et en programmation (à la fois pour l'analyse de données et le développement de logiciels en général). La majeure partie de ma vie professionnelle s'est concentrée sur la création de …

10 hypothesis-testing references frequentist inference

2

L'analyse des composantes principales peut-elle être utilisée sur les cours des actions / données non stationnaires?

Je lis un exemple donné dans le livre, Machine Learning for Hackers . Je vais d'abord développer l'exemple, puis parler de ma question. Exemple : Prend un ensemble de données pour 10 ans de 25 actions. Exécute PCA sur les 25 cours de bourse. Compare la composante principale avec l'indice …

10 time-series pca references covariance stationarity

2

Que dire des modèles de données d'observation en l'absence d'instruments?

J'ai eu dans le passé un certain nombre de questions posées à mon sujet concernant des articles publiés dans un certain nombre de domaines où des régressions (et des modèles connexes, tels que des modèles de panel ou des GLM) sont utilisées sur des données d'observation (c'est-à-dire des données non …

10 regression references instrumental-variables observational-study

1

Références: Queue du cdf inverse

Je suis presque sûr d'avoir déjà vu le résultat suivant dans les statistiques mais je ne me souviens pas où. Si est une variable aléatoire positive et alors lorsque , où est le cdf de .E ( X ) < ∞ ε F - 1 ( 1 - ε ) …

10 references quantiles cdf moments

1

Existe-t-il un «standard» pour la notation des modèles statistiques?

Dans, par exemple, le manuel BUGS ou le prochain livre de Lee et Wagenmakers ( pdf ) et dans de nombreux autres endroits, un type de notation est utilisé qui me semble très flexible en ce qu'il peut être utilisé pour décrire succinctement la plupart des modèles statistiques. Un exemple …

10 references model notation

1

Théorèmes généraux de cohérence et de normalité asymptotique du maximum de vraisemblance

Je suis intéressé par une bonne référence pour les résultats concernant les propriétés asymptotiques des estimateurs du maximum de vraisemblance. Considérons un modèle où est une densité à dimensions, et est le MLE basé sur un exemple de où est la "vraie" valeur de . Il y a deux irrégularités …

10 maximum-likelihood references

1

Étude de la robustesse de la régression logistique contre la violation de la linéarité du logit

Je procède à une régression logistique avec un résultat binaire (démarrage et non démarrage). Ma combinaison de prédicteurs sont toutes des variables continues ou dichotomiques. En utilisant l'approche Box-Tidwell, l'un de mes prédicteurs continus viole potentiellement l'hypothèse de linéarité du logit. Rien dans les statistiques de qualité de l'ajustement n'indique …

10 regression logistic references assumptions robust

3

Comment obtenir l'intervalle de confiance sur le changement du carré de la population

Pour un exemple simple, supposons qu'il existe deux modèles de régression linéaire Modèle 1 a trois prédicteurs, x1a, x2betx2c Le modèle 2 a trois prédicteurs du modèle 1 et deux prédicteurs supplémentaires x2aetx2b Il existe une équation de régression de la population où la variance de la population expliquée est …

10 regression confidence-interval estimation r-squared shrinkage anova t-test references tukey-hsd machine-learning boosting r clustering fishers-exact generalized-linear-model model probit link-function r survival probability distributions dice logistic lme4-nlme glmm meta-analysis distributions distributions factor-analysis r anova repeated-measures post-hoc

Questions marquées «references»