Je ne pense pas que je serai en mesure de consacrer régulièrement du temps à continuer à apprendre l'analyse des données
Je ne pense pas que Casella & Berger soit un endroit pour apprendre beaucoup de données en termes d' analyse de données . C'est un endroit pour apprendre certains des outils de la théorie statistique.
Mon expérience jusqu'à présent me disant d'être un statisticien doit supporter de nombreux calculs fastidieux impliquant diverses distributions (Weibull, Cauchy, t, F ...).
J'ai passé beaucoup de temps en tant que statisticien à analyser des données. Cela m'implique rarement (presque jamais) de faire des calculs fastidieux. Cela implique parfois une petite algèbre simple, mais les problèmes communs sont généralement résolus et je n'ai pas besoin de déployer des efforts pour les reproduire à chaque fois.
L'ordinateur fait tout le calcul fastidieux.
Si je suis dans une situation où je ne suis pas prêt à assumer un cas raisonnablement standard (par exemple, je ne suis pas prêt à utiliser un GLM), je n'ai généralement pas assez d'informations pour assumer une autre distribution non plus, donc la question des calculs dans LRT est généralement théorique (je peux les faire quand j'en ai besoin, ils ont juste tendance à être déjà résolus ou à arriver si rarement que c'est une diversion intéressante).
J'ai tendance à faire beaucoup de simulation; J'essaie également fréquemment d'utiliser le rééchantillonnage sous une forme quelconque, à côté ou à la place d'hypothèses paramétriques.
Dois-je y consacrer plus de 20 heures par semaine comme je le faisais auparavant?
Cela dépend de ce que vous voulez pouvoir faire et de la rapidité avec laquelle vous voulez vous perfectionner.
L'analyse des données est une compétence qui nécessite de la pratique et une large base de connaissances. Vous aurez déjà certaines des connaissances dont vous avez besoin.
Si vous voulez être un bon pratiquant dans une grande variété de choses, cela prendra beaucoup de temps - mais à mon avis, c'est beaucoup plus amusant que l'algèbre et ainsi de faire des exercices de Casella et Berger.
Certaines des compétences que j'ai développées disent que les problèmes de régression sont utiles avec les séries chronologiques, par exemple - mais beaucoup de nouvelles compétences sont nécessaires. Donc, apprendre à interpréter les graphiques résiduels et les graphiques QQ est pratique, mais ils ne me disent pas à quel point je dois m'inquiéter d'une petite bosse dans un graphique PACF et ne me donnent pas d'outils comme l'utilisation de la prédiction à une étape. les erreurs.
Ainsi, par exemple, je n'ai pas besoin de déployer des efforts pour déterminer comment faire raisonnablement du ML pour les modèles gamma ou weibull typiques , car ils sont suffisamment standard pour résoudre des problèmes qui ont déjà été largement mis sous une forme pratique.
Si vous venez pour faire des recherches , vous aurez besoin de beaucoup plus de compétences que vous acquérez dans des endroits comme Casella & Berger (mais même avec ce genre de compétences, vous devriez également lire plus d'un livre).
Quelques suggestions:
Vous devez absolument développer des compétences de régression, même si vous ne faites rien d'autre.
Il existe un certain nombre de très bons livres, mais peut-être Draper & Smith Applied Regression Analysis plus Fox and Weisberg An R Companion to Applied Regression ; Je vous suggère également d'envisager de suivre les stratégies de modélisation de la régression de Harrell
(Vous pouvez remplacer n'importe quel bon livre par Draper et Smith - trouvez-en un ou deux qui vous conviennent.)
Le deuxième livre a un certain nombre de chapitres supplémentaires en ligne qui valent vraiment la peine d'être lus (et son propre R-package)
-
Une bonne deuxième portion serait Venables et Ripley statistique appliquée moderne avec S .
C'est une mise à la terre dans un éventail assez large d'idées.
Il se peut que vous ayez besoin de plus de matériel de base dans certains sujets (je ne connais pas votre parcours).
Ensuite, vous devez commencer à réfléchir aux domaines de statistiques que vous souhaitez / avez besoin - statistiques bayésiennes, séries chronologiques, analyse multivariée, etc., etc.