Contexte
Il y a beaucoup de discussions à ce sujet, alors j'ai pensé que je pourrais trouver ma réponse à partir des pas précédents sur StackExchange et en cherchant furieusement. Après avoir utilisé une demi-journée à essayer de trouver un seul ouvrage de référence pour les (bio) statistiques avec R, je suis devenu complètement confus et j'ai dû abandonner. Peut-être que le matériel gratuit combiné est en fait meilleur que tous les livres que vous pouvez acheter en ce moment. Voyons-le.
Internet regorge d'une bonne littérature gratuite pour la langue R , il est donc inutile de payer pour un livre médiocre, qui finit par être utilisé comme décoration de bureau la plupart du temps. Le site d'accueil de R répertorie les livres liés à R et il y en a beaucoup. Pour être plus précis: 115. Un seul d'entre eux est annoncé avec les mots « livre de référence des statistiques autonomes ». Il a maintenant 8 ans et peut être obsolète. La quatrième édition de Modern Applied Statistics with S est encore plus ancienne. Le R Book est souvent mâché car trop basique et déconseillé en raison du manque de références, d'un code mal formaté et d'une finition bâclée.
Cependant, je recherche un livre , que je pourrais utiliser comme référence autonome aux statistiques pratiques (avant tout) avec R (secondaire). Le livre devrait rester sur mon bureau, collectant des annotations, des taches de café et des empreintes digitales graisseuses au lieu de la poussière sur l'étagère. Il devrait remplacer la collection de pdf gratuits que j'utilisais jusqu'à présent, sans oublier que R est livré avec une excellente bibliothèque de référence. « Quelle est la bonne approche? »,« Pourquoi? "et" techniquement, comment ça marche? "sont souvent des questions plus brûlantes que" comment faire avec R? "
Depuis que je suis écologiste, je m'intéresse principalement aux applications en biostatistique. Cependant, comme ces choses sont souvent liées, une référence générale interdisciplinaire serait la plus précieuse pour moi.
La tâche
Si un tel livre existe (j'en doute), veuillez fournir le nom du livre (un seul par réponse) et une brève revue du livre expliquant pourquoi il devrait être nommé livre de référence pour le sujet. Puisque cette question n'est pas très différente des questions existantes, veuillez utiliser cette bande de roulement pour votre réponse. Vous pouvez également répertorier les défauts du livre afin que nous puissions les répertorier comme caractéristiques du livre de référence idéal.
Ma question est ce que devrait contenir le livre de référence pour les statistiques (des types les plus utilisés) avec R?
Quelques réflexions initiales suivent les caractéristiques générales (veuillez mettre à jour):
- Épais comme une brique
- Concis, mais compréhensible
- Rempli de chiffres (avec le code R fourni)
- Tableaux et diagrammes faciles à comprendre décrivant les détails les plus importants du texte
- Texte descriptif facile à comprendre sur les statistiques / méthodes contenant les équations les plus importantes.
- De bons exemples pour chaque approche (avec code R)
- Liste de références large et à jour
- Nombre minimal de fautes de frappe
Table des matières
Comme je ne suis pas statisticien et que j'aurais besoin de ce livre (qui n'existe pas?) Pour répondre à la question, il m'est difficile d'écrire sur le contenu. Parce que The R Book a clairement l'intention d'être le livre de référence pour les statistiques avec R, mais est souvent critiqué, j'ai copié la table des matières du livre comme point de départ pour la table des matières du livre de référence autonome des statistiques R. Tâche supplémentaire: veuillez fournir des ajouts, des suggestions, des suppressions, etc. pour la table des matières.
- Commencer
- Essentiels du langage R
- Entrée de données
- Cadres de données
- Graphique
- les tables
- Mathématiques
- Tests classiques
- Modélisation statistique
- Régression
- Analyse de la variance
- Analyse de covariance
- Modèles linéaires généralisés
- Compter les données
- Compter les données dans les tableaux
- Données de proportion
- Variables de réponse binaire
- Modèles additifs généralisés
- Modèles à effets mixtes
- Régression non linéaire
- Modèles d'arbres
- Analyse des séries chronologiques
- Statistiques multivariées
- Statistiques spatiales
- Analyse de survie
- Modèles de simulation
- Changer l'apparence des graphiques
- Références et lectures complémentaires
- Indice
Qu'est-ce qui a été dit plus tôt?
StackExhange contient plusieurs bandes de roulement demandant des statistiques et des suggestions de livres R. Books for learning the R language pose des questions sur un ouvrage de référence sur l'apprentissage du langage R sans aspect statistique. L'art de la programmation R est classé comme la meilleure suggestion unique. Book to Learn Statistics utilisant R demande un livre d'introduction idéal aux statistiques, ce qui n'est vraiment pas la même chose qu'un livre de référence. Les manuels statistiques Open Source classent les statistiques multivariées avec R comme meilleure alternative. Quel livre recommanderiez-vous aux scientifiques non statisticiens? pose des questions sur le meilleur ouvrage de référence sur les statistiques sans préciser le programme de son choix.Référence ou livre sur la simulation des données de conception expérimentale dans les scores R peut-être le plus proche de ma question. Introduction à la programmation scientifique et à la simulation L'utilisation de R est le livre le plus recommandé ici et pourrait être proche de ce que je recherche. Cependant, ce livre ne suffira pas non plus comme un seul ouvrage de référence pour les statistiques avec R.
Quelques suggestions pour le livre de référence et leurs défauts
R in Action a reçu de meilleures critiques que The R Book, mais il est apparemment plutôt introductif .
Conception et analyse biostatistiques à l'aide de R: un guide pratique est peut-être proche de ce que je recherche. Il a reçu une bonne critique , mais apparemment, celui-ci contient également de nombreuses fautes de frappe. De plus, ce livre ne se concentre pas sur l'explication des statistiques, mais donne plutôt des analyses statistiques sous forme de recettes prêtes à l'emploi pour les chercheurs.
Les modèles et données écologiques en R sautent le niveau d'introduction. C'est une fonctionnalité très utile vu que le mot "introduction", marque 43 occurrences dans la liste du livre R , mais peut-être pas entièrement satisfaisant, si nous recherchons le livre de référence pour les statistiques…?
Introduction à la programmation scientifique et à la simulation L'utilisation de R a reçu une critique très positive , mais se limite à la simulation de données.
Richiemorrisroe suggère que les statistiques appliquées modernes avec S sont suffisantes pour un livre de référence de statistiques autonome avec R. Ce livre a reçu d'excellentes critiques ( 1 , 2 ) et est probablement le meilleur candidat pour le titre en ce moment? La version la plus récente est sortie il y a 10 ans, ce qui est assez long compte tenu du développement du programme.
Dimitriy V. Masterov suggère l' analyse des données à l'aide de modèles de régression et multiniveaux / hiérarchiques . Je n'ai pas encore vérifié ce livre.
Après avoir lu de nombreuses critiques de livres, il semble évident que le livre parfait demandé ici n'existe pas encore. Cependant, il est peut-être possible d'en choisir un qui est assez proche. Cette bande de roulement est conçue comme un wiki communautaire pour les utilisateurs de statistiques afin de trouver le meilleur livre de référence existant et comme une motivation pour les écrivains nouveaux et anciens pour améliorer leur travail.