Livre pour une vue d'ensemble large et conceptuelle des méthodes statistiques


12

Je suis très intéressé par le potentiel de l'analyse statistique pour la simulation / prévision / estimation de fonction, etc.

Cependant, je n'en sais pas grand-chose et mes connaissances mathématiques sont encore assez limitées - je suis un étudiant de premier cycle en génie logiciel.

Je cherche un livre qui me permettrait de commencer sur certaines choses que je continue de lire: la régression linéaire et d'autres types de régression, les méthodes bayésiennes, les méthodes de monte carlo, l'apprentissage automatique, etc. Je veux aussi commencer avec R donc si il y avait un livre qui combinait les deux, ce serait génial.

De préférence, je voudrais que le livre explique les choses conceptuellement et pas trop en détails techniques - je voudrais que les statistiques soient très intuitives pour moi, car je comprends qu'il y a beaucoup d'embûches risquées dans les statistiques.

Je suis bien sûr disposé à lire plus de livres pour améliorer ma compréhension des sujets que je juge précieux.

Réponses:


11
  • Vous aimeriez peut-être quelque chose comme l' analyse des données et les graphiques utilisant R: une approche basée sur des exemples par John Maindonald et W. John Braun

    • Site Web pour le livre
    • Amazon avec des critiques assorties
    • Je le recommande car le livre coche quelques-unes de vos cases; ça enseigne un peu de R; il donne un aperçu d'une gamme de différentes techniques de modélisation (par exemple, régression multiple, séries chronologiques, graphiques, modèle linéaire généralisé, etc.) sans entrer dans trop de détails mathématiques; c'est assez appliqué.
  • Je suis d'accord avec @Greg Snow que vous feriez mieux de penser en termes de lecture d'un certain nombre de livres différents. Pour chaque sujet que vous avez mentionné (par exemple, statistiques bayésiennes, séries chronologiques, simulations, R, apprentissage automatique), il existe de bons livres dédiés à ce sujet particulier. Vous voudrez peut-être poser des questions distinctes sur ce qui serait un bon livre compte tenu de vos intérêts particuliers dans ce sujet.

  • Bonnes options en ligne disponibles gratuitement

    • Elements of Statistical Learning est un excellent livre et est même disponible en ligne gratuitement. De votre message, j'ai l'impression que cela pourrait être un peu plus technique que vous le souhaitez au début, mais vérifiez-le et voyez ce que vous en pensez. Peut-être que vous y serez prêt maintenant; peut-être plus tard.
    • Les modèles et données écologiques de Benjamin Bolker en R en sont un autre bon. C'est du point de vue de l'écologie, mais cela explique clairement la simulation et l'ajustement du modèle d'un point de vue relativement non technique; et tout est implémenté dans R. Vous pouvez voir tout son code R sur le site Web. Vous pouvez même voir les documents Sweave utilisés pour générer le livre!
    • Il y a une bonne liste de documentation R gratuite sur CRAN avec certains des documents fournissant également des instructions plus larges sur les statistiques.

5

Un seul livre qui inclurait tous ces sujets serait assez impressionnant et pèserait probablement plus que vous. C'est comme demander un seul livre qui enseigne la programmation de base, C, Java, Perl et la conception de bases de données avancées dans un seul livre (en fait probablement plus, mais je ne connais pas assez de termes générateurs de logiciels pour en ajouter d'autres plus avancés) .

La régression elle-même est généralement au moins un cours universitaire complet, les statistiques bayésiennes nécessitent un cours ou 2 de théorie avant de suivre le cours bayésien pour bien comprendre, etc.

Il n'y a pas de chemin rapide et facile vers ce que vous essayez de faire. Je suggérerais de prendre de bons cours dans votre université et de travailler à partir de là.

Il y a eu d'autres discussions sur de bons livres que vous pouvez consulter pour trouver des idées.


Merci pour votre réponse. Cependant, je n'essaie pas de tout comprendre sur tout à partir d'un seul livre, mais lire disons, 50 pages sur la régression m'aideraient certainement beaucoup à avoir au moins une compréhension raisonnable de ce sujet ...
Jérôme Le Chatelier

5

Pour une combinaison de R avec de nombreuses méthodes que vous décrivez, en plus du texte de Maindonald et Braun mentionné par @ Jeromy Anglim, je vous suggère de jeter un œil à ces deux livres de Julian Faraway:

Les deux ont des introductions raisonnablement simples aux divers sujets, ce dernier couvre un large éventail d'approches plus modernes de la régression, y compris de nombreuses techniques d'apprentissage automatique, mais le fait à un rythme plus rapide avec moins de description, et les deux illustrent les techniques via le code R.

Vous pouvez obtenir un code sur la section Livres du site Web R pour vous donner 20% de réduction sur le prix public conseillé si vous achetez directement auprès de Chapman & Hall / CRC Press, mais vérifiez le prix Amazon ou similaire pour votre région car souvent la réduction sur Amazon est compétitive avec celui du prix de l'éditeur après la remise.

L'une des bonnes choses à propos de cette paire de livres est qu'ils vous donnent une bonne idée des méthodes modernes avec suffisamment de détails pour explorer ensuite les domaines que vous souhaitez approfondir avec des textes plus spécialisés.

Une partie du contenu de ces livres est disponible dans un PDF en ligne par Julian, via la section Documents contribués du site Web R. Je vous encourage à parcourir cette section pour voir s'il existe d'autres documents qui pourraient vous aider à démarrer sans avoir à débourser de l'argent. Une première version du texte qui est devenu la première édition du texte de Maindonald et Braun peut également être trouvée dans cette section.


3

Eh bien, si vous voulez un aperçu de la plupart des méthodes statistiques et code R pour eux, vous ne pouvez pas vous tromper avec Venables et de la statistique appliquée moderne de Ripley dans S .

Son succint, lucide et a suffisamment de code R pour vous permettre de commencer à peu près n'importe quel sujet statistique que vous souhaitez nommer.

J'ai acheté ce livre et je me méfiais du prix par rapport au nombre de pages, mais cela valait bien l'investissement. Ils supposent le calcul et l'algèbre linéaire, mais étant donné que vous êtes ingénieur, cela ne devrait pas poser trop de problème.

Leur programmation S est également merveilleuse, mais probablement pas ce que vous recherchez en ce moment.


2

Les éléments de l'apprentissage statistique peuvent être peu intimidants pour les débutants. Je recommanderais de lire " Introduction à l'apprentissage statistique avec des applications en R ", qui peut être téléchargé gratuitement à partir d'ici -> http://www-bcf.usc.edu/~gareth/ISL/ Il a également élaboré des exemples en R à la fin de chaque chapitre.

" Machine Learning: An algorithmic Perspective " par Stephen Marsland couvre également un plus large éventail de sujets sans trop entrer dans les mathématiques.


1

Les réponses précédentes ont beaucoup de choses sur l'application. En ce qui concerne le matériel conceptuel et une bonne réflexion statistique, je recommanderais la théorie des probabilités: la logique de la science par Edwin Jaynes. Les trois premiers chapitres sont disponibles gratuitement ici

Cependant, il n'a pas beaucoup de programmes informatiques, donc le côté application est sur les problèmes les plus stylisés. Dispose d'un brillant chapitre sur les paradoxes de la théorie des probabilités, à une exception près, le "paradoxe de la marginalisation", qui est correctement résolu ici (bien que Jaynes "reçoive essentiellement la leçon" en ce qu'un prieur impropre devrait être la limite d'une séquence de prieurs appropriés) .


2
J'ai adoré ce livre moi-même, mais je ne suis pas sûr que ce soit le point de départ pour essayer de construire une intuition pour les statistiques. C'est un texte plutôt polémique et idiosyncratique.
Ben Lauderdale

1

Les suggestions faites jusqu'à présent sont toutes excellentes mais se concentrent sur les techniques les plus avancées et sophistiquées utilisant le logiciel R. Pour un excellent aperçu intuitif des techniques multivariées classiques, le cadre sous-jacent pour les approches les plus à jour, y compris la régression, l'ANOVA, l'analyse factorielle, l'analyse en grappes, l'analyse discriminante, l'analyse du tableau de contingence et l'analyse des équations structurelles, la multivariée de Dillon et Goldstein Les statistiques publiées par Wiley dans les années 80 restent un classique. Il est lucide et appliqué dans ses exemples sans être trop théorique ou lié au logiciel.

Dillon et Goldstein est le livre que je recommanderais à tous ceux qui veulent comprendre d'où proviennent les méthodes modernes d'apprentissage automatique.



0

Le livre de recettes R est un excellent moyen de sauter dans R et d'apprendre à l'utiliser. C'est très pratique, donc c'est génial pour apprendre à utiliser la langue, mais vous devriez aussi chercher un bon livre de théorie.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.