Une solide formation en mathématiques est-elle une condition préalable à la maîtrise du blanchiment? - une réponse et quelques spéculations sur le ML considérées comme des statistiques ;-)
Vers 1990, j’espérais que l’algèbre informatique serait utile, mais je pense que c’est assez limité. Mais cela aide certainement à accélérer l’apprentissage des mathématiques (moins de besoin de développer des aptitudes à la manipulation par la pratique ou d’essayer de se débrouiller en ne faisant que des exercices simples). J'ai trouvé l'algèbre linéaire de Fred Szabo avec Mathematica comme un excellent exemple (mais j'avais déjà suivi un cours d'algèbre linéaire de niveau avancé.)
Je travaille depuis 1988 (en utilisant des méthodes informatiques intensives pour "concrétiser" des théorèmes et des principes à partir de statistiques - précisément) pour que la réponse soit non ou du moins pas nécessaire (pour les statistiques). On pourra toujours comprendre plus rapidement et plus généralement avec des compétences et une compréhension supplémentaires en mathématiques. Je pense que je commence à me rapprocher, mais il faut une représentation manipulable des modèles générateurs de probabilité et des inférences valides et pertinentes . utile pour plus que des problèmes de jouets.
Devrais-je essayer de remplir les blancs de mes calculs avant de continuer avec ML?
C’est une entreprise difficile - dans les MHO, presque tout le monde qui comprend que les statistiques y parviennent en étant très à l’aise pour manipuler la norme et représentations mathématiques surtout non standards des modèles générateurs de probabilités et les caractérisations mathématiques de l’inférence (les x% les plus élevés de la statistique mathématique Phds). Donc, il ne suffit pas d’obtenir les bases, mais d’être à l’aise avec les mathématiques. (En passant, pour moi, la théorie de Fourier était essentielle.)
Pourquoi ces représentations sont-elles difficiles (même avec beaucoup de mathématiques)?
Gerd Gigerenzer a à peu près établi qu'il n'y avait pas de problème avec la maladie simple positive / négative étant donné que le test était positif / négatif et utilisait des fréquences naturelles ». Une référence de la question liée semble faire bon usage de celle http://www.autonlab.org/tutorials/prob18.pdf
Pourquoi est-ce difficile à généraliser?
Pour k tests (répétés et / ou différents) - 2 ^ k
Pour les tests qui prennent des valeurs v - v ^ k
Donc, pour binaire inconnu - 2 * v ^ k probabilités de chemin d’échantillonnage
Pour p multiples inconnues binaires 2 ^ p * v ^ k
Pour p multiples inconnues rationnelles Q ^ p * v ^ k
On passe rapidement aux maths avec des infinis dénombrables et innombrables pour y faire face, ce qui, même avec une expertise mathématique, conduit à de nombreux malentendus et paradoxes apparents (par exemple le paradoxe de Borel?)
En outre, il existe des incompréhensions dangereuses linéaires à non linéaires (par exemple, les dangers cachés de la spécification de Priors non informatifs, Winbugs et d'autres MCMC sans information de distribution préalable ), les interactions et les effets aléatoires, etc.