Quels sont les avantages et les inconvénients de l'utilisation de LARS [1] par rapport à l'utilisation de la descente de coordonnées pour ajuster la régression linéaire régularisée L1? Je m'intéresse principalement aux aspects de performance (mes problèmes ont tendance à avoir Ndes centaines de milliers et p<20). Cependant, toute autre …
Je travaille actuellement comme assistant d'enseignement dans mon université, dans un cours d'introduction aux statistiques (pour les étudiants en médecine). Hors ligne, il existe de nombreux livres contenant des informations pour aider l'enseignant. Cependant, ce que je suis intéressé de savoir, c'est si vous pouvez m'orienter vers de (bonnes) ressources …
J'ai récemment appris les règles de notation appropriées pour les classificateurs probabilistes. Plusieurs discussions sur ce site Web ont mis un point d'honneur à souligner que la précision est une règle de notation incorrecte et ne doit pas être utilisée pour évaluer la qualité des prévisions générées par un modèle …
Le théorème de Halmos-Savage dit que pour un modèle statistique dominé ( Ω , A, P)(Ω,A,P)(\Omega, \mathscr A, \mathscr P) une statistique T: ( Ω , A, P) → ( Ω′, A′)T:(Ω,A,P)→(Ω′,A′)T: (\Omega, \mathscr A, \mathscr P)\to(\Omega', \mathscr A') est suffisante si (et seulement si) pour tout { P∈ P}{P∈P}\{P …
Disons que je calcule des hauteurs (en cm) et que les nombres doivent être supérieurs à zéro. Voici l'exemple de liste: 0.77132064 0.02075195 0.63364823 0.74880388 0.49850701 0.22479665 0.19806286 0.76053071 0.16911084 0.08833981 Mean: 0.41138725956196015 Std: 0.2860541519582141 Dans cet exemple, selon la distribution normale, 99,7% des valeurs doivent être comprises entre ± …
Je suis plutôt nouveau dans le domaine des processus gaussiens et comment ils sont appliqués dans l'apprentissage automatique. Je continue de lire et d'entendre que les fonctions de covariance sont l'attraction principale de ces méthodes. Quelqu'un pourrait-il donc expliquer de manière intuitive ce qui se passe dans ces fonctions de …
Dans les commentaires qui suivent ma réponse à une question connexe, les utilisateurs ssdecontrol et Glen_b ont demandé si la normalité conjointe de et était nécessaire pour affirmer la normalité de la somme ? Bien entendu, le fait que la normalité commune soit suffisante est bien connu. Cette question supplémentaire …
J'essaie de comprendre la logique derrière le test du chi carré. Le test du carré est . est ensuite comparé à une distribution Chi-carré pour trouver une valeur p afin de rejeter ou non l'hypothèse nulle. : les observations proviennent de la distribution que nous avons utilisée pour créer nos …
On m'a posé cette question avec dans une interview. Y a-t-il une réponse «correcte»?( n , k ) = ( 400 , 220 )(n,k)=(400,220)(n, k) = (400, 220) Supposons que les lancers soient iid et que la probabilité des têtes soit . La distribution du nombre de têtes en 400 …
Je sais que pour la variable continue .P[ X= x ] = 0P[X=x]=0P[X=x]=0 Mais je ne peux pas visualiser que si , il y a un nombre infini de x possibles . Et aussi pourquoi leurs probabilités deviennent-elles infiniment petites?P[ X= x ] = 0P[X=x]=0P[X=x]=0Xxx
J'étudie l'apprentissage automatique et chaque livre que j'ouvre je tombe sur la distribution chi carré, la fonction gamma, la distribution t, la gaussienne, etc. Chaque livre que j'ai ouvert jusqu'à présent ne définit que les distributions: elles n'expliquent pas et ne donnent pas l'intuition sur la provenance des formules spécifiques …
Dans le livre "Limit Theorems of Probability Theory" de Valentin V. Petrov, j'ai vu une distinction entre les définitions d'une distribution "continue" et "absolument continue", qui est énoncée comme suit: (∗)(∗)(*) "... La distribution de la variable aléatoireXXX est dite continue siP(X∈B)=0P(X∈B)=0P\left(X \in B\right)=0 pour tout ensemble fini ou dénombrableBBBde …
Le problème suivant a été publié sur la page Facebook de Mensa International: \quad\quad\quad\quad\quad\quad\quad\quad Le message lui-même a reçu plus de 1000 commentaires, mais je n'entrerai pas dans les détails du débat là-bas, car je sais que c'est le paradoxe de la boîte de Bertrand et la réponse est . …
Comment construire un exemple de distribution de probabilité pour laquelle est valable, en supposant que ?E(1X)=1E(X)E(1X)=1E(X)\mathbb{E}\left(\frac{1}{X}\right)=\frac{1}{\mathbb{E}(X)}P(X≠0)=1P(X≠0)=1\mathbb{P}(X\ne0)=1 L'inégalité qui découle de l'inégalité de Jensen pour un RV valeur positive est comme (l'inégalité inverse si ). En effet, le mappage est convexe pour et concave pour . En suivant la condition d'égalité …
Les compétitions de Kaggle déterminent les classements finaux sur la base d'un ensemble de tests en suspens. Un ensemble de test retenu est un échantillon; il peut ne pas être représentatif de la population modélisée. Étant donné que chaque soumission est comme une hypothèse, l'algorithme qui a remporté le concours …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.