Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
La PCA est considérée comme une procédure linéaire, toutefois: PCA(X)≠PCA(X1)+PCA(X2)+…+PCA(Xn),PCA(X)≠PCA(X1)+PCA(X2)+…+PCA(Xn),\mathrm{PCA}(X)\neq \mathrm{PCA}(X_1)+\mathrm{PCA}(X_2)+\ldots+\mathrm{PCA}(X_n), où . Cela revient à dire que les vecteurs propres obtenus par les PCA sur les matrices de données X i ne totalisent pas pour égaler les vecteurs propres obtenus par PCA sur la somme des matrices de données …
La régularisation par filet élastique est-elle toujours préférée à Lasso & Ridge, car elle semble résoudre les inconvénients de ces méthodes? Quelle est l'intuition et quel est le calcul derrière le filet élastique?
Lors de l'apprentissage de Gradient Boosting, je n'ai jamais entendu parler de contraintes concernant les propriétés d'un "classificateur faible" que la méthode utilise pour construire et modéliser un modèle. Cependant, je ne pouvais pas imaginer une application de Go utilisant une régression linéaire, et en fait, après avoir effectué certains …
J'espère avoir du sens avec le titre. Souvent, l'hypothèse nulle est formée dans l'intention de la rejeter. Y a-t-il une raison à cela ou s'agit-il simplement d'une convention?
Je génère 8 bits aléatoires (un 0 ou un 1) et les concatène ensemble pour former un nombre de 8 bits. Une simple simulation Python donne une distribution uniforme sur le jeu discret [0, 255]. J'essaie de justifier pourquoi cela a du sens dans ma tête. Si je compare cela …
L’un des problèmes les plus importants de l’analyse par grappes est qu’il peut arriver que nous devions tirer des conclusions différentes lorsque nous nous basons sur différentes méthodes de classification utilisées (y compris différentes méthodes de couplage dans une classification hiérarchique). J'aimerais connaître votre opinion à ce sujet - quelle …
Je regarde des diapositives de cours sur un cours de science des données que vous pouvez trouver ici: https://github.com/cs109/2015/blob/master/Lectures/01-Introduction.pdf Malheureusement, je ne peux pas voir la vidéo de cette conférence et à un moment de la diapositive, le présentateur a le texte suivant: Quelques principes clés Penser comme un Bayésien, …
Le LSTM a été inventé spécifiquement pour éviter le problème du gradient disparaissant. Il est supposé faire cela avec le carrousel à erreur constante (CEC), qui sur le diagramme ci-dessous (de Greff et al. ) Correspond à la boucle autour de la cellule . (source: deeplearning4j.org ) Et je comprends …
Existe-t-il une méthode de simulation autre que Monte Carlo? Toutes les méthodes de simulation impliquent de substituer des nombres aléatoires à la fonction pour trouver une plage de valeurs pour la fonction. Toutes les méthodes de simulation sont-elles donc des méthodes de Monte Carlo?
J'ai une question liée à la modélisation de courtes séries chronologiques. Ce n'est pas une question de savoir si les modéliser , mais comment. Quelle méthode recommanderiez-vous pour la modélisation de séries chronologiques (très) courtes (disons de longueur )? Par "meilleur", j'entends ici le plus robuste, le moins sujet aux …
Les exemples suivants pourraient être cités: Une distribution avec une moyenne infinie et une variance infinie. Une distribution avec une variance moyenne et infinie infinie. Une distribution avec une moyenne finie et une variance infinie. Une distribution avec une moyenne et une variance finies. Cela vient de ce que je …
Je suis habitué à voir le test de Ljung-Box utilisé assez fréquemment pour tester l'autocorrélation dans les données brutes ou dans les résidus de modèle. J'avais presque oublié qu'il existe un autre test d'autocorrélation, à savoir le test de Breusch-Godfrey. Question: quelles sont les principales différences et similitudes des tests …
La summary.rqfonction de la vignette quantreg fournit une multitude de choix pour les estimations d'erreur standard des coefficients de régression quantile. Quels sont les scénarios spéciaux où chacun devient optimal / souhaitable? "rang" qui produit des intervalles de confiance pour les paramètres estimés en inversant un test de rang tel …
Quel est le but de la fonction de lien en tant que composante du modèle linéaire généralisé? Pourquoi en avons-nous besoin? Wikipédia déclare: Il peut être pratique de faire correspondre le domaine de la fonction de liaison à la plage de la moyenne de la fonction de distribution. Quel est …
Je ne sais même pas si cette question a du sens, mais quelle est la différence entre la régression multiple et la corrélation partielle (mis à part les différences évidentes entre corrélation et régression, ce que je ne vise pas)? Je veux comprendre ce qui suit: J'ai deux variables indépendantes …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.