Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
J'essaie de représenter graphiquement le nombre d'actions par les utilisateurs (dans ce cas, "j'aime") au fil du temps. J'ai donc "Nombre d'actions" comme mon axe y, mon axe x est le temps (semaines), et chaque ligne représente un utilisateur. Mon problème est que je veux regarder ces données pour un …
Le terme "perte" est-il synonyme d '"erreur"? Y a-t-il une différence de définition? Aussi, quelle est l'origine du terme "perte"? NB: La fonction d'erreur mentionnée ici ne doit pas être confondue avec une erreur normale.
Pourquoi utilisons-nous des unités linéaires rectifiées (ReLU) avec des réseaux de neurones? Comment cela améliore-t-il le réseau neuronal? Pourquoi disons-nous que ReLU est une fonction d'activation? La fonction d'activation softmax n'est-elle pas pour les réseaux de neurones? Je suppose que nous utilisons à la fois ReLU et softmax, comme ceci: …
J'ai lu deux versions de la fonction de perte pour la régression logistique, laquelle est correcte et pourquoi? De Machine Learning , Zhou ZH (en chinois), avec :β=(w,b) and βTx=wTx+bβ=(w,b) and βTx=wTx+b\beta = (w, b)\text{ and }\beta^Tx=w^Tx +b l(β)=∑i=1m(−yiβTxi+ln(1+eβTxi))(1)(1)l(β)=∑i=1m(−yiβTxi+ln(1+eβTxi))l(\beta) = \sum\limits_{i=1}^{m}\Big(-y_i\beta^Tx_i+\ln(1+e^{\beta^Tx_i})\Big) \tag 1 De mon cours collégial, avec :zi=yif(xi)=yi(wTxi+b)zi=yif(xi)=yi(wTxi+b)z_i = …
J'ai lu cette page: http://neuralnetworksanddeeplearning.com/chap3.html et il a dit que la couche de sortie sigmoïde avec entropie croisée est assez similaire à la couche de sortie softmax avec log-vraisemblance. que se passe-t-il si j'utilise sigmoïde avec log-vraisemblance ou softmax avec entropie croisée dans la couche de sortie? ça va? parce …
Dans presque tous les travaux d'analyse que j'ai jamais effectués, j'utilise: set.seed(42) C'est un hommage au Guide de l'auto-stoppeur de la galaxie . Mais je me demande si je crée un biais en utilisant la même graine encore et encore.
Je comprends ce qu'est un postérieur, mais je ne sais pas ce que ce dernier signifie? En quoi les 2 sont-ils différents? Kevin P Murphy a indiqué dans son manuel, Machine Learning: a Probabilistic Perspective , qu'il s'agit d'un «état de croyance interne». Qu'est-ce que cela signifie vraiment? J'avais l'impression …
Je trouve que R peut prendre beaucoup de temps pour générer des tracés lorsque des millions de points sont présents - ce qui n'est pas surprenant étant donné que les points sont tracés individuellement. De plus, ces parcelles sont souvent trop encombrées et denses pour être utiles. Beaucoup de points …
Si la probabilité conjointe est l'intersection de 2 événements, alors la probabilité conjointe de 2 événements indépendants ne devrait-elle pas être nulle puisqu'ils ne se croisent pas du tout? Je suis confus.
Je veux dire que certaines de ces variables sont fortement corrélées entre elles. Comment / pourquoi / dans quel contexte les définissons-nous comme variables indépendantes ?
Je vois souvent des gens créer de nouvelles fonctionnalités basées sur des fonctionnalités existantes sur un problème d'apprentissage automatique. Par exemple, ici: https://triangleinequality.wordpress.com/2013/09/08/basic-feature-engineering-with-the-titanic-data/ les gens ont considéré la taille de la famille d'une personne comme une nouvelle fonctionnalité, basée sur sur le nombre de frères, soeurs et parents, qui étaient …
Un réseau neuronal apprend les caractéristiques d'un ensemble de données comme moyen d'atteindre un objectif. Une fois cela fait, nous pouvons vouloir savoir ce que le réseau neuronal a appris. Quelles étaient les fonctionnalités et pourquoi s'en souciait-il? Quelqu'un peut-il donner quelques références sur l'ensemble des travaux qui concernent ce …
Je comprends comment nous obtenons 3,5 comme valeur attendue pour lancer un dé à 6 faces équitable. Mais intuitivement, je peux m'attendre à chaque visage avec une chance égale de 1/6. Donc, la valeur attendue de lancer un dé ne devrait-elle pas être l'un des nombres entre 1 et 6 …
Ma question découle de ce commentaire sur un article de blog d'Andrew Gelman dans lequel il préconise l'utilisation d'intervalles de confiance de 50% au lieu d'intervalles de confiance de 95%, mais pas au motif qu'ils sont plus solidement estimés: Je préfère des intervalles de 50% à 95% pour 3 raisons: …
Je sais que cette question a été posée avec le cas moyenne = médiane, mais je n'ai rien trouvé en rapport avec le mode moyenne =. Si le mode est égal à la moyenne, puis-je toujours conclure qu'il s'agit d'une distribution symétrique? Serai-je obligé de connaître également la médiane de …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.