Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
Dans l’apprentissage statistique, implicitement ou explicitement, on suppose toujours que l’apprentissage D={X,y}ré={X,y}\mathcal{D} = \{ \bf {X}, \bf{y} \} est composé de NNN tuples d’entrée / réponse qui sont indépendamment tirés du même joint distribution avec(Xi,yi)(Xje,yje)({\bf{X}}_i,y_i) P(X,y)P(X,y)\mathbb{P}({\bf{X}},y) p(X,y)=p(y|X)p(X)p(X,y)=p(y|X)p(X) p({\bf{X}},y) = p( y \vert {\bf{X}}) p({\bf{X}}) et la relation que nous essayons …
Existe-t-il une transformation de type Box-Cox pour les variables indépendantes? C’est-à-dire une transformation qui optimise la variable manière à ce qu’elle corresponde mieux à un modèle linéaire?XXxy~f(x) Si oui, existe-t-il une fonction pour effectuer cela R?
Je suis désolé si cela semble un peu trop fondamental, mais je suppose que je cherche simplement à confirmer que nous comprenons. J'ai l'impression que je devrais le faire en deux étapes et j'ai commencé à essayer de grogner des matrices de corrélation, mais cela commence à peine à sembler …
EDIT: la vue des tâches CRAN Web Services and Services contient une liste beaucoup plus complète des sources de données et des API disponibles dans R. Vous pouvez soumettre une demande d'extraction sur github si vous souhaitez ajouter un package à la vue des tâches. Je fais une liste des …
J'analyse des données pour lesquelles je souhaite effectuer une régression linéaire ordinaire. Toutefois, cela n’est pas possible car je traite d’un paramètre en ligne avec un flux continu de données d’entrée (qui deviendra rapidement trop volumineux pour la mémoire). pour mettre à jour les estimations de paramètres pendant la consommation. …
J'envisage d'utiliser des bibliothèques Python pour mes expériences d'apprentissage automatique. Jusqu'ici, je m'appuyais sur WEKA, mais dans l'ensemble, j'étais plutôt mécontent. C’est principalement parce que j’ai trouvé que WEKA n’était pas très bien pris en charge (très peu d’exemples, la documentation est rare et le soutien de la communauté n’est …
Imaginez le design commun suivant: 100 participants sont affectés au hasard à un traitement ou à un groupe témoin la variable dépendante est numérique et mesurée avant et après le traitement Trois options évidentes pour analyser ces données sont: Testez l'effet d'interaction groupe par temps dans une ANOVA mixte Effectuer …
Je veux mesurer l'entropie / densité d'information / ressemblance-motif d'une matrice binaire à deux dimensions. Permettez-moi de montrer quelques images pour clarification: Cet affichage devrait avoir une entropie assez élevée: UNE) Cela devrait avoir une entropie moyenne: B) Enfin, ces images devraient toutes avoir une entropie proche de zéro: C) …
Quels sont les statisticiens les plus importants et qu'est-ce qui les a rendus célèbres? (Répondez à un seul scientifique par réponse, s'il vous plaît.)
Compte tenu de toutes les bonnes propriétés des modèles d'état et de la KF, je me demande quels sont les inconvénients de la modélisation de l'espace et de l'utilisation du filtre de Kalman (ou EKF, UKF ou filtre de particules) pour l'estimation. Supposons des méthodologies conventionnelles comme ARIMA, VAR ou …
Cet article est la suite d'un autre article lié à une méthode générique de détection des valeurs aberrantes dans les séries chronologiques . Fondamentalement, à ce stade, je suis intéressé par un moyen robuste de découvrir la périodicité / saisonnalité d’une série temporelle générique affectée par beaucoup de bruit. Du …
Dans la plupart des codes Tensorflow, j'ai constaté qu'Adam Optimizer est utilisé avec un taux d'apprentissage constant 1e-4(0,0001). Le code a généralement l'aspect suivant: ...build the model... # Add the optimizer train_op = tf.train.AdamOptimizer(1e-4).minimize(cross_entropy) # Add the ops to initialize variables. These will include # the optimizer slots added by …
Je comprends comment artificial neural network (ANN), peut être formé de manière supervisée à l’aide de backpropogation pour améliorer l’ajustement en diminuant l’erreur dans les prédictions. J'ai entendu dire qu'un ANN peut être utilisé pour un apprentissage non supervisé, mais comment peut-on le faire sans une fonction de coût quelconque …
Que signifie avoir "variance constante" dans le terme d'erreur? À mon avis, nous avons des données avec une variable dépendante et une variable indépendante. La variance constante est l'une des hypothèses de la régression linéaire. Je me demande ce que signifie l'homoscédasticité. Puisque même si j'ai 500 lignes, j'aurais une …
Nous avions déjà plusieurs questions sur les données déséquilibrées lors de l'utilisation de la régression logistique , de la SVM , des arbres de décision , de la mise en sac et de plusieurs autres questions similaires, ce qui en fait un sujet très populaire! Malheureusement, chacune des questions semble …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.