Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données

5
SVM peut-il apprendre en continu un exemple à la fois?
J'ai un ensemble de données en streaming, des exemples sont disponibles un à la fois. J'aurais besoin de faire la classification multi-classe sur eux. Dès que j'ai intégré un exemple de formation au processus d'apprentissage, je dois le supprimer. Parallèlement, j'utilise également le dernier modèle pour effectuer des prévisions sur …

3
Comment adapter un modèle ARIMAX avec R?
J'ai quatre séries chronologiques différentes de mesures horaires: La consommation de chaleur à l'intérieur d'une maison La température à l'extérieur de la maison Le rayonnement solaire La vitesse du vent Je veux pouvoir prédire la consommation de chaleur à l'intérieur de la maison. Il y a une nette tendance saisonnière, …



2
Comprendre la valeur p
Je sais qu'il existe de nombreux matériaux expliquant la valeur p. Cependant, le concept n'est pas facile à saisir fermement sans clarification supplémentaire. Voici la définition de p-value de Wikipedia: La valeur p est la probabilité d'obtenir une statistique de test au moins aussi extrême que celle qui a été …



3
Quel est le moyen le plus précis de déterminer la couleur d'un objet?
J'ai écrit un programme informatique capable de détecter des pièces de monnaie dans une image statique (.jpeg, .png, etc.) à l'aide de certaines techniques standard de vision par ordinateur (flou gaussien, seuillage, transformation de Hough, etc.). En utilisant les ratios des pièces capturées à partir d'une image donnée, je peux …

4
Regroupement des erreurs standard dans R (manuellement ou dans plm)
J'essaie de comprendre le "clustering" d'erreur standard et comment exécuter dans R (c'est trivial dans Stata). En RI ont été infructueux en utilisant plmou en écrivant ma propre fonction. Je vais utiliser les diamondsdonnées du ggplot2paquet. Je peux faire des effets fixes avec des variables factices > library(plyr) > library(ggplot2) …



6
Comment évaluer la similitude de deux histogrammes?
À partir de deux histogrammes, comment pouvons-nous évaluer s'ils sont similaires ou non? Est-il suffisant de simplement regarder les deux histogrammes? La simple correspondance un à un pose le problème suivant: si un histogramme est légèrement différent et légèrement décalé, nous n'obtiendrons pas le résultat souhaité. Aucune suggestion?

10
Comment enseigner aux élèves qui craignent les statistiques?
Je suis sur le point d'aider à enseigner les statistiques aux étudiants en médecine ce semestre. J'ai entendu beaucoup d'histoires d'horreur sur la peur de ces étudiants à partir de statistiques d'apprentissage. Quelqu'un peut-il suggérer quoi faire avec cette peur? (Soit des liens vers des personnes qui en discutent, soit …
33 teaching 

2
Variance d'une fonction d'une variable aléatoire
Disons que nous avons la variable aléatoire XXX avec une variance et une moyenne connues. La question est: quelle est la variance de f(X)f(X)f(X) pour une fonction donnée f. La seule méthode générale que je connaisse est la méthode delta, mais elle ne donne qu’une approximation. Maintenant, je suis intéressé …

1
Différences mathématiques entre GBM, XGBoost, LightGBM, CatBoost?
Il existe plusieurs implémentations de la famille de modèles GBDT telles que: GBM XGBoost LightGBM Catboost. Quelles sont les différences mathématiques entre ces différentes implémentations? Catboost semble surpasser les autres implémentations même en utilisant uniquement ses paramètres par défaut en fonction de cette référence , mais il est toujours très …
33 boosting  xgboost 

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.