Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données

1
Notation en indice dans les attentes
Quelle est la signification exacte de la notation en indice dans les anticipations conditionnelles dans le cadre de la théorie des mesures? Ces indices n'apparaissent pas dans la définition de l'espérance conditionnelle, mais nous pouvons le voir par exemple sur cette page de wikipedia . (Notez que ce n'était pas …


10
Taleb et le cygne noir
Le livre de Taleb "The Black Swan" était un best-seller du New York Times quand il est paru il y a plusieurs années. Le livre en est maintenant à sa deuxième édition. Après avoir rencontré des statisticiens lors d'une conférence statistique annuelle (JSM), Taleb a quelque peu atténué ses critiques …

3
Des références contenant des arguments contre le test de signification d'une hypothèse nulle?
Au cours des dernières années, j'ai lu un certain nombre d'articles qui plaidaient contre l'utilisation du test de signification des hypothèses nulles en science, mais ne pensaient pas conserver une liste persistante. Un collègue m'a récemment demandé une telle liste, alors j'ai pensé demander à tout le monde ici de …







3
Quelle est la différence entre un réseau de neurones et un réseau de conviction profonde?
J'ai l'impression que lorsque les gens font référence à un réseau de «croyance profonde», il s'agit en réalité d'un réseau de neurones mais de très grande taille. Est-ce correct ou un réseau de conviction profonde implique-t-il également que l'algorithme lui-même est différent (c'est-à-dire, pas de réseau neuronal à feed forward, …

6
Pourquoi l'algorithme de clustering k-means utilise-t-il uniquement la métrique de distance euclidienne?
Existe-t-il un objectif spécifique en termes d'efficacité ou de fonctionnalité pour lequel l'algorithme k-means n'utilise pas, par exemple, la similarité cosinus comme métrique de distance, mais ne peut utiliser que la norme euclidienne? En général, la méthode K-means sera-t-elle conforme et sera-t-elle correcte si d'autres distances que Euclidean sont considérées …


4
Hypothèses concernant les estimations bootstrap de l'incertitude
J'apprécie l'utilité du bootstrap pour obtenir des estimations de l'incertitude, mais une chose qui m'a toujours dérangé à ce sujet est que la distribution correspondant à ces estimations est la distribution définie par l'échantillon. En général, il semble être une mauvaise idée de croire que nos fréquences d'échantillonnage ressemblent exactement …


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.