Statistiques et Big Data algorithms

3

Qui a créé la première table normale standard?

Je suis sur le point d'introduire la table normale standard dans mon cours d'introduction aux statistiques et je me suis demandé: qui a créé la première table normale standard? Comment l'ont-ils fait avant l'arrivée des ordinateurs? Je frémis en pensant à une calculatrice en force brute que mille sommes Riemann …

61 normal-distribution algorithms history tables

7

Meilleur algorithme PCA pour un grand nombre de fonctionnalités (> 10K)?

J'ai déjà posé cette question à StackOverflow, mais il semble que cela conviendrait mieux ici, étant donné que cela n'a pas donné de réponse à SO. C'est un peu à la croisée des statistiques et de la programmation. J'ai besoin d'écrire du code pour faire PCA (analyse en composantes principales). …

54 pca algorithms model-evaluation high-dimensional

6

Régression linéaire en ligne efficace

J'analyse des données pour lesquelles je souhaite effectuer une régression linéaire ordinaire. Toutefois, cela n’est pas possible car je traite d’un paramètre en ligne avec un flux continu de données d’entrée (qui deviendra rapidement trop volumineux pour la mémoire). pour mettre à jour les estimations de paramètres pendant la consommation. …

53 time-series regression algorithms real-time

10

Mesure de l'entropie / informations / motifs d'une matrice binaire 2D

Je veux mesurer l'entropie / densité d'information / ressemblance-motif d'une matrice binaire à deux dimensions. Permettez-moi de montrer quelques images pour clarification: Cet affichage devrait avoir une entropie assez élevée: UNE) Cela devrait avoir une entropie moyenne: B) Enfin, ces images devraient toutes avoir une entropie proche de zéro: C) …

53 algorithms binary-data entropy pattern-recognition information

7

Détection périodique d'une série temporelle générique

Cet article est la suite d'un autre article lié à une méthode générique de détection des valeurs aberrantes dans les séries chronologiques . Fondamentalement, à ce stade, je suis intéressé par un moyen robuste de découvrir la périodicité / saisonnalité d’une série temporelle générique affectée par beaucoup de bruit. Du …

53 time-series algorithms frequency real-time

10

Qu'est-ce qu'un bon algorithme pour estimer la médiane d'un énorme jeu de données en lecture unique?

Je recherche un bon algorithme (calcul minimal, exigences de stockage minimales) pour estimer la médiane d'un ensemble de données trop volumineux pour être stocké, de telle sorte que chaque valeur ne puisse être lue qu'une fois (à moins que vous stockiez explicitement cette valeur). Aucune donnée sur les données ne …

48 algorithms median large-data

5

Quelle est la différence entre les algorithmes avant-arrière et Viterbi?

Je veux savoir quelles sont les différences entre l' algorithme avant-arrière et l' algorithme de Viterbi pour l'inférence dans les modèles de Markov cachés (HMM).

44 algorithms hidden-markov-model viterbi-algorithm forward-backward

5

Implémentations optimisées de l'algorithme Random Forest

J'ai remarqué qu'il existe quelques implémentations de forêt aléatoire telles que ALGLIB, Waffles et certains packages R tels que randomForest. Quelqu'un peut-il me dire si ces bibliothèques sont hautement optimisées? Sont-ils fondamentalement équivalents aux forêts aléatoires décrites dans Les éléments de l’apprentissage statistique ou ont-ils été complétés de nombreuses astuces? …

43 random-forest algorithms model-evaluation

6

Quel algorithme est utilisé dans la régression linéaire?

J'entends généralement parler de "moindres carrés ordinaires". Est-ce l'algorithme le plus largement utilisé pour la régression linéaire? Y a-t-il des raisons d'en utiliser un autre?

42 regression least-squares algorithms computational-statistics numerics

3

Quelles sont les différences entre les modèles de Markov cachés et les réseaux de neurones?

Je ne fais que me mouiller dans les statistiques alors je suis désolé si cette question n’a pas de sens. J'ai utilisé des modèles de Markov pour prédire les états cachés (casinos injustes, lancers de dés, etc.) et des réseaux de neurones pour étudier les clics d'utilisateurs sur un moteur …

40 data-mining algorithms neural-networks markov-process

6

approximatif en

Je me suis intéressé récemment à la simulation de Monte Carlo et je l’utilise pour approcher des constantes telles que ππ\pi (cercle à l’intérieur d’un rectangle, zone proportionnelle). Cependant, je suis incapable de penser à une méthode correspondante pour approximer la valeur de eee [nombre d'Euler] en utilisant l'intégration de …

35 simulation monte-carlo algorithms random-generation numerical-integration

6

Data mining: Comment dois-je m'y prendre pour trouver la forme fonctionnelle?

Je suis curieux de savoir les procédures reproductibles qui peuvent être utilisées pour découvrir la forme fonctionnelle de la fonction y = f(A, B, C) + error_termoù mon entrée est seulement un ensemble d'observations ( y, A, Bet C). Veuillez noter que la forme fonctionnelle de fest inconnue. Considérez le …

34 regression machine-learning algorithms model-selection data-mining

1

Différence entre les algorithmes k-moyennes standard et sphériques

Je voudrais comprendre quelle est la principale différence de mise en œuvre entre les algorithmes de clustering k-means standard et sphérique. À chaque étape, k-means calcule les distances entre les vecteurs d'éléments et les centroïdes de cluster, et réaffecte le document à ce cluster, dont le centroïde est le plus …

28 clustering data-mining algorithms k-means

3

Meilleur algorithme de bandit?

L'algorithme de bandit le plus connu est la borne de confiance supérieure (UCB) qui a popularisé cette classe d'algorithmes. Depuis lors, je suppose qu'il existe désormais de meilleurs algorithmes. Quel est le meilleur algorithme actuel (en termes de performances empiriques ou de limites théoriques)? Cet algorithme est-il optimal dans un …

27 machine-learning algorithms theory reinforcement-learning multiarmed-bandit

1

Comment définir la condition de terminaison de la descente en pente?

En fait, je voulais vous demander comment puis-je définir la condition de fin pour la descente en gradient. Puis-je l'arrêter en fonction du nombre d'itérations, c'est-à-dire en tenant compte des valeurs des paramètres pour, disons, 100 itérations? Ou dois-je attendre de telle sorte que les différentes valeurs des deux paramètres …

24 algorithms optimization gradient-descent

Questions marquées «algorithms»