Questions marquées «dataset»

Les demandes d'ensembles de données sont hors sujet sur ce site. Utilisez cette balise pour les questions concernant la création, le traitement ou la maintenance des jeux de données.

3
La sélection des fonctionnalités doit-elle être effectuée uniquement sur les données d'entraînement (ou toutes les données)?
La sélection des fonctionnalités doit-elle être effectuée uniquement sur les données d'entraînement (ou toutes les données)? J'ai parcouru des discussions et des articles tels que Guyon (2003) et Singhi et Liu (2006) , mais je ne suis toujours pas sûr de la bonne réponse. La configuration de mon expérience est …


3
L'éducation statistique des enfants dans différents pays?
Je suis intéressé de savoir quel niveau de statistiques les enfants apprennent dans différents pays du monde. Pourriez-vous s'il vous plaît suggérer des données / liens qui éclairent ce qui se passe à cet égard? Je vais commencer. Israël: Les étudiants qui suivent des cours de mathématiques avancés étudient plus …
10 dataset  teaching 


2
Qu'est-ce que la bucketisation?
J'ai fait le tour pour trouver une explication claire de la «bucketisation» dans l'apprentissage automatique sans succès. Ce que je comprends jusqu'à présent, c'est que la bucketisation est similaire à la quantification dans le traitement numérique du signal où une plage de valeurs continues est remplacée par une valeur discrète. …

2
Fréquence maximale et fermée - Réponse incluse
My dataset:My dataset:My \ \ dataset: 1:A,B,C,E1:A,B,C,E1: A,B,C,E 2:A,C,D,E2:A,C,D,E2:A,C,D,E 3: B,C,E3: B,C,E3:\ \ \ \ \ B,C,E 4:A,C,D,E4:A,C,D,E4:A,C,D,E 5: C,D,E5: C,D,E5:\ \ \ \ C, D, E 6: A,D,E6: A,D,E6: \ \ \ \ A, D,E Je souhaite connaître les ensembles d'éléments fréquents maximaux et les ensembles d'éléments fréquents fermés …

2
Bons exemples d'ACP pour l'enseignement
J'enseigne l'algèbre linéaire à une classe d'ingénieurs, de sociologues et de programmeurs informatiques. Nous venons de faire une décomposition en valeurs singulières, et nous avons un jour supplémentaire, alors j'ai pensé parler de la relation entre la décomposition en valeurs singulières et l'analyse en composantes principales. J'ai bien écrit la …
10 pca  dataset  teaching 

2
Apprendre des données relationnelles
Paramètres De nombreux algorithmes fonctionnent sur une seule relation ou table, tandis que de nombreuses bases de données réelles stockent des informations dans plusieurs tables (Domingos, 2003). Question Quels types d'algorithmes apprennent bien à partir de plusieurs tables (relationnelles). En particulier, je m'intéresse aux algorithmes applicables aux tâches de régression …

1
Comment comparer les événements observés aux événements attendus?
Supposons que j'ai un échantillon de fréquences de 4 événements possibles: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 et j'ai les probabilités attendues que mes événements se produisent: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Avec la somme des fréquences …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 


1
Comment quantifier l'insignifiance statistique?
Je suis relativement nouveau dans les statistiques et je comprends que ma question est peut-être complètement erronée. Je teste mon propre algorithme contre un autre. Bien que les sorties ne soient pas identiques, je veux montrer que les différences sont "statistiquement insignifiantes". Comment puis-je quantifier cela, pour faire valoir mon …

4
Comment gérer les lacunes / NaN dans les données de séries chronologiques lors de l'utilisation de Matlab pour l'autocorrélation et les réseaux de neurones?
J'ai une série chronologique de mesures (séries de hauteurs unidimensionnelles). Au cours de la période d'observation, le processus de mesure s'est interrompu pendant quelques instants. Ainsi, les données résultantes sont un vecteur avec NaN où il y avait des lacunes dans les données. L'utilisation de MATLAB me pose un problème …

7
Recherche de données artificielles 2D pour démontrer les propriétés des algorithmes de clustering
Je recherche des ensembles de données de points de données bidimensionnels (chaque point de données est un vecteur de deux valeurs (x, y)) suivant différentes distributions et formes. Un code pour générer de telles données serait également utile. Je veux les utiliser pour tracer / visualiser le fonctionnement de certains …


2
Calculer la courbe ROC pour les données
Donc, j'ai 16 essais dans lesquels j'essaie d'authentifier une personne à partir d'un trait biométrique en utilisant Hamming Distance. Mon seuil est fixé à 3,5. Mes données sont ci-dessous et seul l'essai 1 est un vrai positif: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 …
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.