Questions marquées «python»

Python est un langage de programmation couramment utilisé pour l'apprentissage automatique. Utilisez cette balise pour toute question * sur le sujet * qui (a) implique `Python` en tant que partie critique de la question ou réponse attendue, et (b) n'est pas * juste * sur la façon d'utiliser` Python`.


3
Ruby comme établi de statistiques
C'est également une question qui se rapporte beaucoup à Python en tant qu'atelier de statistiques et à Excel en tant qu'atelier de statistiques . Je sais qu'il y a une énorme discussion sur Ruby contre Python mais ce n'est pas le point sur cette question. Je pensais que Ruby étant …
13 r  python  software  ruby 

4
Existe-t-il des tutoriels sur la théorie des probabilités bayésiennes ou des modèles graphiques par exemple?
J'ai vu des références à l'apprentissage de la théorie des probabilités bayésiennes en R, et je me demandais s'il y en avait plus, peut-être spécifiquement en Python? Orienté vers l'apprentissage de la théorie des probabilités bayésiennes, l'inférence, l'estimation du maximum de vraisemblance, les modèles graphiques et le tri?

9
Arbres de décision boostés en python? [fermé]
Fermé. Cette question est hors sujet . Il n'accepte pas actuellement les réponses. Voulez-vous améliorer cette question? Mettez à jour la question afin qu'elle soit sur le sujet pour la validation croisée. Fermé il y a 5 mois . Existe-t-il une bonne bibliothèque python pour l'entraînement des arbres de décision …
13 python  cart  boosting 

1
Package GBM vs Caret utilisant GBM
J'ai ajusté le modèle à l'aide caret, mais j'ai ensuite réexécuté le modèle à l'aide du gbmpackage. Je crois comprendre que le caretpackage utilise gbmet que la sortie doit être la même. Cependant, un simple test rapide utilisant data(iris)montre une différence dans le modèle d'environ 5% en utilisant RMSE et …


2
Comment utiliser un filtre Kalman?
J'ai une trajectoire d'un objet dans un espace 2D (une surface). La trajectoire est donnée comme une séquence de (x,y)coordonnées. Je sais que mes mesures sont bruyantes et j'ai parfois des valeurs aberrantes évidentes. Donc, je veux filtrer mes observations. Pour autant que je comprenne le filtre Kalman, il fait …


1
Régression logistique ordinale en Python
Je voudrais exécuter une régression logistique ordinale en Python - pour une variable de réponse à trois niveaux et avec quelques facteurs explicatifs. Le statsmodelspackage prend en charge les modèles logit binaire et logit multinomial (MNLogit), mais pas le logit ordonné. Étant donné que les mathématiques sous-jacentes ne sont pas …


5
Comment effectuer l'imputation de valeurs dans un très grand nombre de points de données?
J'ai un très grand ensemble de données et il manque environ 5% de valeurs aléatoires. Ces variables sont corrélées entre elles. L'exemple de jeu de données R suivant n'est qu'un exemple de jouet avec des données corrélées factices. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 


1
Paquets Python pour travailler avec des modèles de mélange gaussiens (GMM)
Il semble y avoir plusieurs options disponibles pour travailler avec des modèles de mélange gaussiens (GMM) en Python. À première vue, il existe au moins: PyMix - http://www.pymix.org/pymix/index.php Outils pour la modélisation des mélanges PyEM - http://www.ar.media.kyoto-u.ac.jp/members/david/softwares/em/ qui fait partie de la boîte à outils Scipy et semble se concentrer …

1
Interprétation de sortie de Scikit Predict_Proba
Je travaille avec la bibliothèque scikit-learn en python. Dans le code ci-dessous, je prédis la probabilité mais je ne sais pas lire la sortie. Test des données from sklearn.ensemble import RandomForestClassifier as RF from sklearn import cross_validation X = np.array([[5,5,5,5],[10,10,10,10],[1,1,1,1],[6,6,6,6],[13,13,13,13],[2,2,2,2]]) y = np.array([0,1,1,0,1,2]) Fractionner l'ensemble de données X_train, X_test, y_train, …

2
Est-il possible d'évaluer GLM en Python / scikit-learn en utilisant les distributions de Poisson, Gamma ou Tweedie comme famille pour la distribution d'erreur?
J'essaie d'apprendre un peu Python et Sklearn, mais pour mon travail, j'ai besoin d'exécuter des régressions qui utilisent des distributions d'erreur des familles Poisson, Gamma et surtout Tweedie. Je ne vois rien dans la documentation à leur sujet, mais ils se trouvent dans plusieurs parties de la distribution R, donc …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.