Questions marquées «python»

Python est un langage de programmation couramment utilisé pour l'apprentissage automatique. Utilisez cette balise pour toute question * sur le sujet * qui (a) implique `Python` en tant que partie critique de la question ou réponse attendue, et (b) n'est pas * juste * sur la façon d'utiliser` Python`.

2
Sélection de fonctionnalités avec Random Forests
J'ai un ensemble de données avec principalement des variables financières (120 fonctionnalités, 4k exemples) qui sont pour la plupart hautement corrélées et très bruyantes (indicateurs techniques, par exemple), donc je voudrais sélectionner environ 20-30 max pour une utilisation ultérieure avec la formation de modèle (classification binaire - augmentation Diminution). Je …



3
Régression logistique: Scikit Learn vs glmnet
J'essaie de dupliquer les résultats de sklearnla bibliothèque de régression logistique en utilisant le glmnetpackage dans R. À partir de la documentation desklearn régression logistique , il essaie de minimiser la fonction de coût sous pénalité l2 min w , c 1minw , c12wTw + C∑i = 1NJournal( exp( - …



1
Quelle méthode de comparaison multiple utiliser pour un modèle lmer: lsmeans ou glht?
J'analyse un ensemble de données à l'aide d'un modèle à effets mixtes avec un effet fixe (condition) et deux effets aléatoires (participant en raison de la conception et de la paire du sujet). Le modèle a été généré avec le lme4package: exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp). Ensuite, j'ai effectué un test de rapport de …


2
Différence entre la sélection d'entités basée sur la «régression F» et basée sur les valeurs ?
La comparaison d'entités utilise-t-elle F-regressionla même chose que la corrélation individuelle d'entités avec l'étiquette et l'observation de la valeur ?R2R2R^2 J'ai souvent vu mes collègues utiliser une F regressionsélection de fonctionnalités dans leur pipeline d'apprentissage automatique à partir de sklearn: sklearn.feature_selection.SelectKBest(score_func=sklearn.feature_selection.f_regression...)` Certains me disent s'il vous plaît - pourquoi cela …


1
Raccord de distribution bêta dans Scipy
Selon Wikipedia, la distribution de probabilité bêta a deux paramètres de forme: et β .αα\alphaββ\beta Lorsque j'appelle scipy.stats.beta.fit(x)en Python, où se xtrouve un groupe de nombres dans la plage , 4 valeurs sont renvoyées. Cela me semble étrange.[ 0 , 1 ][0,1][0,1] Après avoir recherché sur Google, j'ai trouvé que …

3
Différence entre le modèle statistique OLS et la régression linéaire scikit
J'ai une question sur deux méthodes différentes de bibliothèques différentes qui semblent faire le même travail. J'essaie de faire un modèle de régression linéaire. Voici le code que j'utilise la bibliothèque statsmodel avec OLS: X_train, X_test, y_train, y_test = cross_validation.train_test_split(x, y, test_size=0.3, random_state=1) x_train = sm.add_constant(X_train) model = sm.OLS(y_train, x_train) …


1
Utilisation d'iloc pour définir des valeurs [fermé]
Fermé. Cette question est hors sujet . Il n'accepte pas actuellement les réponses. Voulez-vous améliorer cette question? Mettez à jour la question afin qu'elle soit sur le sujet pour la validation croisée. Fermé il y a 2 ans . Cette ligne renvoie les 4 premières lignes de la trame combinedde …
13 python  pandas 

2
Quand enregistrer / développer vos variables lors de l'utilisation de modèles de forêt aléatoires?
Je fais une régression en utilisant des forêts aléatoires pour prédire les prix en fonction de plusieurs attributs. Le code est écrit en Python à l'aide de Scikit-learn. Comment décidez-vous si vous devez transformer vos variables en utilisant exp/ logavant de l'utiliser pour l'adapter au modèle de régression? Est-il nécessaire …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.