Statistiques et Big Data scikit-learn

4

Modèle d'historique d'événement à temps discret (survie) dans R

J'essaie d'adapter un modèle à temps discret dans R, mais je ne sais pas comment le faire. J'ai lu que vous pouvez organiser la variable dépendante dans différentes lignes, une pour chaque observation de temps, et utiliser la glmfonction avec un lien logit ou cloglog. En ce sens, j'ai trois …

10 r survival pca sas matlab neural-networks r logistic spatial spatial-interaction-model r time-series econometrics var statistical-significance t-test cross-validation sample-size r regression optimization least-squares constrained-regression nonparametric ordinal-data wilcoxon-signed-rank references neural-networks jags bugs hierarchical-bayesian gaussian-mixture r regression svm predictive-models libsvm scikit-learn probability self-study stata sample-size spss wilcoxon-mann-whitney survey ordinal-data likert group-differences r regression anova mathematical-statistics normal-distribution random-generation truncation repeated-measures variance variability distributions random-generation uniform regression r generalized-linear-model goodness-of-fit data-visualization r time-series arima autoregressive confidence-interval r time-series arima autocorrelation seasonality hypothesis-testing bayesian frequentist uninformative-prior correlation matlab cross-correlation

3

Comment appliquer Softmax comme fonction d'activation dans Perceptron multicouche dans Scikit-Learn? [fermé]

Fermé. Cette question est hors sujet . Il n'accepte pas actuellement les réponses. Vous souhaitez améliorer cette question? Mettez à jour la question afin qu'elle soit sur le sujet pour la validation croisée. Fermé il y a 11 mois . Je dois appliquer la fonction d'activation Softmax au Perceptron multicouche …

9 neural-networks scikit-learn multi-class softmax

1

Formule d'inertie de clustering dans Scikit Learn

Je voudrais coder un cluster kmeans en python à l'aide de pandas et de scikit learn. Afin de sélectionner le bon k, je voudrais coder la statistique de l'écart de Tibshirani et al 2001 ( pdf ). Je voudrais savoir si je pourrais utiliser le résultat inertie_ de scikit et …

9 clustering python k-means scikit-learn metric

1

Descente en pente ou non pour une régression linéaire simple

Il existe un certain nombre de sites Web décrivant la descente de gradient pour trouver les paramètres d'une régression linéaire simple (en voici un). Google le décrit également dans son nouveau cours de ML (au public). Cependant, sur Wikipedia , les formules suivantes pour calculer les paramètres sont fournies: α^β^=y¯-β^X¯,=∑ni …

9 regression scikit-learn gradient-descent

2

Optimiser SVM pour éviter les faux négatifs dans la classification binaire

Je forme un classificateur binaire SVM à l'aide de Scikit learn. En raison de la nature de mon problème, je dois éviter les faux négatifs. Comme rien n'est gratuit, je suis d'accord pour obtenir un taux plus élevé de faux positifs afin de réduire le nombre de faux négatifs. Comment …

9 machine-learning cross-validation svm python scikit-learn

2

L'état aléatoire est-il un paramètre à régler?

Un problème qui se produit assez souvent dans mes expériences est que le modèle varie dans les performances lorsque l'état aléatoire de l'algorithme est modifié. La question est donc simple, dois-je prendre un état aléatoire comme hyperparamètre? Pourquoi donc? Si mon modèle surpasse les autres avec un état aléatoire différent, …

9 machine-learning scikit-learn

2

Comment préparer les interactions des variables catégorielles dans scikit-learn?

Quelle est la meilleure façon de préparer les interactions des caractéristiques catégorielles avant de les adapter à scikit-learn? Avec statsmodelsje pourrais facilement dire en style R smf.ols(formula = 'depvar ~ C(var1)*C(var2)', data=df).fit()(même chose avec Stata avec regress depvar i.var1##i.var2). Peut-on sklearn.preprocessing.PolynomialFeatures(dans la v0.15, actuellement dev) être utilisé avec des variables …

9 machine-learning interaction python scikit-learn

3

Pourquoi svm n'est-il pas aussi bon que l'arbre de décision sur les mêmes données?

Je suis nouveau dans l'apprentissage automatique et j'essaie d'utiliser scikit-learn (sklearn) pour résoudre un problème de classification. Les deux DecisionTree et SVM peuvent former un classificateur à ce problème. J'utilise sklearn.ensemble.RandomForestClassifieret sklearn.svm.SVCpour ajuster les mêmes données de formation (environ 500 000 entrées avec 50 fonctionnalités par entrée). Le RandomForestClassifier sort …

9 machine-learning classification svm scikit-learn

2

Détection d'anomalies sur séries chronologiques

Je suis un débutant utilisant l'apprentissage automatique (j'ai terminé le cours de Ng), j'utilise scikit-learn en python. Je veux trouver le meilleur moyen de détecter les anomalies dans notre système. Nous avons des événements en cours qui se produisent à un horaire (toutes les quelques minutes / heures), et je …

8 time-series python scikit-learn anomaly-detection

1

Comment obtenir des hyperparamètres optimaux après validation croisée imbriquée?

En général, si nous avons un grand ensemble de données, nous pouvons le diviser en (1) formation, (2) validation et (3) test. Nous utilisons la validation pour identifier les meilleurs hyperparamètres en validation croisée (par exemple, C dans SVM), puis nous formons le modèle en utilisant les meilleurs hyperparamètres avec …

8 machine-learning cross-validation scikit-learn hyperparameter optimization

1

Mode de normalisation Scikit-learn (L1 vs L2 & Max)

Je me demandais si quelqu'un ici pouvait expliquer la différence entre le mode de normalisation l1, l2 et max dans le module sklearn.preprocessing.normalize ()? Après avoir lu la documentation, je n'ai pas réalisé la différence!

8 normalization scikit-learn

Questions marquées «scikit-learn»