Comment pourrais-je scinder au hasard une matrice de données et le vecteur d'étiquette correspondant en un X_train, X_test, X_val, y_train, y_test, y_val avec Sklearn? Autant que je sache, sklearn.cross_validation.train_test_splitn'est capable que de se scinder en deux, pas en trois ...
Cette question est en réponse à un commentaire que j'ai vu sur une autre question. Le commentaire concernait le programme de cours de Machine Learning sur Coursera, dans le sens suivant: "Les SVM ne sont plus autant utilisés de nos jours". Je viens juste de terminer moi-même les cours pertinents, …
La logique dit souvent qu'en sous-équipant un modèle, sa capacité à généraliser est accrue. Cela dit, il est clair qu’à un moment donné, un modèle insuffisamment aménagé s’aggrave, quelle que soit la complexité des données. Comment savoir si votre modèle a trouvé le juste équilibre et ne sous-exploite pas les …
J'ai récemment lu les commentaires de Yan LeCuns sur 1x1 convolutions : Dans les réseaux convolutionnels, il n’existe pas de "couches entièrement connectées". Il existe uniquement des couches de convolution avec des noyaux de convolution 1x1 et une table de connexion complète. C'est un fait trop rarement compris que ConvNets …
J'ai pensé aux réseaux de neurones récurrents (RNN) et leurs variétés et aux réseaux de neurones convolutionnels (CNN) et leurs variétés. Ces deux points seraient-ils justes de dire: Utilisez les CNN pour décomposer un composant (tel qu'une image) en sous-composants (tel qu'un objet dans une image, tel que le contour …
Je vois plusieurs fois dans la description de poste d'un informaticien demandant une expérience Python / Java et ne tenant aucun compte de R. Ci-dessous, un courrier électronique personnel que j'ai reçu du responsable informatique d'une entreprise pour laquelle j'avais postulé via linkedin. X, merci de vous connecter et d'exprimer …
Je savais que Residual Network (ResNet) rendait populaire l’initialisation normale. Dans ResNet, l'initialisation normale He est utilisée , tandis que la première couche utilise l'initialisation uniforme He. J'ai parcouru les papiers ResNet et "Delving Deep into Rectifiers" (papier d'initialisation He), mais je n'ai trouvé aucune mention sur init normal ou …
Quelle est la bonne approche et le bon algorithme de clustering pour le clustering de géolocalisation? J'utilise le code suivant pour regrouper les coordonnées de géolocalisation: import numpy as np import matplotlib.pyplot as plt from scipy.cluster.vq import kmeans2, whiten coordinates= np.array([ [lat, long], [lat, long], ... [lat, long] ]) x, …
Je travaille sur un projet de science des données utilisant Python. Le projet comporte plusieurs étapes. Chaque étape consiste à prendre un ensemble de données, à utiliser des scripts Python, des données auxiliaires, une configuration et des paramètres, et à créer un autre ensemble de données. Je stocke le code …
L'allocation de Dirichlet latente (LDA) et le processus de Dirichlet hiérarchique (HDP) sont tous deux des processus de modélisation par sujet. La principale différence est que LDA requiert la spécification du nombre de sujets, contrairement à HDP. Pourquoi est-ce si? Et quelles sont les différences, les avantages et les inconvénients …
Quand j'ai commencé avec les réseaux de neurones artificiels (NN), je pensais que je devais me battre contre la suralimentation comme principal problème. Mais dans la pratique, je ne parviens même pas à faire passer mon NN à la barre des 20% de taux d’erreur. Je ne peux même pas …
La logique dit souvent qu'en surajustant un modèle, sa capacité à généraliser est limitée, bien que cela puisse simplement signifier que l'ajustement excessif empêche un modèle de s'améliorer après une certaine complexité. La suradaptation provoque-t-elle une détérioration des modèles, quelle que soit la complexité des données, et si oui, pourquoi …
J'utilise TensorFlow pour des expériences principalement avec des réseaux de neurones. Bien que j'aie fait pas mal d'expériences (XOR-Problem, MNIST, des trucs de régression, ...) maintenant, je ne parviens pas à choisir la fonction de coût "correcte" pour des problèmes spécifiques car, dans l'ensemble, je pourrais être considéré comme un …
Les réseaux de neurones obtiennent les meilleurs résultats dans les tâches de vision par ordinateur (voir MNIST , ILSVRC , Kaggle Galaxy Challenge ). Ils semblent surperformer toutes les autres approches de Computer Vision. Mais il y a aussi d'autres tâches: Kaggle Défi Activité Moléculaire Régression: prédiction de pluie Kaggle …
R possède de nombreuses bibliothèques destinées à l’analyse de données (par exemple, JAGS, BUGS, ARULES, etc.), et est mentionné dans des manuels populaires tels que: J.Krusche, Doing Bayesian Data Analysis; B.Lantz, "Machine Learning avec R". J'ai observé une directive de 5 To pour qu'un jeu de données soit considéré comme …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.