Ma tâche d'apprentissage automatique consiste à séparer le trafic Internet bénin du trafic malveillant. Dans le scénario réel, la majorité (par exemple 90% ou plus) du trafic Internet est bénigne. Ainsi, j’ai pensé que je devrais également choisir une configuration de données similaire pour la formation de mes modèles. Mais …
Je suis étudiant au doctorat en géophysique et travaille avec de grandes quantités de données d'images (des centaines de Go, des dizaines de milliers de fichiers). Je sais svnet gitassez bien et viens valoriser un historique du projet, combinée à la possibilité de facilement travailler ensemble et une protection contre …
J'utilise RStudio pour la programmation R. Je me souviens d’ID-s solides d’autres piles de technologies, comme Visual Studio ou Eclipse. J'ai deux questions: Quels autres IDE-s que RStudio sont utilisés (pensez à fournir une brève description à ce sujet). Est-ce que certains d'entre eux ont des avantages notables par rapport …
Quelles sont les pratiques courantes / meilleures pour gérer les données de temps pour une application d'apprentissage automatique? Par exemple, si dans le jeu de données, il existe une colonne avec l'horodatage de l'événement, telle que "2014-05-05", comment extraire des fonctionnalités utiles de cette colonne, le cas échéant? Merci d'avance!
Je travaille actuellement en tant que data scientist dans une entreprise de vente au détail (mon premier emploi en tant que DS, cette question peut donc être le résultat de mon manque d'expérience). Ils ont un énorme arriéré de projets de science des données très importants qui auraient un impact …
Combien de paramètres a un seul LSTM empilé? Le nombre de paramètres impose une limite inférieure au nombre d'exemples de formation requis et influence également le temps de formation. Par conséquent, connaître le nombre de paramètres est utile pour l'apprentissage de modèles utilisant des LSTM.
Nous en avons lu un peu sur les LSTM et sur leur utilisation pour les séries chronologiques. C’est intéressant mais difficile en même temps. Une chose que j’ai eu du mal à comprendre est l’approche pour ajouter des fonctionnalités à ce qui est déjà une liste de fonctionnalités de séries …
Motivation Je travaille avec des ensembles de données contenant des informations d'identification personnelle (PII) et ayant parfois besoin de partager une partie d'un ensemble de données avec des tiers, de manière à ne pas exposer les PII et ne pas engager la responsabilité de mon employeur. Notre approche habituelle consiste …
Je pensais que les deux, PReLU et Leaky ReLU sont f(x)=max(x,αx) with α∈(0,1)f(x)=max(x,αx) with α∈(0,1)f(x) = \max(x, \alpha x) \qquad \text{ with } \alpha \in (0, 1) Keras, cependant, a les deux fonctions dans la documentation . Leaky ReLU Source de LeakyReLU : return K.relu(inputs, alpha=self.alpha) D'où (voir code relu …
J'ai obtenu ValueError lors de la prévision de données de test à l'aide d'un modèle RandomForest. Mon code: clf = RandomForestClassifier(n_estimators=10, max_depth=6, n_jobs=1, verbose=2) clf.fit(X_fit, y_fit) df_test.fillna(df_test.mean()) X_test = df_test.values y_pred = clf.predict(X_test) L'erreur: ValueError: Input contains NaN, infinity or a value too large for dtype('float32'). Comment trouver les mauvaises …
J'aimerais utiliser un réseau de neurones pour la classification des images. Je vais commencer par préparer CaffeNet et le former pour mon application. Comment dois-je préparer les images d'entrée? Dans ce cas, toutes les images sont du même objet mais avec des variations (pensez: contrôle de qualité). Ils sont à …
Il semble que la similitude cosinus de deux caractéristiques ne soit que leur produit scalaire mis à l'échelle par le produit de leurs grandeurs. Quand la similarité de cosinus fait-elle une meilleure métrique de distance que le produit scalaire? Par exemple, la similarité entre le produit scalaire et le cosinus …
J'essaie de comprendre les principales différences entre GBM et XGBOOST. J'ai essayé de le rechercher sur Google, mais je n'ai trouvé aucune bonne réponse expliquant les différences entre les deux algorithmes et expliquant pourquoi xgboost fonctionne presque toujours mieux que GBM. Qu'est-ce qui rend XGBOOST si rapide?
Je lis souvent que dans le cas des modèles d'apprentissage en profondeur, la pratique habituelle consiste à appliquer des mini-lots (généralement un petit, 32/64) sur plusieurs périodes d'entraînement. Je ne peux pas vraiment comprendre la raison derrière cela. Sauf erreur de ma part, la taille du lot correspond au nombre …
Je lisais ce billet de blog intitulé: Le monde financier veut ouvrir les boîtes noires d'AI , où l'auteur fait référence à plusieurs reprises aux modèles ML comme des "boîtes noires". Une terminologie similaire a été utilisée à plusieurs endroits en référence aux modèles ML. Pourquoi est-ce? Ce n’est pas …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.