Science des données

Questions-réponses pour les professionnels de la science des données, les spécialistes en apprentissage automatique et les personnes intéressées

4
Apprendre la régression ordinale dans R?
Je travaille sur un projet et j'ai besoin de ressources pour me mettre au courant. L'ensemble de données comprend environ 35 000 observations sur une trentaine de variables. Environ la moitié des variables sont catégorielles, certaines ayant plusieurs valeurs possibles différentes, c'est-à-dire que si vous divisez les variables catégorielles en …




5
Qualifications pour les programmes de doctorat
Yann LeCun a mentionné dans son AMA qu'il considère qu'il est très important d'avoir un doctorat pour obtenir un emploi dans une grande entreprise. J'ai une maîtrise en statistique et mon premier cycle était en économie et mathématiques appliquées, mais je suis maintenant à la recherche de programmes de doctorat …
10 education 


3
Quelles sont les contraintes de mémoire de R?
En examinant la « modélisation prédictive appliquée », un réviseur déclare : Une critique que j'ai de la pédagogie de l'apprentissage statistique (SL) est l'absence de considérations de performance de calcul dans l'évaluation des différentes techniques de modélisation. Avec ses efforts sur le bootstrap et la validation croisée pour ajuster …
10 apache-hadoop  r 


3
Comment encoder une classe avec 24 000 catégories?
Je travaille actuellement sur un modèle de régression logistique pour la génomique. L'un des champs de saisie que je souhaite inclure en tant que covariable est genes. Il existe environ 24 000 gènes connus. Il existe de nombreuses fonctionnalités avec ce niveau de variabilité en biologie computationnelle et des centaines …



2
Comment détecter si une image a été retouchée?
Je voudrais vérifier les fichiers JPG s'ils ont été manipulés pour changer le contenu. Ce que je considère PAS photoshoppé: Recadrage Tournant (Mise à l'échelle) Résolution de l'image Modifications automatiques que les smartphones peuvent apporter Ce que je considère comme le photoshopping: Ajout d'une nouvelle image au-dessus de parties de …

4
PCA est-il considéré comme un algorithme d'apprentissage automatique
J'ai compris que l'analyse des composants principaux est une technique de réduction de dimensionnalité, c'est-à-dire que compte tenu de 10 entités en entrée, elle produira un plus petit nombre d'entités indépendantes qui sont une transformation orthogonale et linéaire des entités originales. Est PCAconsidéré en soi comme un algorithme d'apprentissage ou …

2
Pourquoi utiliser la régularisation L1 sur L2?
En effectuant un modèle de régression linéaire à l'aide d'une fonction de perte, pourquoi devrais-je utiliser au lieu de la régularisation ?L1L1L_1L2L2L_2 Est-il préférable de prévenir le sur-ajustement? Est-ce déterministe (donc toujours une solution unique)? Est-il meilleur dans la sélection des fonctionnalités (parce que la production de modèles clairsemés)? Disperse-t-il …

3
Les coordonnées GPS (latitude et longitude) peuvent-elles être utilisées comme entités dans un modèle linéaire?
J'ai des ensembles de données qui contiennent, parmi de nombreuses fonctionnalités, des coordonnées GPS (latitude et longitude). Je voudrais utiliser ces ensembles de données pour explorer des problèmes tels que: (1) calculer l'ETA pour conduire entre les points de début et de fin; et (2) estimer le degré de criminalité …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.