Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données

4
Quelles sont les différences entre le codage fragmenté et le codeur automatique?
Le codage clairsemé est défini comme l’apprentissage d’un ensemble trop complet de vecteurs de base pour représenter les vecteurs d’entrée (<- pourquoi voulons-nous cela). Quelles sont les différences entre le codage fragmenté et le codeur automatique? Quand utiliserons-nous le codage fragmenté et l'auto-codeur?


2
Les preuves du réchauffement climatique provoqué par l'homme atteignent «l'étalon-or»: comment ont-ils fait cela?
Ce message dans un article de Reuter du 25.02.2019 fait actuellement le tour du monde: Les preuves du réchauffement climatique provoqué par l'homme atteignent «l'étalon-or» [Les scientifiques] ont déclaré que la confiance selon laquelle les activités humaines augmentaient la chaleur à la surface de la Terre avait atteint le niveau …

1
Régression logistique: test anova-chi-carré vs signification des coefficients (anova () vs summary () en R)
J'ai un modèle logistique GLM avec 8 variables. J'ai effectué un test du chi-carré dans R anova(glm.model,test='Chisq')et 2 des variables se révèlent être prédictives lorsqu'elles sont ordonnées en haut du test et pas tellement lorsqu'elles sont ordonnées en bas. La summary(glm.model)donne à penser que leurs coefficients ne sont pas significatifs …

8
Marche aléatoire sur les bords d'un cube
Une fourmi est placée dans un coin du cube et ne peut pas bouger. Une araignée commence à partir de l'angle opposé, et peuvent se déplacer le long des bords du cube dans toutes les directions (x,y,z)(x,y,z)(x,y,z) avec une probabilité égale 1/31/31/3 . En moyenne, de combien de pas l'araignée …


3
Contraste de signification dans la régression linéaire: test t significatif pour un coefficient vs une statistique F globale non significative
Je fais correspondre un modèle de régression linéaire multiple entre 4 variables catégoriques (avec 4 niveaux chacune) et une sortie numérique. Mon jeu de données a 43 observations. La régression me donne les suivantes ppp -values du ttt -test pour chaque coefficient de pente: .15,.67,.27,.02.15,.67,.27,.02.15, .67, .27, .02 . Ainsi, …


3
Comment prouver que la fonction de base radiale est un noyau?
Comment prouver que la fonction de base radiale est un noyau? Pour autant que je sache, afin de prouver cela, nous devons prouver l'un des éléments suivants:k(x,y)=exp(−||x−y||2)2σ2)k(x,y)=exp⁡(−||x−y||2)2σ2)k(x, y) = \exp(-\frac{||x-y||^2)}{2\sigma^2}) Pour tout ensemble de vecteurs matrice K ( x 1 , x 2 , . . . , X n …
35 svm  kernel-trick 

3
Qu'est-ce que l'erreur standard résiduelle?
Lors de l'exécution d'un modèle de régression multiple dans R, l'une des sorties est une erreur standard résiduelle de 0,0589 sur 95 161 degrés de liberté. Je sais que les 95 161 degrés de liberté sont exprimés par la différence entre le nombre d'observations dans mon échantillon et le nombre …



3
R - Confus sur la terminologie résiduelle
Erreur quadratique moyenne somme résiduelle de carrés erreur standard résiduelle erreur quadratique moyenne erreur de test Je pensais avoir l'habitude de comprendre ces termes, mais plus je fais de problèmes de statistiques, plus je me suis confus là où je devine moi-même. Je voudrais un peu de réassurance et un …

2
Modèle à effets mixtes avec imbrication
J'ai des données recueillies à partir d'une expérience organisée comme suit: Deux sites de 30 arbres chacun. 15 sont traités, 15 sont contrôlés sur chaque site. De chaque arbre, nous échantillonnons trois morceaux de la tige et trois morceaux des racines, soit 6 échantillons de niveau 1 par arbre, représentés …


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.