Statistiques et Big Data linear-model

3

Trouvez la distribution et passez à la distribution normale

J'ai des données qui décrivent la fréquence à laquelle un événement se produit pendant une heure ("nombre par heure", nph) et la durée des événements ("durée en secondes par heure", dph). Ce sont les données d'origine: nph <- c(2.50000000003638, 3.78947368414551, 1.51456310682008, 5.84686774940732, 4.58823529414907, 5.59999999993481, 5.06666666666667, 11.6470588233699, 1.99999999998209, NA, 4.46153846149851, 18, …

8 normal-distribution data-transformation logistic generalized-linear-model ridge-regression t-test wilcoxon-signed-rank paired-data naive-bayes distributions logistic goodness-of-fit time-series eviews ecm panel-data reliability psychometrics validity cronbachs-alpha self-study random-variable expected-value median regression self-study multiple-regression linear-model forecasting prediction-interval normal-distribution excel bayesian multivariate-analysis modeling predictive-models canonical-correlation rbm time-series machine-learning neural-networks fishers-exact factorisation-theorem svm prediction linear reinforcement-learning cdf probability-inequalities ecdf time-series kalman-filter state-space-models dynamic-regression index-decomposition sampling stratification cluster-sample survey-sampling distributions maximum-likelihood gamma-distribution

2

Qu'est-ce que l'entrée du modèle MA (q) dans le monde réel?

Je comprends le modèle AR (p): son entrée est la série chronologique modélisée. Je suis complètement bloqué en lisant sur le modèle MA (q): son entrée est l' innovation ou le choc aléatoire comme il est souvent formulé. Le problème est que je ne peux pas imaginer comment obtenir un …

8 time-series arima linear-model intuition

2

Pourquoi un modèle statistique serait-il surchargé s'il était doté d'un énorme ensemble de données?

Mon projet actuel peut m'obliger à construire un modèle pour prédire le comportement d'un certain groupe de personnes. l'ensemble de données de formation ne contient que 6 variables (id est uniquement à des fins d'identification): id, age, income, gender, job category, monthly spend dans laquelle se monthly spendtrouve la variable …

8 modeling large-data overfitting clustering algorithms error spatial r regression predictive-models linear-model average measurement-error weighted-mean error-propagation python standard-error weighted-regression hypothesis-testing time-series machine-learning self-study arima regression correlation anova statistical-significance excel r regression distributions statistical-significance contingency-tables regression optimization measurement-error loss-functions image-processing java panel-data probability conditional-probability r lme4-nlme model-comparison time-series probability probability conditional-probability logistic multiple-regression model-selection r regression model-based-clustering svm feature-selection feature-construction time-series forecasting stationarity r distributions bootstrap r distributions estimation maximum-likelihood garch references probability conditional-probability regression logistic regression-coefficients model-comparison confidence-interval r regression r generalized-linear-model outliers robust regression classification categorical-data r association-rules machine-learning distributions posterior likelihood r hypothesis-testing normality-assumption missing-data convergence expectation-maximization regression self-study categorical-data regression simulation regression self-study self-study gamma-distribution modeling microarray synthetic-data

1

Échec de la régression / prédiction linéaire sur un ensemble de données réelles

J'ai un ensemble de données sur lequel j'essaie de faire une régression, et échoue. La situation: Des milliers d'opérateurs de robots de combat se battent entre eux à l'aide de robots de combat. Certains robots de combat sont forts et puissants, et d'autres sont faibles; les plus forts gagnent plus …

8 r regression predictive-models linear-model

1

Régression monotone robuste dans R

J'ai le tableau suivant dans R df <- structure(list(x = structure(c(12458, 12633, 12692, 12830, 13369, 13455, 13458, 13515), class = "Date"), y = c(6080, 6949, 7076, 7818, 0, 0, 10765, 11153)), .Names = c("x", "y"), row.names = c("1", "2", "3", "4", "5", "6", "8", "9"), class = "data.frame") > df …

8 r regression linear-model robust

2

À la recherche du «coude» dans les données

La subitisation est l'énumération rapide et précise des affichages à faible numérosité, qui se distingue du comptage par une forte non-linéarité dans le tracé des temps de réponse. Vous trouverez ci-dessous un graphique représentatif de Watson, DG, Maylor, EA et Bruce, LAM (2007). Notez que les temps de dénombrement moyens …

8 linear-model contrasts

3

Comment évaluer les résultats de la régression linéaire

J'ai un problème de régression linéaire. En bref, j'ai un ensemble de données, je l'ai divisé en deux sous-ensembles. Un sous-ensemble est utilisé pour trouver la régression linéaire (sous-ensemble d'apprentissage), un autre est utilisé pour l'évaluer (sous-ensemble d'évaluation). Ma question est de savoir comment évaluer le résultat de cette régression …

8 regression linear-model

2

Comment expliquer les modèles mixtes linéaires aux laïcs?

J'ai besoin d'expliquer le concept de modèles mixtes linéaires dans un article destiné à un public grand public. Existe-t-il un moyen de communiquer l'essentiel du concept en une phrase ou deux?

8 regression mixed-model linear-model

3

Estimation de la régression linéaire avec OLS vs ML

Supposons que je vais estimer une régression linéaire où je suppose . Quel est l'avantage d'OLS par rapport à l'estimation ML? Je sais que nous devons connaître une distribution de lorsque nous utilisons des méthodes ML, mais comme je suppose que que j'utilise ML ou OLS, ce point ne semble …

8 regression least-squares linear-model

Questions marquées «linear-model»