Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
J'essaie d'adapter une spline pour un GLM à l'aide de R. Une fois que j'ai ajusté la spline, je veux pouvoir prendre mon modèle résultant et créer un fichier de modélisation dans un classeur Excel. Par exemple, supposons que j'ai un ensemble de données où y est une fonction aléatoire …
Considérons des observations censurées à droite, avec des événements aux moments t1, t2, …t1,t2,…t_1, t_2, \dots . Le nombre d'individus sensibles au temps est , et le nombre d'événements au moment est .n i i d ijejeinjenjen_ijejeiréjeréjed_i L'estimateur de Kaplan-Meier ou produit apparaît naturellement comme un MLE lorsque la fonction …
Salut, j'essaie de trouver l'équivalent non paramétrique d'une ANOVA bidirectionnelle (conception 3x4) qui est capable d'inclure des interactions. D'après ma lecture de Zar 1984 "Analyse biostatistique", cela est possible en utilisant une méthode proposée par Scheirer, Ray et Hare (1976), cependant, selon d'autres articles en ligne, il a été déduit …
Pour ce modèle univarié de régression linéaire yje= β0+ β1Xje+ ϵjeyje=β0+β1Xje+ϵjey_i = \beta_0 + \beta_1x_i+\epsilon_i données ensemble donné D = { ( x1, y1) , . . . , ( xn, yn) }ré={(X1,y1),...,(Xn,yn)}D=\{(x_1,y_1),...,(x_n,y_n)\} , les estimations des coefficients sont β 1 = Σ i x i y i - n …
La refonte d'un modèle de régression linéaire multivariée en régression linéaire multiple est-elle entièrement équivalente? Je ne parle pas simplement en cours d' exécution régressions distinctes.ttt J'ai lu ceci à quelques endroits (Bayesian Data Analysis - Gelman et al., Et Multivariate Old School - Marden) qu'un modèle linéaire multivarié peut …
Je me demandais si quelqu'un sait ou s'il existe une application en statistique dans laquelle une forte cohérence d'un estimateur est requise au lieu d'une faible cohérence. Autrement dit, une cohérence forte est essentielle pour l'application et l'application ne fonctionnerait pas avec une cohérence faible.
J'ai pris un échantillon de points de données d'une population. Chacun de ces points a une vraie valeur (connue de la vérité terrain) et une valeur estimée. Je calcule ensuite l'erreur pour chaque point échantillonné, puis calcule le RMSE de l'échantillon.nnn Comment puis-je déduire une sorte d'intervalle de confiance autour …
Je recherche des classificateurs qui produisent des probabilités que les exemples appartiennent à l'une des deux classes. Je connais la régression logistique et les Bayes naïfs, mais pouvez-vous m'en parler d'autres qui fonctionnent de manière similaire? Autrement dit, les classificateurs qui prédisent non pas les classes auxquelles appartiennent les exemples, …
J'ai lu à plusieurs endroits que le calcul de la moyenne d'une variable ordinale est inapproprié. J'essaie de comprendre pourquoi cela pourrait être inapproprié. Je pense que c'est parce que, en général, une variable ordinale n'est pas normalement distribuée et donc le calcul de la moyenne donnera une représentation inexacte. …
J'apprends le R et j'ai expérimenté l'analyse de la variance. J'ai couru les deux kruskal.test(depVar ~ indepVar, data=df) et anova(lm(depVar ~ indepVar, data=dF)) Y a-t-il une différence pratique entre ces deux tests? D'après ce que je comprends, ils évaluent tous deux l'hypothèse nulle selon laquelle les populations ont la même …
Je teste différents classificateurs sur un ensemble de données où il y a 5 classes et chaque instance peut appartenir à une ou plusieurs de ces classes, j'utilise donc spécifiquement les classificateurs multi-étiquettes de scikit-learn sklearn.multiclass.OneVsRestClassifier. Maintenant, je veux effectuer une validation croisée en utilisant le sklearn.cross_validation.StratifiedKFold. Cela produit l'erreur …
J'essaie de comprendre ce que signifie l'hypothèse multiple dans l'apprentissage semi-supervisé. Quelqu'un peut-il expliquer de manière simple? Je ne peux pas obtenir l'intuition derrière cela. Il dit que vos données se trouvent sur un collecteur de faible dimension intégré dans un espace de dimension supérieure. Je n'ai pas compris ce …
Est-ce que les statistiques sont mathématiques ou non? Étant donné que ce sont tous des chiffres, principalement enseignés par les départements de mathématiques et que vous obtenez des crédits en mathématiques, je me demande si les gens ne le pensent pas à moitié en plaisantant quand ils le disent, comme …
J'ai une variable aléatoire où a est normalement distribué . Que puis-je dire à propos de et ? Une approximation serait également utile.X(a)=log(a)X(a)=log(a)X(a) = \log(a)N(μ,σ2)N(μ,σ2)\mathcal N(\mu,\sigma^2)E(X)E(X)E(X)Var(X)Var(X)Var(X)
D'après l' Encyclopedia of Statistical Sciences, je comprends que, étant donné attributs dichotomiques (binaires: 1 = présents; 0 = absents) (variables), nous pouvons former un tableau de contingence pour deux objets i et j quelconques d'un échantillon:ppp j 1 0 ------- 1 | a | b | i ------- 0 …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.