J'ai un ensemble de données détaillant un grand nombre de jeux de cricket (quelques milliers). Dans le cricket, les "quilleurs" lancent à plusieurs reprises une balle sur une succession de "batteurs". Le lanceur essaie de faire sortir le batteur. À cet égard, il est assez similaire aux lanceurs et frappeurs …
Dans mon domaine, la façon habituelle de tracer des données appariées consiste en une série de segments de ligne en pente mince, en les superposant à la médiane et à l'IC de la médiane pour les deux groupes: Cependant, ce type de tracé devient beaucoup plus difficile à lire car …
J'ai quelques modèles prédictifs dont je voudrais tester les performances (c.-à-d. Prendre mon jeu de données, le «rembobiner» à un point antérieur dans le temps et voir comment le modèle aurait fonctionné de manière prospective). Le problème est que certains de mes modèles ont été construits via un processus interactif. …
J'ai un ensemble de données d'environ 5000 fonctionnalités. Pour ces données, j'ai d'abord utilisé le test du chi carré pour la sélection des fonctionnalités; après cela, j'ai obtenu environ 1500 variables qui ont montré une relation de signification avec la variable de réponse. Maintenant, je dois ajuster la régression logistique …
Dans Dixon, Coles ( 1997 ), ils ont utilisé l'estimation du maximum de vraisemblance pour les deux modèles de Poisson indépendants modifiés en (4.3) pour modéliser les scores au soccer. J'essaie d'utiliser R afin de "reproduire" les paramètres alpha et bêta ainsi que les paramètres de l'effet home (p. 274, …
Puisque nous ne pouvons pas ajuster le modèle ARIMA lorsque l'hypothèse de variance constante est violée, quel modèle peut être utilisé pour ajuster les séries temporelles univariées?
J'ai presque les mêmes questions comme celle-ci: comment puis-je modéliser efficacement la somme des variables aléatoires de Bernoulli? Mais le cadre est assez différent: P ( X i = 1 ) = p i N p iS=∑i=1,NXiS=∑i=1,NXiS=\sum_{i=1,N}{X_i} , , ~ 20, ~ 0,1P(Xi=1)=piP(Xi=1)=piP(X_{i}=1)=p_iNNNpipip_i Nous avons les données pour les résultats …
Nous avons un ensemble d'échantillons biologiques qui était assez cher à obtenir. Nous avons soumis ces échantillons à une série de tests pour générer des données qui sont utilisées pour construire un modèle prédictif. À cette fin, nous avons divisé les échantillons en ensembles d'apprentissage (70%) et d'essai (30%). Nous …
Donc, j'ai 16 essais dans lesquels j'essaie d'authentifier une personne à partir d'un trait biométrique en utilisant Hamming Distance. Mon seuil est fixé à 3,5. Mes données sont ci-dessous et seul l'essai 1 est un vrai positif: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 …
Je recherche un outil logiciel (de préférence open source) pour dessiner efficacement et joliment des modèles d'équations / mélanges structurels. Après avoir examiné xfig et graphviz, je m'en tiens maintenant au package général de graphiques vectoriels inkscape car il semble le plus flexible. Je voudrais interroger la communauté stat.stackexchange: Comment …
J'ai des données avec un double pic que j'essaie de modéliser, et il y a suffisamment de chevauchement entre les pics que je ne peux pas les traiter indépendamment. Un histogramme des données pourrait ressembler à ceci: J'ai créé deux modèles pour cela: l'un utilise deux distributions de Poisson, et …
Pour la sélection des prédicteurs en régression linéaire multivariée avec prédicteurs appropriés, quelles méthodes sont disponibles pour trouver un sous-ensemble «optimal» des prédicteurs sans tester explicitement tous les sous-ensembles de ? Dans 'Applied Survival Analysis', Hosmer et Lemeshow font référence à la méthode de Kuk, mais je ne trouve pas …
A fourni une taille d'échantillon "N" que je prévois d'utiliser pour prévoir les données. Quelles sont certaines des façons de subdiviser les données afin que j'en utilise une partie pour établir un modèle et les autres données pour valider le modèle? Je sais qu'il n'y a pas de réponse en …
Salut, j'étudie les techniques de régression. Mes données ont 15 fonctionnalités et 60 millions d'exemples (tâche de régression). Lorsque j'ai essayé de nombreuses techniques de régression connues (arbre boosté par gradient, régression d'arbre de décision, AdaBoostRegressor, etc.), la régression linéaire s'est très bien déroulée. Meilleur score parmi ces algorithmes. Quelle …
J'essayais de réapprendre les statistiques bayésiennes (à chaque fois que je pensais l'avoir enfin, quelque chose d'autre apparaissait que je n'avais pas envisagé plus tôt ...) mais il n'était pas clair (pour moi) quel était le processus de génération de données dans le cadre bayésien est en fait. Le cadre …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.