Existe-t-il une branche des statistiques qui traite des données dont les valeurs exactes ne sont pas connues , mais pour chaque individu, nous connaissons un maximum ou un minimum lié à la valeur ?
Je soupçonne que mon problème provient en grande partie du fait que j'ai du mal à l'articuler en termes statistiques, mais j'espère qu'un exemple aidera à clarifier:
Supposons qu'il existe deux populations connectées et telles que, à un moment donné, les membres de peuvent «passer» en , mais l'inverse n'est pas possible. Le moment de la transition est variable, mais non aléatoire. Par exemple, pourrait être "des individus sans progéniture" et "des individus avec au moins une progéniture". Je m'intéresse à l'âge de cette progression, mais je n'ai que des données transversales. Pour toute personne, je peux donnée savoir si elles appartiennent à ou . Je connais également l'âge de ces individus. Pour chaque individu de la populationB A B A B A B A B, Je sais que l'âge à la transition sera PLUS GRAND QUE leur âge actuel. De même, pour les membres de , je sais que l'âge à la transition était inférieur à leur âge actuel. Mais je ne connais pas les valeurs exactes.
Disons que j'ai un autre facteur que je veux comparer avec l'âge de la transition. Par exemple, je veux savoir si la sous-espèce ou la taille d'un individu affecte l'âge de la première progéniture. J'ai certainement des informations utiles qui devraient éclairer ces questions: en moyenne, des individus en , les individus plus âgés auront une transition ultérieure. Mais l'information est imparfaite , en particulier pour les jeunes. Et vice versa pour la population .B
Existe-t-il des méthodes établies pour traiter ce type de données ? Je n'ai pas nécessairement besoin d'une méthode complète pour mener à bien une telle analyse, juste de quelques termes de recherche ou de ressources utiles pour me lancer au bon endroit!
Mises en garde: Je fais l'hypothèse simplificatrice que la transition de à est instantanée. Je suis également prêt à supposer que la plupart des individus progresseront à un moment donné vers , en supposant qu'ils vivent assez longtemps. Et je me rends compte que les données longitudinales seraient très utiles, mais supposons qu'elles ne sont pas disponibles dans ce cas.B B
Toutes mes excuses s'il s'agit d'un doublon, comme je l'ai dit, une partie de mon problème est que je ne sais pas ce que je dois rechercher. Pour la même raison, veuillez ajouter d'autres balises le cas échéant.
Ensemble de données échantillon: Ssp indique l' un des deux sous - espèces, ou . La progéniture indique soit aucune progéniture ( ) ou au moins une progéniture ( )Y A B
age ssp offsp
21 Y A
20 Y B
26 X B
33 X B
33 X A
24 X B
34 Y B
22 Y B
10 Y B
20 Y A
44 X B
18 Y A
11 Y B
27 X A
31 X B
14 Y B
41 X B
15 Y A
33 X B
24 X B
11 Y A
28 X A
22 X B
16 Y A
16 Y B
24 Y B
20 Y B
18 X B
21 Y B
16 Y B
24 Y A
39 X B
13 Y A
10 Y B
18 Y A
16 Y A
21 X A
26 X B
11 Y A
40 X B
8 Y A
41 X B
29 X B
53 X B
34 X B
34 X B
15 Y A
40 X B
30 X A
40 X B
Modifier: l'exemple de jeu de données a été modifié car il n'était pas très représentatif