Supposons qu'une certaine maladie ( ) ait une prévalence de . Supposons également qu'un certain symptôme ( ) ait une prévalence (dans la population générale = personnes atteintes de cette maladie D et personnes sans cette maladie [probablement avec une autre maladie, mais ce n'est pas important]) de . Dans une recherche précédente, il a été découvert que la probabilité conditionnelle (la probabilité d'avoir le symptôme , étant donné la maladie est de ).
Première question : pourrait-il être interprété comme équivalent à la prévalence du symptôme dans le groupe de personnes atteintes de la maladie ?
Deuxième question : je veux créer dans R un jeu de données, qui montre que:
Comment faire ça? Si j'utilise simplement la sample
fonction, mon jeu de données manque d'informations que :
symptom <- sample(c("yes","no"), 1000, prob=c(0.005, 0.995), rep=T)
disease <- sample(c("yes","no"), 1000, prob=c(0.002, 0.998), rep=T)
Ma question est donc: comment créer un bon ensemble de données, y compris la probabilité conditionnelle que je souhaite?
EDIT : J'ai également posté la même question sur stackoverflow.com ( /programming/7291935/how-to-create-a-dataset-with-conditional-probability ), car, à mon avis, ma question est hérité du programme de langue R, mais aussi de la théorie statistique.