Groupe d’études et de recherche en analyse des décisions

G-2015-125

Bayesian estimation of disease prevalence from continuous diagnostic test data using Polya tree distributions

, et

Les inférences sur la prédominance d'une maladie ou d'une condition donnée sont déduites parfois des résultats de tests de diagnostic continus. Par exemple, de l'information sur la présence de grappes en tuberculose (TB) peut être estimée à partir de la distance génétique la plus proche (NGD), un test mesurant la parenté de souches de TB. La plupart des tests de diagnostic sont imparfaits, ce qui se traduit par un chevauchement entre les mesures provenant de sujets dont le vrai statut est positif et celles provenant de sujets dont le vrai statut est négatif. Les erreurs de classification qui en résultent doivent être prises en compte quand on estime la prédominance. En formulant des modèles pour les tests de diagnostic, on peut soit utiliser un modèle paramétrique standard tel qu'un modèle bi-normal, qui suppose que les données suivent une loi normale, soit considérer un modèle non paramétrique, qui offre plus de flexibilité en imposant moins de contraintes sur la forme des lois de probabilité. Parmi ces modèles non paramétriques, on peut nommer ceux qui reposent sur le processus de Dirichlet et ceux qui reposent sur le processus d'arbres de Pólya. Bien que les modèles d'arbres de Pólya aient été utilisés pour modéliser les tests de diagnostic continus, leurs propriétés dans le contexte de l'estimation de la prédominance n'ont pas été rigoureusement étudiées. Nous étendons ces travaux passés dans trois directions. Premièrement, nous utilisons des simulations pour connaître l'efficacité du modèle en pratique. Deuxièmement, nous établissons une méthode pour calculer les facteurs de Bayes pour fin de sélection entre modèle paramétrique et modèle non paramétrique. Troisièmement, nous étudions la dépendance d'un modèle d'arbres de Pólya, où la partition est fixe, sur la partition particulière sélectionnée, en le comparant à un modèle dont la partition est aléatoire. Finalement nous appliquons nos méthodes à l'estimation de la prédominance de formation de grappes en TB en utilisant des données NDG.

, 17 pages