Compréhension des examens médicaux et des résultats des examens

ParBrian F. Mandell, MD, PhD, Cleveland Clinic Lerner College of Medicine at Case Western Reserve University

Reviewed ByMichael R. Wasserman, MD, California Association of Long Term Care Medicine

Vérifié/Révisé juil. 2024 | Modifié nov. 2024

v1123930_fr

Voir l’éducation des patients

Définition du résultat positif d'un test|
Caractéristiques des tests|
Tests dichotomiques|
Tests continus|
Théorème de Bayes|
Tests séquentiels|
Tests de dépistage|
Seuils de tests|

Les examens permettent d'établir un diagnostic chez un patient symptomatique (examens diagnostiques) ou d'identifier une maladie occulte chez un patient asymptomatique (dépistage). Si les tests ont été ordonnés de manière appropriée sur la base de la présentation clinique, tous les résultats doivent permettre de déterminer les diagnostics possibles. Les résultats des tests peuvent perturber le processus de décision clinique si le test discrimine mal entre les patients qui ont et qui n'ont pas la(les) maladie(s) suspectée(s) ou si le résultat du test est mal intégré dans le contexte clinique.

Les examens biologiques sont imparfaits et peuvent, à tort identifier certains sujets en bonne santé comme malades (résultat faux positif) ou peuvent identifier par erreur certains sujets malades comme sains (résultat faux négatif). La capacité d'un test à correctement identifier un patient qui a une maladie dépend de la probabilité que le sujet a d'avoir cette maladie (probabilité a priori) et des caractéristiques intrinsèques du test (1).

Bien que ces tests diagnostiques apportent souvent une contribution essentielle à la décision clinique précise, le test peut avoir des conséquences indésirables ou inattendues. Les examens complémentaires doivent être pratiqués après délibération et dans un but précis et dans l'espoir que le résultat du test réduise les ambiguïtés et contribue à améliorer leur santé. Outre le risque de fournir des informations incorrectes (retardant ainsi le début du traitement ou conduisant à un traitement inutile), les examens complémentaires consomment des ressources qui sont limitées et ils peuvent eux-mêmes avoir des effets indésirables (p. ex., pneumothorax provoqué par une biopsie pulmonaire) ou inciter à pratiquer d'autres examens inutiles ou stressants.

Les résultats d'un dépistage ou d'un test diagnostique doivent être interprétés en fonction de la situation clinique spécifique et des tests de base antérieurs.

Référence

1. Armstrong KA, Metlay JP: Annals Clinical Decision Making: Using a Diagnostic Test. Ann Intern Med. 2020;172(9):604-609. doi:10.7326/M19-1940

Définition du résultat positif d'un test

Parmi les examens les plus fréquemment utilisés sont ceux qui donnent des résultats selon une échelle quantitative continue (p. ex., glycémie, numération des globules blancs). Ces tests peuvent fournir des informations cliniques utiles tout au long de leurs intervalles de valeurs, mais les médecins les utilisent souvent pour diagnostiquer un état en exigeant que le résultat soit classé comme positif ou négatif (c'est-à-dire, maladie présente ou absente) en se basant sur la comparaison par rapport à un critère ou à un seuil établis. Ces seuils sont habituellement choisis en fonction de l'analyse statistique et conceptuelle qui tente de faire un compromis entre le taux de résultats faussement positifs (incitant à des examens inutiles, chers et à des traitements qui peuvent être dangereux) et le taux de résultats faussement négatifs (qui ne permettent pas de diagnostiquer une maladie traitable). L'identification d'un seuil dépend également du fait que l'on dispose d'une norme de référence pour identifier la maladie en question.

Typiquement, ces résultats de tests quantitatifs (p. ex., numération des globules blancs dans les cas de suspicion de pneumonie bactérienne) suivent un certain type de courbe de distribution (pas nécessairement une courbe normale, bien que souvent définie comme telle). La distribution des résultats des tests chez les patients qui présentent une maladie est centrée sur un point différent de celui des patients qui n'ont pas la maladie. Certains patients qui présentent une maladie auront un résultat très élevé ou très bas, mais la plupart auront un résultat autour de la moyenne. Inversement, certains patients qui n'ont pas la maladie ont un résultat très élevé ou très bas, mais la plupart ont un résultat autour d'une moyenne différente de celle des patients qui présentent la maladie. Dans le cas de la plupart des examens, les distributions se recouvrent de telle sorte que de nombreux résultats possibles de tests se produisent chez des patients qui présentent et qui ne présentent pas la maladie; ces résultats sont plus clairement illustrés lorsque les courbes sont représentées sur le même graphique (voir figure Distribution des résultats du test). Certains patients au-dessus et en dessous du seuil sélectionné seront incorrectement caractérisés. Ajuster un seuil pour identifier un plus grand nombre de patients qui présentent une maladie donnée (augmentation de la sensibilité du test), augmente également le nombre de faux positifs (faible spécificité), et le déplacement du seuil, autre façon d'éviter les faux diagnostics de patients, augmente le nombre de faux négatifs. Chaque seuil est associé à une probabilité spécifique de résultats vrais positifs et faux positifs.

Distribution des résultats du test

Les patients qui ont la maladie sont présentés dans la partie haute de la distribution; les patients qui n'ont pas la maladie sont présentés dans la partie inférieure de la distribution. Chez les patients qui présentent la maladie, la région située sous la distribution des résultats situés à droite (au-dessus) du seuil correspond au taux de vrais positifs du test (c'est-à-dire, à sa sensibilité); la région située à la gauche du (en dessous) du seuil correspond au taux de faux négatifs. Chez les patients qui n'ont pas la maladie, la région à la droite du critère de coupure correspond à un taux de faux positifs et la région à gauche correspond au taux de vrais négatifs (c'est-à-dire, à sa spécificité). Dans le cas de 2 distributions qui se recouvrent (p. ex., les patients qui présentent et qui ne présentent pas la maladie), déplacer le seuil modifie la sensibilité et la spécificité, mais dans des directions opposées; modifier le seuil de 1 à 2 diminue le nombre de faux négatifs (augmente la sensibilité) mais augmente également le nombre de faux positifs (diminue la spécificité).

Courbes caractéristiques opérationnelles du receveur

La représentation graphique de la fraction de vrais positifs (nombre de vrais positifs/nombre de malades) en fonction de la fraction des résultats faussement positifs (nombre de faux-positifs/nombre sans maladie) pour une série de seuils génère une courbe dite courbe caractéristique opérationnelle du receveur. La courbe caractéristique opérationnelle du receveur représente graphiquement le compromis entre la sensibilité et la spécificité lorsque le seuil est ajusté (voir figure Courbe caractéristique opérationnelle typique du receveur). Par convention, la fraction de vrais positifs est placée sur l'axe des y et la fraction de faux-positifs est placée sur l'axe des x. Plus la surface sous la courbe est importante, mieux le test discrimine entre les patients qui ont ou qui n'ont pas la maladie.

Les courbes caractéristiques opérationnelles du receveur permettent que les examens soient comparés en fonction d'une variété de seuils. Dans l'exemple, l'examen A est plus performant que l'examen B sur toutes les plages. Les courbes opérationnelles facilitent également la sélection du seuil conçu pour maximiser l'utilité d'un test. Si un examen est conçu pour confirmer une maladie, un seuil avec une plus grande spécificité et une sensibilité plus faible est choisi. Si un test est conçu pour dépister une maladie occulte, un seuil de plus grande sensibilité et de spécificité plus faible sera choisi.

Courbe caractéristique opérationnelle typique du receveur

Caractéristiques des tests

Certaines variables cliniques n'ont que 2 résultats possibles (p. ex., vivante/mort, enceinte/pas enceinte); ces variables sont appelées catégorielles et dichotomiques. D'autres résultats catégoriels peuvent avoir plusieurs valeurs discrètes (p. ex., groupe sanguin, échelle de coma de Glasgow [Glasgow Coma Scale]) qui sont dites nominales ou ordinales. Les variables nominales telles que le groupe sanguin n'ont pas d'ordre particulier. Les variables ordinales telles que l'échelle de coma de Glasgow (Glasgow Coma Scale) ont des valeurs discrètes qui sont disposées dans un ordre particulier. D'autres variables cliniques, y compris de nombreux tests diagnostiques, sont continues et ont un nombre infini de résultats possibles (p. ex., numération des leucocytes, glycémie). De nombreux médecins choisissent un seuil qui peut faire qu'une variable continue soit traitée comme une variable dichotomique (p. ex., les patients qui présentent une glycémie à jeun > 126 mg/dL [7,0 mmol/L] sont considérés comme diabétiques). D'autres tests diagnostiques continus ont une utilité diagnostique quand ils ont des seuils multiples ou lorsque différentes gammes différentes de résultats ont une valeur diagnostique différente.

Lorsque les résultats des tests peuvent être définis comme positifs ou négatifs, tous les résultats possibles peuvent être enregistrés dans un tableau simple 2 × 2 (voir tableau Distribution de résultats hypothétiques) à partir duquel d'importantes caractéristiques discriminatoires des tests, dont la sensibilité, la spécificité, la valeur prédictive positive et négative, et le ratio de vraisemblance peuvent être calculés (voir tableau Répartition des résultats d'un test d'estérase leucocytaire hypothétique dans une cohorte de 1000 femmes présentant une prévalence présumée d'infection des voies urinaires de 30%).

Tableau

Distribution de résultats hypothétiques

Tableau

Distribution de résultats hypothétiques

Résultats	Maladie présente	Absence de maladie
Test positif	Vrai positif	Faux positif
Test négatif	Faux négatif	Vrai négatif
Total des patients	Tous les patients atteints de la maladie	Tous les patients qui ne présentent pas la maladie

Sensibilité, spécificité et valeurs prédictives

La sensibilité et la spécificité sont généralement considérées comme des caractéristiques du test lui-même, indépendantes de la population de patients.

La sensibilité est la probabilité que les patients porteurs de la maladie aient un résultat positif (taux de vrais positifs)

Ainsi, un test positif chez 8 patients sur 10 souffrant d'une certaine maladie a une sensibilité de 0,8 (ou de 80%). La sensibilité représente la façon dont un test détecte la maladie; un test de faible sensibilité n'identifie pas de nombreux patients qui présentent une maladie et un test de sensibilité élevée permet d'exclure un diagnostic lorsque les résultats sont négatifs. La sensibilité est le complément du taux de faux-négatifs (c'est-à-dire, le taux de faux-négatifs plus la sensibilité = 100%).

La spécificité est la probabilité que les patients qui n'ont pas la maladie auront un résultat négatif du test (taux de vrais négatifs).

Ainsi, un test qui est négatif chez 9 patients sur 10 qui n'ont pas la maladie a une spécificité de 0,9 (ou 90%). La spécificité représente la façon dont un test identifie correctement les patients qui n'ont pas la maladie, car les tests qui ont une spécificité élevée ont un faible taux de faux positifs. Un test qui a une faible spécificité diagnostique de nombreux patients qui ne présentent pas la maladie comme ayant la maladie. C'est le complémentaire du taux de faux positifs.

Les valeurs prédictives décrivent le comportement du test dans une population donnée de patients ne sachant pas s'ils ont la maladie. Pour un test donné, les valeurs prédictives varient selon la prévalence de la maladie dans la population de patients testée.

La valeur prédictive positive est la proportion de patients qui présentent un test positif qui ont réellement la maladie.

Ainsi, si 9 des 10 des résultats positifs sont corrects (vrais positifs), la valeur prédictive positive est de 90%. Puisque tous les résultats positifs présentent un certain nombre de vrais positifs et de faux positifs, la valeur prédictive positive décrit la probabilité qu'un résultat positif dans une population de patients donnée représente un vrai positif.

La valeur prédictive négative est la proportion des patients qui ont un résultat négatif et qui sont réellement exempts de la maladie.

Sensibilité, spécificité et valeurs prédictives

VAN = valeur prédictive négative; PPV = valeur prédictive positive.

Ainsi, si 8 des 10 résultats négatifs sont corrects (vrais négatifs), la valeur prédictive négative est de 80%. Tous les patients qui ont des résultats négatifs n'étant pas de vrais négatifs, certains patients qui présentent un résultat négatif ont effectivement la maladie. La valeur prédictive négative décrit la probabilité qu'un résultat négatif dans une population de patients donnée représente un vrai négatif.

Calculateur clinique

Sensibilité d'un test

Calculateur clinique

Spécificité d'un test

Calculateur clinique

Valeur prédictive positive issue des données brutes

Calculateur clinique

Valeur prédictive positive d'un test

Calculateur clinique

Valeur prédictive négative issue des données brutes

Calculateur clinique

Valeur prédictive négative d'un test

Rapports de vraisemblance

Contrairement à la sensibilité et à la spécificité, qui ne s'applique pas aux probabilités spécifiques des patients, le rapport de vraisemblance permet aux médecins d'interpréter les résultats des tests chez un patient donné à la condition que la probabilité pré-test de la maladie soit connue (bien que souvent estimée).

Le rapport de vraisemblance décrit l'évolution de la probabilité pré-test de la maladie lorsque le résultat du test est connu et répond à la question

Dans quelle mesure la probabilité post-test a-t-elle changé par rapport à la probabilité pré-test à présent que le résultat du test est connu?

De nombreux tests cliniques sont dichotomiques; ils sont soit au-dessus du seuil (positif) soit en dessous du seuil (négatif) et il n'y a que 2 résultats possibles. D'autres tests donnent des résultats continus ou sur une plage où des seuils multiples sont sélectionnés. La probabilité post-test réelle dépend de la valeur du rapport de vraisemblance (qui dépend des caractéristiques opérationnelles du test) et de l'estimation de la probabilité pré-test de la maladie. Lorsque le test pratiqué est dichotomique et que le résultat est soit positif, soit négatif, la sensibilité et la spécificité peuvent être utilisées pour calculer un rapport de vraisemblance positif (RV+) ou négatif (RV-).

RV+: le rapport entre la probabilité d'un résultat de test positif se produisant chez des patients atteints de la maladie (vrai positif) à la probabilité d'un résultat de test positif chez les patients qui n'ont pas la maladie (faux positif)
RV-: le rapport entre la probabilité d'un résultat de test négatif chez des patients atteints de la maladie (faux négatif) à la probabilité d'un résultat de test négatif chez les patients qui n'ont pas la maladie (vrai négatif)

Quand le résultat est continu ou a plusieurs seuils, la courbe caractéristique opérationnelle du receveur, non la sensibilité et la spécificité, est utilisée pour calculer un RV qui n'est plus décrit comme RV+ ou RV-.

Puisque le rapport de vraisemblance est un rapport d'événements mutuellement exclusifs plutôt qu'une proportion d'un total, il représente un odds plutôt qu'une probabilité. Pour un test donné, le rapport de vraisemblance est différent pour les résultats positifs et négatifs.

Par exemple, dans le cas d'un résultat positif à un test donné, un rapport de vraisemblance de 2,0 indique que les odds sont de 2:1 (vrais positifs:faux positifs) et qu'un résultat positif au test correspond à la présence de la maladie. Sur 3 tests positifs, 2 se produiraient en cas de maladie (vrais positifs) et 1 se produirait chez un patient qui n'a pas la maladie (faux positif). Les vrais positifs et les faux positifs étant des composantes des calculs de sensibilité et de spécificité, le RV+ peut également être calculé comme la sensibilité/(1 − la spécificité). Plus le RV+ est élevé, plus la quantité d'information fournie par le résultat positif d'un test est élevée; un résultat positif à un test qui a un RV+ > 10 est considéré comme une preuve solide en faveur d'un diagnostic. Autrement dit, l'estimation de la probabilité pré-test se déplace fortement vers 100% quand un test positif a un RV+ élevé.

Pour un résultat de test négatif, un RV- de 0,25 indique que les probabilités sont de 1:4 (faux négatifs: vrais négatifs) qu'un résultat de test négatif représente un patient atteint de maladie. Sur 5 résultats de tests négatifs, 1 se produirait chez un patient qui présente la maladie (faux négatif) et 4 se produiraient chez les patients qui ne présentent pas la maladie (vrai négatif). Le RV- peut également être calculé comme (1 − sensibilité)/spécificité. Plus le RV- est bas, plus grande est la quantité d'information fournie par le résultat négatif d'un test; un résultat négatif à un test avec un RV < 0,1 est considéré comme une preuve solide à l'encontre d'un diagnostic. Autrement dit, l'estimation de la probabilité pré-test se déplace fortement vers 0% de probabilité quand un test négatif a un RV- bas.

Les résultats d'un test qui a un LR de 1,0 ne fournissent aucune information et n'ont aucune influence sur la probabilité post-test de maladie.

Les rapports de vraisemblance sont commodes pour comparer les tests et sont également utilisés dans l'analyse bayésienne pour interpréter les résultats des tests. Les rapports de vraisemblance se modifient, comme le font la sensibilité et la spécificité, lorsque les seuils se modifient. À titre d'exemple, un seuil élevé pour la numération des globules blancs (p. ex., 30 000/mcL) en cas de possible appendicite aiguë perforée est plus spécifique et aura un RV+ élevé mais également un RV- élevé (et donc peu informatif); choisir un seuil beaucoup plus bas et très sensible (p. ex., 12 000/mcL) aurait un RV- bas mais aussi un RV+ bas.

Calculateur clinique

Multicalculatrice de rapport de vraisemblance

Calculateur clinique

Rapport de vraisemblance d'obtention de résultats négatifs à partir des données brutes

Calculateur clinique

Rapport de vraisemblance d'obtention de résultats positifs à partir des données brutes

Tests dichotomiques

Un test dichotomique idéal n'aurait pas de faux positifs ni de faux négatifs; tous les patients qui présentent un résultat positif auraient la maladie (100% de valeur prédictive positive), et tous les patients qui présentent un résultat négatif n'auraient pas la maladie (100% de valeur prédictive négative).

Dans la réalité, tous les tests ont des faux positifs et des faux négatifs, certains tests plus que d'autres. Pour illustrer les conséquences d'une sensibilité et d'une spécificité insuffisante sur les résultats des examens, considérons les résultats hypothétiques (voir tableau Répartition des résultats d'un test d'estérase leucocytaire hypothétique dans une cohorte de 1000 femmes présentant une prévalence présumée d'infection des voies urinaires de 30%) des bandelettes réactives à l'estérase leucocytaire dans un groupe de 1000 femmes, dont 300 (30%) ont une infection urinaire (diagnostiquée par un test de référence tel qu'un ECBU). Ce scénario suppose à des fins d'illustration que la bandelette a une sensibilité de 71% et une spécificité de 85%.

Une sensibilité de 71% signifie que seules 213 femmes (71% des 300) qui ont une infection urinaire auraient un résultat positif au test. Les 87 autres auraient un résultat négatif au test. Une spécificité de 85% signifie que 595 femmes (85% des 700) qui n'ont pas d'infection des voies urinaires auraient un résultat négatif au test. Les 105 autres auraient un résultat positif au test. Ainsi, sur les 318 résultats positifs, seuls 213 + 115 = 213 seraient corrects (213/318 = 67% de valeur prédictive positive); un test positif rend le diagnostic d'infection urinaire plus probable qu'improbable mais pas certain cependant. Il y aurait également 87 + 595 = 682 tests négatifs, desquels 595 sont corrects (595/682 = 87% de valeur prédictive négative), rendant le diagnostic d'infection urinaire beaucoup moins probable mais encore possible; 13% des patients qui présentent un résultat négatif auraient effectivement une infection urinaire.

Tableau

Répartition des résultats d'un test hypothétique d'estérase leucocytaire dans une cohorte de 1000 femmes, avec une prévalence estimée de 30% d'infections urinaires

Tableau

Répartition des résultats d'un test hypothétique d'estérase leucocytaire dans une cohorte de 1000 femmes, avec une prévalence estimée de 30% d'infections urinaires

Résultats	Maladie présente	Absence de maladie	Total des patients
Test positif	Vrai positif 213 patients (71% des 300)	Faux positif 105 patients (700−595)	318 patients qui présentent un test positif
Test négatif	Faux négatif 87 patients (300−213)	Vrai négatif 595 patients (85% sur 700)	682 patients qui ont un test négatif
Total des patients	300 patients qui présentent une infection urinaire (présumée)	700 patients qui ne présentent pas d'infection urinaire (présumée)	1000 patients
Valeur prédictive positive = Vrai positif/(tous les patients qui présentent un test positif) = Vrai positif/(Vrai positif + Faux positif) = 213/(213 + 105) = 67%. Valeur prédictive négative = Vrai négatif/(tous les patients qui ont un test négatif) = Vrai négatif/(Vrai négatif + Faux négatif) = 595/(595 + 87) = 87%. Rapport de vraisemblance positif (LR +) = sensibilité/(1 − spécificité) = 0,71/(1 − 0,85) = 4,73. Rapport de vraisemblance négatif (LR-) = (1− sensibilité)/spécificité = (1 − 0,71)/0,85 = 0,34.

Cependant, la valeur prédictive positive et la valeur prédictive négative dans cette cohorte de patients ne peuvent être utilisées pour interpréter les résultats du même test lorsque l'incidence de la maladie sous-jacente (probabilité pré-test ou a priori) est différente. Observer les effets de la modification de l'incidence de la maladie à 5% (voir tableau Répartition des résultats d'un test d'estérase leucocytaire hypothétique dans une cohorte de 1000 femmes présentant une prévalence présumée des infections des voies urinaires de 5%). Désormais la plupart des résultats positifs aux tests sont des faux positifs et la valeur prédictive positive n'est que de 20%; un patient dont le résultat au test est positif est en fait plus susceptible de ne pas avoir d'infection urinaire. Cependant, la valeur prédictive négative est désormais très élevée (98%); un résultat négatif exclut principalement une infection urinaire.

Tableau

Répartition des résultats d'un test d'estérase leucocytaire hypothétique dans une cohorte de 1000 Femmes présentant une prévalence présumée des infections des voies urinaires de 5%

Tableau

Répartition des résultats d'un test d'estérase leucocytaire hypothétique dans une cohorte de 1000 Femmes présentant une prévalence présumée des infections des voies urinaires de 5%

Résultats	Maladie présente	Absence de maladie	Total des patients
Test positif	Vrai positif 36 patients (71% sur 50)	Faux positif 144 patients (950−806)	180 patients qui présentent un test positif
Test négatif	Faux négatif 14 patients (50−36)	Vrai négatif 806 patients (85% des 950)	820 patients qui ont un test négatif
Total des patients	50 patients qui présentent une infection urinaire (présumée)	950 patients qui ne présentent pas d'infection urinaire (présumée)	1000 patients
Valeur prédictive positive = Vrai positif/(tous ceux qui ont un test positif) = Vrai positif/(Vrai positif + Faux positif) = 36/(36 + 144) = 20%. Valeur prédictive négative = Vrai négatif/(tous ont un test négatif) = Vrai négatif/(Vrai négatif + FN) = 806/(806 + 14) = 98%. Rapport de vraisemblance positif (LR +) = sensibilité/(1 − spécificité) = 0,71/(1 − 0,85) = 4,73. Rapport de vraisemblance négatif (LR-) = (1− sensibilité)/spécificité = (1 − 0,71)/0,85 = 0,34.

Noter que dans les deux cohortes de patients, même si les valeurs prédictives positives et les valeurs prédictives négatives sont très différentes, les rapports de vraisemblance ne changent pas parce que les rapports de vraisemblance ne sont déterminés que par la sensibilité et la spécificité.

Clairement, un résultat de test ne fournit pas un diagnostic de certitude mais seulement des estimations de la probabilité qu'une maladie soit présente ou absente et cette probabilité post-test (probabilité d'une maladie étant donné un résultat de test spécifique) varie grandement selon la probabilité pré-test de la maladie ainsi que la sensibilité et la spécificité du test (et donc son RV).

Calculateur clinique

Taux de faux négatifs liés à la sensibilité et à la prévalence

Calculateur clinique

Taux de faux positifs liés à la spécificité et à la prévalence

Probabilité pré-test

La probabilité pré-test n'est pas une mesure précise; elle repose sur un jugement clinique à savoir jusqu'à quel point la symptomatologie évoque la présence de la maladie, ce qui dans l'anamnèse et les facteurs de risque est en faveur du diagnostic et la fréquence de la maladie dans une population représentative. De nombreux systèmes de notation cliniques sont conçus pour estimer la probabilité pré-test; l'ajout de points pour diverses caractéristiques cliniques facilite le calcul d'un score. Ces exemples illustrent l'importance que revêt la précision de l'estimation de la prévalence pré-test car la prévalence de la maladie chez la population considérée influence considérablement l'utilité du test. Les outils d'estimation de la prévalence validés et publiés doivent être utilisés quand ils sont disponibles. Par exemple, il existe des critères pour prédire la probabilité pré-test d'embolie pulmonaire. Des scores calculés plus élevés donnent des probabilités estimées plus élevées. En pratique, la détermination de la probabilité pré-test est facilitée par des informations objectives, mais peut également être influencée par les compétences et l'expérience du médecin.

Tests continus

De nombreux résultats de tests sont continus et peuvent fournir des informations cliniques utiles sur une large gamme de résultats. Les médecins choisissent souvent un certain seuil pour maximiser l'utilité du test. Par exemple, une numération des globules blancs > 15 000/mcL peut être caractérisée comme positive; des valeurs < 15 000/mcL comme négative. Quand un test fournit des résultats continus mais qu'un certain seuil est sélectionné, le test fonctionne comme un test dichotomique. Plusieurs seuils peuvent également être sélectionnés. La sensibilité, la spécificité, la valeur prédictive positive, la valeur prédictive négative, le RV+, et le RV- peuvent être calculés pour des seuils simples ou multiples. Le tableau Effet des modifications du seuil de la numération des globules blancs pour des patients chez qui on suspecte une appendicite illustre l'effet de la modification du seuil de la numération des globules blancs chez des patients chez qui on suspecte une appendicite.

Tableau

Effet des modifications du seuil de la numération des globules blancs pour des patients chez qui on suspecte une appendicite

Tableau

Effet des modifications du seuil de la numération des globules blancs pour des patients chez qui on suspecte une appendicite

Seuil des leucocytes*	Sensibilité	Spécificité	RV+	RV-
> 10 500	84%	53,13%	1,79	0,3
> 11 500	78%	62,5%	2,13	0,32
> 12 850	68%	75%	2,72	0,43
> 13 400	61,33%	78,12%	2,86	0,45
> 14 300	56,67%	81,25%	3,2	0,49
*Des seuils différents sont sélectionnés pour une variable continue telle que la numération des leucocytes; les résultats au-dessus du seuil sont considérés comme positifs et ceux en dessous du seuil sont considérés comme négatifs. Les valeurs indiquées sont par microlitre de sang.
LR = likelihood ratio (rapport de vraisemblance).
Adapted from Keskek M, Tez M, Yoldas O, et al: Receiver operating characteristic analysis of leukocyte counts in operations for suspected appendicitis. American Journal of Emergency Medicine 26:769–772, 2008.

Comme alternative, il peut être utile de regrouper les résultats des tests continus par niveaux. Dans ce cas, les résultats ne sont pas caractérisés comme positifs ou négatifs parce qu'il existe de multiples résultats possibles, si bien qu'un RV peut être déterminé pour chaque niveau de résultats, il n'y plus de RV+ ou de RV- distincts. Par exemple, le tableau Utilisation des groupes de numération des globules blancs pour déterminer le rapport de vraisemblance de la bactériémie chez l'enfant fébrile illustre la relation entre une numération des globules blancs et la bactériémie chez l'enfant fébrile. Le RV est la probabilité d'un résultat donné chez les patients atteints de la maladie divisée par la probabilité de ce résultat chez les patients sans la maladie, donc le RV pour chaque groupe de numération des globules blancs est la probabilité de bactériémie dans ce groupe divisée par la probabilité d'absence de bactériémie.

Tableau

Utilisation des groupes de numération des globules blancs pour déterminer le rapport de vraisemblance de la bactériémie chez l'enfant fébrile*

Tableau

Utilisation des groupes de numération des globules blancs pour déterminer le rapport de vraisemblance de la bactériémie chez l'enfant fébrile*

Numération des leucocytes	Nombre d'enfants qui présentent une bactériémie, n = 127 (%)	Nombre d'enfants qui n'ont pas de bactériémie, N = 8629 (%)	RV (% avec bactériémie/% sans bactériémie)
0–5000	0 (0,0%)	543 (6,3%)	0,00
5001–10 000	3 (2,4%)	3291 (38,1%)	0,06
10 001–15 000	15 (11,8%)	2767 (32,1%)	0,37
15 001–20 000	48 (37,8%)	1337 (15,5%)	2,4
20 001–25 000	34 (26,8%)	469 (5,4%)	4,9
25 001–30 000	12 (9,4%)	155 (1,8%)	5,3
> 30 001	15 (11,8%)	67 (0,8%)	15,2
*Incidence des bactériémies chez 8756 enfants fébriles regroupés par numération des globules blancs (les valeurs listées sont par microlitre de sang). Le RV de chaque groupe est calculé en divisant la probabilité de la bactériémie par la probabilité de l'absence de bactériémie.
LR = likelihood ratio (rapport de vraisemblance).
Adapted from Lee GM, Harper MB: Risk of bacteremia for febrile young children in the post-Haemophilus influenzae type b era. Archives of Pediatric and Adolescent Medicine 152:624–628, 1998.

Regrouper des variables continues permet une utilisation beaucoup plus large du résultat du test que lorsqu'un seuil unique est établi. En utilisant des analyses bayésiennes, les rapports de vraisemblance (LRs) du tableau Utilisation des groupes de numération des globules blancs pour déterminer le rapport de vraisemblance de la bactériémie chez l'enfant fébrile peuvent être utilisés pour calculer la probabilité post-test.

Dans le cas de résultats de tests continus, si la courbe caractéristique opérationnelle du receveur est connue, les calculs indiqués dans le tableau ne doivent pas être effectués; les RV peuvent être trouvées pour différents points de la gamme de résultats en utilisant la pente de la courbe caractéristique opérationnelle du receveur à l'endroit souhaité.

Théorème de Bayes

Le processus qui utilise la probabilité pré-test de la maladie et les caractéristiques du test pour calculer la probabilité post-test est appelé théorème de Bayes ou révision bayesienne. En utilisation clinique de routine, la méthodologie bayésienne prend généralement plusieurs formes:

Formulation probabilité-vraisemblance (calcul ou nomogramme)
Approche tabulaire

Calcul de vraisemblance

Si la probabilité pré-test de la maladie est exprimée par sa vraisemblance et parce que le RV d'un test représente sa vraisemblance, le produit des 2 représente la probabilité post-test de la maladie (analogue au fait de multiplier 2 probabilités pour calculer la probabilité d'occurrence simultanée des 2 événements):

Vraisemblance pré-test × RV = probabilité post-test

Les médecins pensant généralement en termes de probabilités plutôt que de vraisemblance, les probabilités peuvent être converties en vraisemblance (et vice-versa) à l'aide de ces formules:

Vraisemblance = probabilité/1 − probabilité

Probabilité = vraisemblance/vraisemblance + 1

Considérons l'exemple de l'infection urinaire comme indiqué dans le tableau Répartition des résultats d'un test d'estérase leucocytaire hypothétique dans une cohorte de 1000 femmes présentant une prévalence présumée d'infection des voies urinaires de 30%, dans lequel la probabilité pré-test d'infection urinaire est de 0,3, et le test utilisé a un RV+ de 4,73 et un RV- de 0,34. Une probabilité pré-test de 0,3 correspond à une vraisemblance de 0,3/(1 − 0,3) = 0,43. Ainsi, la vraisemblance post-test, que l'infection urinaire soit présente chez un patient qui a un résultat de test positif, est égale au produit de la vraisemblance pré-test et du RV+; 4,73 × 0,43 = 2,03, ce qui représente une probabilité post-test de 2,03/(1 + 2,03) = 0,67. Ainsi, les calculs bayésiens montrent qu'un résultat de test positif augmente la probabilité pré-test de 30 à 67%, le même résultat obtenu dans le calcul de la valeur prédictive positive dans le tableau.

Un calcul similaire est effectué pour un test négatif; vraisemblance post-test = 0,34 × 0,43 = 0,15, correspondant à une probabilité de 0,15/(1 + 0,15) = 0,13. Ainsi, un résultat négatif fait baisser la probabilité pré-test de 30 à 13%, à nouveau le même résultat obtenu dans le calcul de la valeur prédictive négative dans le tableau.

De nombreux programmes de calcul médical qui fonctionnent sur des appareils portatifs sont disponibles pour calculer la probabilité post-test à partir de la probabilité pré-test et des RV.

Calculateur clinique

Risques d’après la probabilité

Calculateur clinique

Probabilité d’après les risques

Calculateur clinique

MultiCalc ® I de statistiques bayésiennes

Calculateur clinique

Multicalculatrice de statistiques bayésiennes II

Nomogramme de vraisemblance-odds

L'utilisation d'un nomogramme est particulièrement utile parce qu'il évite la nécessité de convertir entre les cotes et les probabilités ou de créer des tableaux 2 × 2.

Pour utiliser le nomogramme de Fagan, une ligne est tracée à partir de la probabilité pré-test à travers le RV. La probabilité post-test est le point où cette ligne coupe la ligne de probabilité post-test. Les lignes de la figure ont été dessinées en fonction des données d'infection urinaire dans le tableau Répartition des résultats d'un test d'estérase leucocytaire hypothétique dans une cohorte de 1000 femmes présentant une prévalence présumée d'infection des voies urinaires de 30%. La ligne A représente un résultat positif; elle est tracée de la probabilité pré-test de 0,3 jusqu'au RV+ de 4,73 et donne une valeur post-test légèrement < 0,7, similaire à la probabilité calculée de 0,67. La ligne B représente un résultat négatif; elle est tracée de la probabilité pré-test de 0,3 jusqu'au RV- de 0,34 et donne une valeur post-test légèrement > 0,1, similaire à la probabilité calculée de 13%.

Bien que le nomogramme semble moins précis que les calculs, les valeurs typiques des probabilités pré-test sont souvent des estimations, l'évidente précision des calculs est ainsi habituellement trompeuse.

Nomogramme de Fagan

Des lignes illustratives ont été dessinées en fonction des données des tests d'infection urinaire dans le tableau Répartition des résultats d'un test d'estérase leucocytaire hypothétique dans une cohorte de 1000 femmes présentant une prévalence présumée d'infection des voies urinaires de 30%. La ligne A représente un test positif, tracée d'une probabilité pré-test de 0,3 à un RV+ de 4,73 à une valeur post-test légèrement < 0,7, similaire à la probabilité calculée de 0,67. La ligne B représente un résultat négatif, tracée d'une probabilité pré-test de 0,3 à un RV- de 0,34 à une valeur post-test légèrement > 0,1, similaire à la probabilité calculée de 13%.

RV+= rapport de vraisemblance pour un résultat positif; RV- = RV pour un résultat négatif.

Adapted from Fagan TJ. Letter: Nomogram for Bayes theorem. New England Journal of Medicine 293:257, 1975.

Approche tabulaire

Souvent, les RV d'un test sont inconnus, mais la sensibilité et la spécificité sont connues et la probabilité pré-test peut être estimée. Dans ce cas, la méthodologie bayésienne peut être réalisée à l'aide d'un tableau 2 × 2 illustré dans le tableau Interprétation d'un résultat de test hypothétique d'estérase de leucocyte à l'aide de l'exemple du tableau Répartition des résultats d'un test d'estérase leucocytaire hypothétique dans une cohorte de 1000 femmes présentant une prévalence présumée d'infection des voies urinaires de 30%. Noter que cette méthode montre qu'un résultat de test positif augmente la probabilité d'une infection urinaire à 67%, et un résultat négatif, la diminue à 13%, les mêmes résultats obtenus par calcul à l'aide des rapports de vraisemblance.

Tableau

Interprétation des résultats d'un test hypothétique d'estérase leucocytaire (EL) dans une cohorte de 1000 femmes, en supposant une prévalence de 30% d'infection urinaire (probabilité pré-test), une sensibilité du test de 71% et une spécificité de 85%*

Tableau

Interprétation des résultats d'un test hypothétique d'estérase leucocytaire (EL) dans une cohorte de 1000 femmes, en supposant une prévalence de 30% d'infection urinaire (probabilité pré-test), une sensibilité du test de 71% et une spécificité de 85%*

Résultats	Infection urinaire présente	Infection urinaire absente
Résultats	300 patientes qui présentent une infection urinaire	700 patientes qui ne présentent pas d'infection urinaire
Test de l'estérase leucocytaire positif	213 patients (Vrai positif)	105 patients (Faux positif)
Test de l'estérase leucocytaire négatif	87 patients (Faux négatif)	595 patients (vrai négatif)
*Le théorème de Bayes peut être simplifié pour permettre le calcul de probabilité post-test lorsque la probabilité pré-test est connue: Probabilité post-test lorsque le test est positif = Vrai positif/(tous les patients qui présentent un test positif) = Vrai positif/(Vrai positif + Faux positif) = 213/(213 + 105) =67%. Probabilité post-test lorsque le test est négatif = Vrai négatif/(tous les patients qui ont un test négatif) = Faux négatif/(Faux négatif + Vrai négatif) = 87/(87 + 595) = 13%.

Tests séquentiels

Les médecins font souvent des tests en série au cours de nombreux bilans diagnostiques. Si les vraisemblances pré-test avant les tests séquentiels sont connues et le RV de chacun des tests de la séquence est connu, la probabilité post-test peut être calculée selon la formule suivante:

Vraisemblance pré-test ×RV 1 ×RV 2 ×RV 3 = probabilité post-test

Cette méthode est limitée par l'hypothèse importante selon laquelle chacun des tests est conditionnellement indépendant de chacun des autres.

Tests de dépistage

Les patients se posent souvent la question de savoir s'ils doivent être dépistés pour une maladie infraclinique. Les prémisses d'un programme de dépistage efficace sont que la détection précoce améliore un résultat cliniquement significatif chez les patients présentant une maladie occulte et que les résultats faussement positifs qui peuvent survenir lors du dépistage ne créent pas de surcharge (p. ex., de coûts et d'effets indésirables des tests de confirmation, d'anxiété provoquées par des tests, et un traitement injustifié) qui dépasse ce bénéfice. Pour minimiser ces inconvénients, les médecins doivent choisir le test de dépistage approprié. Le dépistage peut ne pas être approprié lorsque les traitements ou les mesures préventives sont inefficaces, sauf si le diagnostic peut avoir une incidence sur les décisions futures concernant la vie du patient ou de sa famille. Si la maladie est très rare, à moins qu'une sous-population puisse être identifiée dans laquelle la prévalence est plus élevée, le dépistage peut ne pas être rentable; il existe des exceptions, comme le cas de plusieurs troubles génétiques qui peuvent être diagnostiqués et traités chez le nouveau-né.

Théoriquement, le meilleur test de dépistage et de diagnostic est celui qui a la sensibilité et la spécificité la plus élevée. Cependant, ces tests très précis sont souvent complexes, chers et invasifs (p. ex., coronarographie) et sont donc impraticables pour le dépistage d'un grand nombre d'individus asymptomatiques. Typiquement, des compromis de sensibilité et/ou de spécificité doivent être faits lors de la sélection du test de dépistage.

Le médecin choisit un test qui optimise la sensibilité ou la spécificité en fonction des conséquences d'un résultat faussement positif ou faussement négatif, ainsi qu'en fonction de la probabilité pré-test de la maladie. Le test de dépistage idéal est celui qui est toujours positif chez presque tous les patients atteints de la maladie, de sorte qu'un résultat négatif exclut la maladie de manière fiable chez les sujets en bonne santé. Par exemple, lors de tests portant sur une maladie grave pour laquelle un traitement efficace est disponible (p. ex., les coronaropathies), on serait tenté de tolérer plus de faux positifs (spécificité moindre) que de faux négatifs (sensibilité moindre). Bien qu'une sensibilité élevée soit un attribut très important des tests de dépistage, la spécificité est également importante dans certaines stratégies de dépistage. Dans les populations à forte prévalence de la maladie, la valeur prédictive positive d'un test de dépistage augmente; lorsque la prévalence de la maladie diminue, la probabilité post-test de la maladie après un résultat positif diminue. Donc, pour le dépistage d'une maladie dans une population à haut risque, on préfère utiliser des tests très sensibles plutôt que des tests très spécifiques, car les premiers permettent mieux d'écarter la maladie (on observe moins de faux négatifs). D'autre part, on préfère utiliser des tests plus spécifiques pour les populations à faible risque ou dans le cas de maladies rares pour lesquelles une thérapie est peu efficace ou risquée.

Tests de dépistage multiples

Avec le nombre croissant de tests de dépistage disponibles, l'utilisation de tels éventails de tests doit être envisagée. Par exemple, des groupes de tests de 8, 12 ou parfois 20 examens sanguins sont souvent effectués quand un patient est hospitalisé ou est examiné la première fois par un nouveau médecin. Bien que ce type de test puisse être utile dans le dépistage de certaines maladies, utiliser de grands panels de tests a des conséquences potentiellement négatives. Un test qui a une spécificité de 95% donne des résultats faussement positifs chez 5% des patients en bonne santé et normaux. Si 2 tests différents de dépistage sont effectués, chacun d'eux concernant une maladie infraclinique différente, chez un patient qui ne présente en réalité aucune des deux maladies, la probabilité que ces deux tests soient négatifs est de 95% × 95%, soit environ 90%; ainsi, il existe 10% de chance d'avoir au moins un faux positif. Pour 3 de tels tests, la probabilité que tous 3 soient négatifs est de 95% × 95% × 95% ou de 86%, ce qui correspond à une probabilité de 14% d'avoir au moins un résultat faux positif. Si 12 tests différents pour 12 maladies différentes ont été effectués, la probabilité d'obtenir au moins un résultat faussement positif est de 46%. Cette probabilité élevée souligne la prudence nécessaire lorsqu'un panel de dépistage est effectué et lors de l'interprétation de ses résultats.

Ce même principe s'applique lors de la prescription de multiples tests sensibles mais non spécifiques (p. ex., "sérologies auto-immunes" dont les anticorps antinucléaires, la ribonucléoprotéine antinucléaire [anti-RNP], le facteur rhumatoïde) dans l'évaluation des patients qui ont des symptômes non localisateurs et non spécifiques de longue date, tels que fatigue et douleur généralisée en l'absence de signes d'examen clinique ou de caractéristiques historiques suggérant un diagnostic rhumatologique plus spécifique.

Seuils de tests

Un examen de laboratoire ne doit être effectué que si ses résultats ont une incidence sur la prise en charge; sinon les frais et risques pour le patient n'ont pas de raison d'être. On peut parfois déterminer quand tester en comparant les probabilités pré-test et les estimations post-test en utilisant certains seuils. Au-dessus d'un certain seuil de probabilité, les avantages du traitement l'emportent sur les risques (dont le risque d'erreur de traiter un patient qui n'est pas malade), et le traitement est indiqué. Ce point est appelé le seuil thérapeutique et est déterminé comme décrit dans Estimations des probabilités et du seuil thérapeutique. Par définition, les examens ne sont pas nécessaires lorsque la probabilité pré-test se trouve déjà au-dessus du seuil thérapeutique. Mais tester est indiqué si la probabilité pré-test est inférieure au seuil thérapeutique si un résultat de test positif peut faire monter la probabilité post-test au-dessus du seuil thérapeutique. La plus faible probabilité pré-test à laquelle cela peut être observé dépend des caractéristiques du test (p. ex., RV+) et est appelé seuil de test.

Conceptuellement, si le meilleur test pour un trouble grave a un RV+ bas, et que le seuil thérapeutique est élevé, il est compréhensible qu'un résultat de test positif puisse ne pas faire remonter la probabilité post-test au-dessus du seuil thérapeutique chez un patient qui a une probabilité pré-test basse mais inquiétante (p. ex., 10% ou 20%).

Dans une illustration numérique, considérons le cas décrit précédemment d'un possible infarctus du myocarde aigu dans lequel l'équilibre entre risque et bénéfice a permis de déterminer un seuil thérapeutique de 25%. Lorsque la probabilité d'infarctus du myocarde dépasse 25%, un traitement thrombolytique est administré. Quand un échocardiogramme rapide doit-il être pratiqué avant d'administrer un traitement thrombolytique? Si on suppose une sensibilité hypothétique de 60% et une spécificité de 70% de l'échocardiogramme dans le diagnostic de l'infarctus du myocarde; ces pourcentages correspondent à un RV+ de 60/(100 − 70) = 2 et à un RV- de (100 − 60)/70 = 0,57.

Le problème peut être abordé mathématiquement (vraisemblance pré-test × RV = rapport de vraisemblance post-test) ou plus intuitivement graphiquement en utilisant le nomogramme de Fagan. Sur le nomogramme, une ligne reliant le seuil thérapeutique (25%) sur la ligne de probabilité post-test passant par le RV+ (2,0) sur la ligne médiane du RV coupe une probabilité pré-test d'environ 0,14. Il est clair qu'un test positif chez un patient qui présente une probabilité pré-test < 14% aboutirait encore à une probabilité post-test inférieure au seuil thérapeutique. Dans ce cas, l'échocardiographie serait inutile parce que même un résultat positif ne conduirait pas à une décision de traiter; ainsi, une probabilité pré-test de 14% est le seuil de ce test en particulier (voir figure Représentation des seuils de test et de traitements). Un autre test avec un RV+ différent aurait un seuil de test différent.

Nomogramme de Fagan utilisé pour déterminer le besoin de tester

Dans cet exemple, le patient est supposé avoir un seuil de traitement de 25% pour l'infarctus du myocarde aigu. Lorsque la probabilité d'infarctus du myocarde dépasse 25%, un traitement thrombolytique est administré. On peut utiliser le nomogramme de Fagan pour déterminer quand l'échocardiogramme rapide doit être effectué avant d'administrer un traitement thrombolytique. Si on suppose que l'échocardiographie a une sensibilité théorique de 60% et une spécificité de 70% pour un nouvel infarctus du myocarde, ces pourcentages correspondent à un rapport de vraisemblance (RV) d'un résultat positif du test (RV+) de 60/(100 − 70) = 2. Une ligne reliant un seuil thérapeutique de 25% sur la ligne de probabilité post-test avec un RV+ (2,0) sur la ligne RV moyenne coupe une probabilité pré-test d'environ 0,14. Un résultat positif chez un patient qui présente une probabilité pré-test < 14% aboutit toujours à une probabilité post-test inférieure au seuil thérapeutique.

Adapted from Fagan TJ. Letter: Nomogram for Bayes theorem. New England Journal of Medicine 293:257, 1975.

Représentation des seuils de test et de traitement

La ligne horizontale représente les probabilités post-test.

Puisque 14% représentent toujours un risque significatif d'infarctus du myocarde, il est évident qu'une probabilité de maladie inférieure au seuil de test (p. ex., une probabilité pré-test de 10%) ne signifie pas nécessairement que la maladie soit exclue, juste qu'un résultat positif du test en question ne modifierait pas la prise en charge et donc que ce test n'est pas indiqué. Dans cette situation, le médecin rechercherait d'autres signes qui pourraient rehausser la probabilité pré-test et la faire passer au-dessus du seuil de test. Dans la pratique, puisque de nombreux tests sont souvent disponibles pour une maladie donnée, des tests séquentiels peuvent être effectués.

Cet exemple considère un test qui en lui-même ne présente pas de risque pour le patient. Si un test présente des risques sérieux (p. ex., cathétérisme cardiaque), le seuil de test doit être plus élevé; des calculs quantitatifs peuvent être effectués mais sont complexes. Par conséquent, l'effet de la réduction de la sensibilité et de la spécificité d'un test ou de l'augmentation de son risque est de restreindre la marge de probabilité de la maladie dont le test est la meilleure stratégie. Améliorer la capacité du test à discriminer ou à diminuer son risque élargit l'intervalle de probabilités sur lequel le test représente la meilleure stratégie.

Une exception possible à la proscription des tests dont la probabilité pré-test est inférieure au seuil de test (mais reste préoccupante) pourrait être le cas où le résultat d'un test négatif pourrait abaisser la probabilité post-test en dessous du point où la maladie pourrait être considérée comme exclue. Cette détermination requiert un jugement subjectif du degré de certitude requis pour considérer qu'une maladie est exclue et, de faibles probabilités étant impliquées, une attention particulière à tout risque lié au test doit être exercée.

TESTEZ VOS CONNAISSANCESTake a Quiz!