19.3.3.3 Receiver Operating Characteristic (ROC) curve
In deze paragraaf behandelden we testen met dichotome of categorische testuitslagen. Daarbij gaven wij als voorbeeld de d-dimeer test met een positieve of negatieve uitslag. Echter, vele testen produceren een testuitslag die een bepaalde waarde kan aannemen binnen fysiologische grenzen; zogenoemde continue testuitslagen. Voorbeelden zijn leeftijd en gewicht van de patiënt, bloeddruk, cholesterolgehalte, maar ook de d-dimeerconcentratie. Figuur 1 toont een verdeling van de mogelijke waarden (uitslagen) van een (hypothetische) continue laboratoriumtest onder zieken en niet zieken. De twee verdelingen overlappen; sommige testuitslagen komen zowel bij zieken als niet-zieken voor. De stippellijn geeft een gekozen grenswaarde (afkappunt) aan bij 18. Als we de test dichotomiseren bij deze waarde en alle uitslagen erboven positief en eronder negatief noemen zouden we een tabel kunnen maken als tabel 1. De sensitiviteit (% terecht positieven) bij dit afkappunt is het oppervlak onder de curve bij zieken rechts van de grenswaarde, terwijl het oppervlak links van deze grenswaarde de 1-sensitiviteit ofwel het % fout-negatieven weergeeft. De specificiteit is het oppervlak onder de curve bij de niet-zieken links van de grenswaarde. Het oppervlak rechts van deze grenswaarde is de 1-specificiteit ofwel het % fout-positieven. Wanneer de twee verdelingen in figuur 1 geheel zouden overlappen, is bij elk afkappunt het % terecht positieven gelijk aan het % fout-positieven. De test heeft geen enkel onderscheidend vermogen (LR = 1 bij elke testuitslag). Wanneer de twee verdelingen geheel uit elkaar zouden liggen heeft men de perfecte test, met 100% onderscheidend vermogen. Zover we weten bestaat er in de geneeskunde geen perfecte test, maar zijn wel genoeg testen op te noemen met geen enkel onderscheidend vermogen. Nadelen van dichotomisatie is dat het altijd leidt tot informatieverlies. Bijvoorbeeld in figuur 1 wordt bij het afkappunt van 18, een waarde van 30 gelijk gewaardeerd als een waarde van 19. Ten tweede kent elk afkappunt een andere waarde voor de predictieve waarden, sensitiviteit, specificiteit en LR. Bij het verschuiven van het afkappunt naar rechts neemt de sensitiviteit af en de specificiteit toe en bij verschuiving naar links is het omgekeerde het geval. Dit verklaart dat in de literatuur vaak wisselende percentages voor een bepaling gevonden worden; men heeft dan een ander afkappunt gekozen. De keuze van een afkappunt zal afhangen van de nadelen of ‘kosten’ van het niet herkennen van een zieke patiënt ten opzichte van het foutief veronderstellen van ziekte bij een niet-zieke patiënt. Het berekenen en publiceren van de waarden per afkappunt is bij continue testen schier onmogelijk, aangezien de test honderden afkappunten kan hebben. Daarom gebruikt men voor het weergeven van de diagnostische waarde van een continue test het oppervlak onder de zogenoemde ROC curve (ROC opp.). De ROC curve is een grafische weergave van de sensitiviteit (% terecht positieven) op de y-as en 1-specificiteit (% fout-positieven) op de x-as, voor elk afkappunt in de range van testuitslagen. Figuur 2 geeft een voorbeeld van een ROC curve die is gebaseerd op dezelfde onderzoeksdata als gebruikt in tabel 1. De rode lijn in figuur 2 is de ROC curve van de d-dimeer test voor het onderscheiden van de mensen met en zonder DVT. De ROC curve bevindt zich in een vierkant: x-as van 0 – 1 (of 0 - 100%) en y-as idem. De diagonaal is de ROC curve behorende bij de meest waardeloze test (bij elk afkappunt is het % terecht-positieven gelijk is aan het % fout-positieven). Het oppervlak onder die diagonaal = de helft van het vierkant = 0,5. De ROC curve die van de oorsprong links-onder in een rechte lijn naar de top links-boven loopt en vervolgens in een rechte lijn naar de top rechts-boven, is de ROC curve van de ideale test. Het oppervlak hieronder = het hele vierkant = 1,0. Het ROC opp. is een maat voor het onderscheidende vermogen van de test, onafhankelijk van een gekozen afkappunt. Het geeft de mate aan waarin de test gemiddeld in staat is de zieken van de niet-zieken te onderscheiden. Hoe groter het ROC-opp. van een test, des te meer de curve ervan in de linker-bovenhoek ligt, des te beter de test is. De interpretatie van het ROC opp. is min of meer het percentage patiënten (zowel met als zonder de ziekte) dat door de test correct geclassificeerd (gediagnostiseerd) kan worden. Het ROC opp. van de d-dimeer test in figuur 1 was 0,73. ROC curves worden ook veel gebruikt om het onderscheidende vermogen van twee testen (die op dezelfde patiënten zijn gemeten) met elkaar te vergelijken. De test met het hoogste ROC opp. heeft het grootste onderscheidende vermogen. Figuur 2 geeft ook de ROC curve aan (groen) voor ‘het verschil in kuitomvang in cm’ bij dezelfde 140 patiënten op verdenking van DVT. Verschil in kuitomvang is eveneens een door de huisarts veelgebruikte test voor DVT. Het ROC opp. van het verschil in kuitomvang was 0,60, wat significant lager was dan van de d-dimeer bepaling. Dit verschil kan overigens formeel getoetst worden. Een nadeel van de ROC curve en het ROC opp. van een individuele test, is dat het niet direct een klinisch toepasbare maat is. Het geeft een gemiddelde waarde voor het onderscheidende vermogen van de test in zijn geheel, maar niet direct een kans op aanwezigheid van ziekte per testuitslag. Bovendien is men vaak niet geïnteresseerd in de ROC curve van een enkele test, maar wil men juist de predictieve waarde van de testuitslag in combinatie met andere testuitslagen (bijvoorbeeld anamnestische- en lichamelijk onderzoeksgegevens) weten. 
Figuur 2. Voorbeeld van de ROC curve van de d-dimeer testuitslag en van het verschil in kuitomvang voor het onderscheiden van patiënten met aan- of afwezigheid van proximale DVT.
Verder in deze paragraaf:
 |
Print deze pagina |
|