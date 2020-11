Jak poznat dobrý test

Testů je celá řada. Než se ale pustíme přímo do srovnání, je vhodné říci, jak odborníci hodnotí kvalitu testu. Výsledek testu by v ideálním světě měl být pozitivní, tedy našel to, co hledáme, nebo negativní v případě, že to, co hledáme, ve vzorku není.

Háček nastává v případě, kdy test zahlásí pozitivitu, přestože ve vzorku se reálně to, co hledáme, nenachází. Odborně se tomu říká, že výsledek vyjde falešně pozitivní. A pak existuje i druhý, horší případ, kdy test úpěnlivě hlásí, že se ve vzorku virus, nebo něco jiného co hledáme, nenachází, přestože tam reálně je. Máme radost, že to dobře dopadlo, ale ve skutečnosti tomu tak není. Takovému výsledku se říká falešně negativní. Ve statistické terminologii se označují jako chyba prvního a druhého typu.

Aby to nebylo jednoduché, odborníci používají ještě dvě další metriky. První se říká specifita. Ta nám říká, jak moc dobře je test schopný rozpoznat případy, u kterých to, co hledáme, nenastává.

Příklad: Na test půjde 5 lidí a z toho budou 3 lidé skutečně negativní, 1 bude skutečně pozitivní a 1 falešně pozitivní. Výsledek testu jsou teda 3 lidé, kteří COVID nemají a 2 kteří jej podle testu „mají“. Protože je poslední člověk falešně pozitivní, test bude mít 75% specifitu. Z toho můžeme odvodit, že test generuje 25 % lidí, které označí za pozitivní, ačkoli pozitivní nejsou. Obvykle se specifita nevypočítává pouze z 5 provedených testů, jenže takhle nízkou specifitu některé testy mít skutečně mohou, ale o tom dále.

Druhá metrika se nazývá senzitivita, nebo také citlivost testu, a říká nám, jak úspěšně test zachytí přítomnost toho, co sledujeme.

Příklad: Použijme identické výsledky testu jako výše. Mějme celkem 5 testů. Tři lidé jsou skutečně negativní, 1 skutečně pozitivní a 1 falešně pozitivní. Nikdo tedy není falešně negativní. Takovýto test bude mít 100% senzitivitu, protože nedetekoval nikoho negativního, který by byl ve skutečnosti pozitivní.

Jak se hodnotí kvalita testů a proč je s infekčností potíž

Terminologie používaná v případě kvality testu je mnohem složitější. Můžeme se setkat s prevalencí, tedy tím, jak moc se to, co sledujeme, vyskytuje v populaci. Kvalita testu se pak určuje pomocí tzv. ROC křivky, pomocí které odborníci hledají kompromis mezi senzitivitou a specifitou. Plocha pod křivkou pak určuje, jak kvalitní test je. Pokud je obsah pod křivkou menší než 50 %, a tedy zabírá menší část obsahu než referenční diagonální linie, test nemá žádnou vypovídající hodnotu, protože není lepší než náhodný hod mincí. Obsah nad 92 % se hodnotí jako velmi dobrý test a 97 % jako vynikající test.

Je důležité zmínit, že existuje rozdíl mezi pozitivitou a infekčností, případně nemocností. To, že test detekuje přítomnost toho, co hledáme, nám ale nedokáže říct, jak moc je ten samý člověk nakažlivý pro ostatní. Takový test nemáme.

Přestože existuje závislost mezi výší virové nálože, tedy množstvím viru, a tím, jak je nemocný infekční, spolehnout se na to nedá.

Vliv virové nálože na průběh onemocnění se nejlépe ukazuje na alkoholu. Malá dávka, dvě skleničky v jeden den jsou v pohodě. Dvě flašky už jsou docela výzva, následující den rozhodně nebude snadný. Ale dvacet flašek alkoholu za večer je téměř určitě konečná. Bude tedy docela rozdíl, jestli se člověk nakazí od jednoho člověka v lese, anebo od desítek pacientů s těžkým průběhem v přeplněné nemocnici, která se tak snadno může stát centrem infekce.

Podobně tak testem nedokážeme rozlišit, jestli se jedná o tzv. produktivní nebo abortivní infekci. U té první se virus dostane až do buňky a ta jej poslušně namnoží, v případě té druhé reprodukční cyklus neproběhne až do konce. Může se stát, že přítomnost viru test najde, ale jestli je poškozený nebo ne změřit neumíme.



ROC může být různé a podobně tak i mít různou formu. Na obrázku je ukázka několika ROC křivek, které srovnávají specifitu vůči senzitivitě (klasická ROC porovnává falešně negativní vs falešně pozitivní). Křivky, které jsou pod referenční linií (modrá, šedá, červená) mají nižší vypovídající hodnotu než hod mincí. Čím větší plocha pod křivkou, tím kvalitnější test. Graf pochází z této studie.