Vajon gépi tanuló modellünk biztosan jól teljesít?
Pár éve egy ismerősöm örömmel újságolta, hogy egy döntési fa alapú algoritmussal (AdaBoost), képes volt 85%-os pontossággal megmondani egy ügyfélről a különböző paraméterei alapján, hogy az adott hitel visszafizetésre kerül-e vagy sem. Elsőre jónak hangzik, ugye? Azonban ahhoz, hogy megértsük, miért nem az, lássuk, valójában mit is jelent a pontosság, mint mérőszám.
Ez egy úgynevezett bináris osztályozás, hiszen minden megfigyelés (ügyfél), pontosan kétféle értéket vehet fel: vagy visszafizeti a kapott kölcsönt, vagy nem. Ebben az esetben a validáló adathalmaz algoritmuson való végigfuttatása után egy 2x2-es mátrixban összegezhetjük az eredményeket. A validáló adathalmaz egy címkékkel ellátott része az adatunknak, ami nem része a tanító adathalmaznak – tehát az ebben levő ügyfelekről tudjuk, hogy visszafizették-e a kölcsönt vagy sem, így mérhető az algoritmusunk teljesítménye.