Articles / 19 elokuun, 2021

Grid Search for model tuning

Mallin hyperparametri on mallin ominaisuus, joka on mallin ulkoinen ja jonka arvoa ei voida arvioida datan perusteella. Hyperparametrin arvo on asetettava ennen oppimisprosessin aloittamista. Esimerkiksi c tukivektorikoneissa, k k-läheisimmissä naapureissa, piilokerrosten lukumäärä neuroverkoissa.

Hyperparametri sen sijaan on mallin sisäinen ominaisuus ja sen arvo voidaan arvioida datasta. Esimerkki, lineaarisen/logistisen regression beeta-kertoimet tai tukivektorit tukivektorikoneissa.

Grid-hakua käytetään etsimään mallin optimaalisia hyperparametreja, jotka johtavat ”tarkimpiin” ennusteisiin.

Katsotaan Grid-hakua rakentamalla luokittelumalli rintasyöpädatasetille.

Tuodaan tietokokonaisuus ja tarkastellaan 10 ensimmäistä riviä.

Tulos :

Kullakin tietokokonaisuuden rivillä on yksi kahdesta mahdollisesta luokasta: hyvänlaatuinen (edustaa 2) ja pahanlaatuinen (edustaa 4). Lisäksi tässä tietokokonaisuudessa on 10 attribuuttia (esitetty edellä), joita käytetään ennustamiseen, lukuun ottamatta näytekoodin numeroa, joka on id-numero.