Mallin hyperparametri on mallin ominaisuus, joka on mallin ulkoinen ja jonka arvoa ei voida arvioida datan perusteella. Hyperparametrin arvo on asetettava ennen oppimisprosessin aloittamista. Esimerkiksi c tukivektorikoneissa, k k-läheisimmissä naapureissa, piilokerrosten lukumäärä neuroverkoissa.
Hyperparametri sen sijaan on mallin sisäinen ominaisuus ja sen arvo voidaan arvioida datasta. Esimerkki, lineaarisen/logistisen regression beeta-kertoimet tai tukivektorit tukivektorikoneissa.
Grid-hakua käytetään etsimään mallin optimaalisia hyperparametreja, jotka johtavat ”tarkimpiin” ennusteisiin.
Katsotaan Grid-hakua rakentamalla luokittelumalli rintasyöpädatasetille.
Tuodaan tietokokonaisuus ja tarkastellaan 10 ensimmäistä riviä.
Tulos :
Kullakin tietokokonaisuuden rivillä on yksi kahdesta mahdollisesta luokasta: hyvänlaatuinen (edustaa 2) ja pahanlaatuinen (edustaa 4). Lisäksi tässä tietokokonaisuudessa on 10 attribuuttia (esitetty edellä), joita käytetään ennustamiseen, lukuun ottamatta näytekoodin numeroa, joka on id-numero.
Puhdista data ja nimeä luokka-arvot uudelleen 0/1:ksi mallin rakentamista varten (jossa 1 edustaa pahanlaatuista tapausta). Tarkkaillaan myös luokan jakaumaa.
Leave a Reply