Articles / augusti 19, 2021

Grid Search for model tuning

En modellhyperparameter är en egenskap hos en modell som är extern till modellen och vars värde inte kan uppskattas från data. Värdet på hyperparametern måste ställas in innan inlärningsprocessen börjar. Till exempel c i Support Vector Machines, k i k-Nearest Neighbors, antalet dolda lager i neurala nätverk.

En parameter är däremot en intern egenskap hos modellen och dess värde kan uppskattas från data. Exempel: Betakoefficienter i linjär/logistisk regression eller stödvektorer i Support Vector Machines.

Grid-search används för att hitta de optimala hyperparametrarna för en modell som resulterar i de mest ”exakta” förutsägelserna.

Låt oss titta på Grid-Search genom att bygga en klassificeringsmodell på datasetet för bröstcancer.

Importera datasetet och visa de tio översta raderna.

Output :

Varje rad i datamängden har en av två möjliga klasser: godartad (representeras av 2) och malign (representeras av 4). Det finns också 10 attribut i detta dataset (visas ovan) som kommer att användas för prediktion, utom Sample Code Number som är id-nummer.