Articles / 19 sierpnia, 2021

Grid Search for model tuning

Hiperparametr modelu jest cechą modelu, która jest zewnętrzna w stosunku do modelu i której wartość nie może być oszacowana na podstawie danych. Wartość hiperparametru musi być ustalona przed rozpoczęciem procesu uczenia. Na przykład, c w Support Vector Machines, k w k-Nearest Neighbors, liczba ukrytych warstw w Neural Networks.

W przeciwieństwie do tego, parametr jest wewnętrzną cechą modelu i jego wartość może być oszacowana na podstawie danych. Przykład, współczynniki beta regresji liniowej/logistycznej lub wektory wsparcia w maszynach wektorów wsparcia.

Grid-search jest używany do znalezienia optymalnych hiperparametrów modelu, co skutkuje najbardziej „dokładnymi” przewidywaniami.

Przyjrzyjrzyjmy się Grid-Search budując model klasyfikacji na zbiorze danych Breast Cancer.

Importujemy zbiór danych i przeglądamy 10 najlepszych wierszy.

Wyjście :

Każdy wiersz w zbiorze danych ma jedną z dwóch możliwych klas: łagodną (reprezentowaną przez 2) i złośliwą (reprezentowaną przez 4). Ponadto, istnieje 10 atrybutów w tym zbiorze danych (pokazanych powyżej), które będą używane do predykcji, z wyjątkiem Numeru kodu próbki, który jest numerem id.