Hiperparametr modelu jest cechą modelu, która jest zewnętrzna w stosunku do modelu i której wartość nie może być oszacowana na podstawie danych. Wartość hiperparametru musi być ustalona przed rozpoczęciem procesu uczenia. Na przykład, c w Support Vector Machines, k w k-Nearest Neighbors, liczba ukrytych warstw w Neural Networks.
W przeciwieństwie do tego, parametr jest wewnętrzną cechą modelu i jego wartość może być oszacowana na podstawie danych. Przykład, współczynniki beta regresji liniowej/logistycznej lub wektory wsparcia w maszynach wektorów wsparcia.
Grid-search jest używany do znalezienia optymalnych hiperparametrów modelu, co skutkuje najbardziej „dokładnymi” przewidywaniami.
Przyjrzyjrzyjmy się Grid-Search budując model klasyfikacji na zbiorze danych Breast Cancer.
Importujemy zbiór danych i przeglądamy 10 najlepszych wierszy.
Wyjście :
Każdy wiersz w zbiorze danych ma jedną z dwóch możliwych klas: łagodną (reprezentowaną przez 2) i złośliwą (reprezentowaną przez 4). Ponadto, istnieje 10 atrybutów w tym zbiorze danych (pokazanych powyżej), które będą używane do predykcji, z wyjątkiem Numeru kodu próbki, który jest numerem id.
Czyścimy dane i zmieniamy nazwy wartości klas jako 0/1 do budowy modelu (gdzie 1 reprezentuje przypadek złośliwy). Zaobserwujmy również rozkład klas.
Leave a Reply