Ricerca a griglia per il tuning del modello
Un iperparametro del modello è una caratteristica di un modello che è esterna al modello e il cui valore non può essere stimato dai dati. Il valore dell’iperparametro deve essere impostato prima che il processo di apprendimento inizi. Per esempio, c nelle Support Vector Machines, k nei k-Nearest Neighbors, il numero di strati nascosti nelle reti neurali.
Al contrario, un parametro è una caratteristica interna del modello e il suo valore può essere stimato dai dati. Esempio, i coefficienti beta della regressione lineare/logistica o i vettori di supporto nelle Support Vector Machines.
Grid-search è usato per trovare gli iperparametri ottimali di un modello che risulta nelle previsioni più ‘accurate’.
Guardiamo il Grid-Search costruendo un modello di classificazione sul dataset del cancro al seno.
Importa il dataset e visualizza le prime 10 righe.
Output :
Ogni riga del dataset ha una delle due possibili classi: benigna (rappresentata da 2) e maligna (rappresentata da 4). Inoltre, ci sono 10 attributi in questo set di dati (mostrato sopra) che saranno utilizzati per la predizione, tranne il numero di codice del campione che è il numero id.
Puliamo i dati e rinominiamo i valori delle classi come 0/1 per la costruzione del modello (dove 1 rappresenta un caso maligno). Inoltre, osserviamo la distribuzione della classe.
Output :
Ci sono 444 casi benigni e 239 maligni.
Output :
Dall’output, possiamo osservare che ci sono 68 casi maligni e 103 benigni nel dataset di test. Tuttavia, il nostro classificatore predice tutti i casi come benigni (in quanto è la classe di maggioranza).
Calcolare la metrica di valutazione di questo modello.
Output :
Leave a Reply