Un hiperparámetro del modelo es una característica de éste que es externa al modelo y cuyo valor no puede estimarse a partir de los datos. El valor del hiperparámetro debe fijarse antes de que comience el proceso de aprendizaje. Por ejemplo, c en las máquinas de vectores de apoyo, k en k-Nearest Neighbors, el número de capas ocultas en las redes neuronales.
En cambio, un parámetro es una característica interna del modelo y su valor puede estimarse a partir de los datos. Por ejemplo, los coeficientes beta de la regresión lineal/logística o los vectores de soporte en las máquinas de vectores de soporte.
La búsqueda en cuadrícula se utiliza para encontrar los hiperparámetros óptimos de un modelo que da lugar a las predicciones más «precisas».
Veamos la búsqueda en cuadrícula construyendo un modelo de clasificación en el conjunto de datos del cáncer de mama.
Importar el conjunto de datos y ver las 10 primeras filas.
Salida :
Cada fila del conjunto de datos tiene una de dos clases posibles: benigna (representada por 2) y maligna (representada por 4). Además, hay 10 atributos en este conjunto de datos (mostrados arriba) que se utilizarán para la predicción, excepto el número de código de muestra que es el número de identificación.
Limpie los datos y cambie el nombre de los valores de la clase como 0/1 para la construcción del modelo (donde 1 representa un caso maligno). Además, observemos la distribución de la clase.
Leave a Reply