4. Entrenamiento, test y validación de modelos

4.3. Subajuste

También puede pasar el caso contrario, en el que los datos de entrenamiento son insuficientes y el algoritmo no aprende lo necesario para dar una buena respuesta. Los datos pueden no estar bien procesados, no ser representativos del conjunto completo o contener errores que engañan al modelo. Las salidas que obtendremos serán muy simples y con poco valor por un entrenamiento defectuoso.

En conclusión, las decisiones tomadas por los modelos de aprendizaje automático dependen en gran medida de los datos que utilicemos en las fases de entrenamiento y en la fase de test. Para generar un modelo de alta calidad debemos mantener un punto de equilibrio entre el sobreajuste y el subajuste de nuestro algoritmo.