Tarea 2
I. Desbalance de clases
Se sabe que en los problemas de clasificación, cuando existe un desbalance significativo entre el número de muestras de cada clase, un modelo de aprendizaje automático tiende a presentar sesgo hacia la clase mayoritaria una vez entrenado. En este ejercicio, debe demostrar este efecto utilizando como modelo una red neuronal feedforward (FANN) o una red neuronal convolucional (CNN) como modelo base.
Consideraciones:
- Debe implementar la FANN o CNN en alguno de los siguientes frameworks: Keras o PyTorch.
- Use un conjunto de datos de clasificación simple. El énfasis de este ejercicio está en demostrar el efecto del desbalance de clases. Puede utilizar la misma base de datos empleada en la Tarea 1.
- Puede partir de un problema con clases balanceadas y desbalancearlo artificialmente para evidenciar el efecto de este fenómeno.
Preguntas:
- Muestre el efecto que tiene el desbalance de clases en un problema de clasificación. Debe evaluar distintos escenarios, con y sin desbalance, utilizando métricas cuantitativas.
- Implemente dos mecanismos para afrontar el problema del desbalance de clases (por ejemplo, técnicas de remuestreo o modificación de la función objetivo). Esto implica tomar un conjunto de entrenamiento desbalanceado y, a partir de éste, mejorar el desempeño del modelo mediante los mecanismos elegidos.
II. Sistema de recomendación
- Reproduzca y explique el ejemplo de sistema de recomendación visto en clases (enlace), pero implementado en PyTorch.
- Modifique la formulación del sistema de recomendación con feedback explícito, pero reformúlelo como un problema de clasificación.
Instrucciones para la entrega.
- En la fecha correspondiente debe entregar un jupyter notebook con la solución de los ejercicios propuestos. Además, debe entregar el jupyter notebook con las salidas de las celdas visibles en formato pdf.
- Los archivos debe tener nombres con la estructura apellido_nombre_tarea2.ipynb y apellido_nombre_tarea2.pdf.
- No respetar estas instrucciones significarán una penalización en su nota de 10 puntos.