Datathon: el desafío analítico para ir a más
La Unidad de Maestrías y Postgrados en Economía (UMPE) de la Facultad de Ciencias Empresariales y Economía lanzó, junto a Scotiabank, el desafío Datathon. En esta competencia los inscriptos debieron trabajar con datos propuestos por la entidad financiera y generar un modelo de predicción de ingresos.
Participaron egresados y alumnos del Postgrado en Business Analytics & Data Science (BA & DS) de UMPE, así como alumnos de grado de la Universidad de Montevideo.
El lanzamiento de la actividad se realizó en modalidad online el 2 de marzo y contó con los coordinadores del Postgrado en BA & DS y Juan Ignacio Noguez, desde Scotiabank. Participaron todos los equipos inscriptos.
La final
Se presentaron doce grupos a la competencia. A partir del día de lanzamiento del programa, los participantes trabajaron para generar predicciones que debieron entregar el 8 de abril. Entre el 2 de marzo y el 8 de abril se actualizaron las posiciones según la efectividad de los resultados.
El día de cierre se revelaron los ganadores:
1er puesto: Juan Alzugaray (egresado del Posgrado de Data Science).
2do puesto: Cecilia Tejera y Agustín Odriozola (egresados el Posgrado de Data Science).
3er puesto: Juan Ignacio Bruzzone y Joaquín Bruzzone (estudiantes de grado).
El desafío
El economista Mag. Santiago Ormando, encargado de la coordinación de la actividad, explicó en detalle la Datathon.
¿En qué consiste la Datathón?
El objetivo es que los participantes puedan enfrentarse a un problema real y solucionarlo aplicando las herramientas que vieron en sus programas. Al momento de aprender las distintas técnicas de predicción, muchas veces se utilizan datasets de "laboratorio", que son un poco distintos a los reales. La mayor diferencia es que estos ya están limpios. Por esta razón, el Datathon es una buena oportunidad para realizar el proceso completo, desde visualizar los datos y limpiarlos, hasta entrenar el modelo de predicción. Este tipo de competencia es muy popular a nivel mundial.
Scotiabank puso a disposición una base de datos simulada para que los participantes puedan resolver el problema de un modelo para estimar ingresos. La métrica que se utilizará para evaluar al equipo ganador será el que tenga el mínimo de Mean Absolute Percentage Error (MAPE).
¿Qué utilidad tiene un modelo para estimar ingresos?
Para los bancos es relevante para todo lo relacionado con el sistema crediticio. Puede ser un factor a tener en cuenta para otorgar un préstamo, límites de tarjetas, ofrecer servicios personalizados, sin que sea necesario que la persona presente su recibo de sueldo. Con este instrumento, el proceso podría hacerse de manera mucho más ágil.
¿Cuál es el mayor desafío para los participantes?
Los participantes no solo tendrán que entrenar un modelo, también deberán ser capaces de realizar una exhaustiva limpieza de datos que permita trabajar con registros de forma tal que se pueda capturar la mayor cantidad de información posible, elegir qué variables son las relevantes para utilizar y optimizar el modelo según la métrica específica.