Desarrollar un modelo de inteligencia artificial capaz de analizar declaraciones y predecir su veracidad basada en patrones históricos de declaraciones previas. El objetivo es fomentar el análisis de datos, el procesamiento de lenguaje natural (NLP) y la ética en la IA.
En el conjunto de datos tenemos:
- df_data.csv como dataset de entrenamiento
- test_data.csv como dataset de prueba
La variable objetivo es la columna “Etiqueta”, la entrega como solución debe ser el conjunto de datos test_data.csv agregando la columna “Etiqueta” con las predicciones obtenidas.
Se puede participar en equipos de hasta 3 participantes, se recomienda equipos multidisciplinarios.
Variable objetivo: Etiqueta
Conjunto de datos de entrenamiento: df_data.csv
Conjunto de datos de pruebas: df_data.csv
Descargar dataset
Diccionario de Variables
Variable |
Descripción |
ID |
Identificador único de cada declaración. |
Etiqueta |
Variable objetivo: indica si la declaración es verdadera (True) o falsa (False). |
Declaración |
Texto de la declaración realizada. |
Tema |
Categoría o tema al que pertenece la declaración (ej: economía, salud, educación). |
Orador |
Nombre de la persona que realizó la declaración. |
Cargo del Orador |
Rol o posición que ocupa el orador (ej: presidente, senador, periodista). |
Estado |
Estado o región asociada al orador o a la declaración. |
Afiliación Política |
Partido o tendencia política del orador. |
Cantidad Verdadera |
Número de declaraciones previas del orador clasificadas como verdaderas. |
Cantidad Falsa |
Número de declaraciones previas del orador clasificadas como falsas. |
Contexto |
Circunstancia o situación en la que se realizó la declaración. |
Precisión del modelo (F1-score macro sobre el dataset de prueba).
La evaluación de las soluciones se realizará considerando la precisión del modelo de clasificación sobre el conjunto de prueba. La métrica será el F1-score macro, dado que permite equilibrar la importancia de cada clase en contextos con posibles desbalances de datos. Este enfoque asegura que los equipos desarrollen modelos capaces de generalizar de manera robusta, evitando sesgos hacia la clase mayoritaria y favoreciendo un desempeño equilibrado.
- Si tienes dudas puedes plantearlas en el foro de este challenge e intercambiar con otros participantes.
- También puedes realizar los cursos recomendados para adquirir el conocimiento necesario y ser el mejor de este
desafío
acá
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore
magna aliqua.
Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis
aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint
occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.