Valerio Basile

Institución: Universidad de Turín (Italia).

Título: How to Model the Voice of the Minority: a Perspectivist Approach to NLP

Resumen: El Procesamiento del Lenguaje Natural contemporáneo se basa en gran medida en los recursos lingüísticos, por ejemplo, para el entrenamiento de modelos en el aprendizaje automático supervisado. Incluso en entornos con pocos o ningún ejemplo, la importancia de disponer de datos de buena calidad para la evaluación comparativa es primordial. Normalmente, los datos se presentan en forma de grandes conjuntos de datos anotados manualmente. Sin embargo, la armonización de la anotación suele ser problemática, sobre todo cuando se realizan tareas de anotación muy subjetivas, como el sentimiento, la ironía, el lenguaje indeseable y, en general, cualquier cosa que implique pragmática. Descartar y promediar las opiniones discordantes conlleva el riesgo de perder el rico conocimiento procedente de las perspectivas de los distintos anotadores.
Una línea de investigación reciente propone no agregar nunca las anotaciones [1], sino aprovechar el valor del conocimiento que se encuentra en el desacuerdo para construir modelos [2] y evaluarlos [3].
En esta charla presentaré el paradigma perspectivista, centrándome en el PLN, y algunos trabajos que exploran sus implicaciones en la anotación de datos, la evaluación de modelos y la interoperabilidad, con especial atención al modelado perspectivista del discurso del odio y la ironía.

[1] The Perspectivist Manifesto. https://pdai.info/
[2] Basile et al. 2021 «We Need to Consider Disagreement in Evaluation» https://aclanthology.org/2021.bppf-1.3/
[3] Cabitza et al. «Toward a perspectivist turn in ground truthing for predictive computing». AAAI-23. https://arxiv.org/pdf/2109.04270.pdf

Bio: Valerio Basile es profesor adjunto en el Departamento de Informática de la Universidad de Turín (Italia), miembro del Content-Centered Computing group y del Hate Speech Monitoring group. Su trabajo abarca varias áreas como: representaciones formales del significado, anotación lingüística, generación de lenguaje natural, conocimiento de sentido común, análisis semántico, análisis de sentimientos y detección del discurso del odio, perspectivas y sesgos en el aprendizaje automático supervisado, desde la creación de datos hasta la evaluación de los sistemas. Actualmente es IP del proyecto BREAKhateDOWN «Toxic Language Understanding in Online Communication», y uno de los principales defensores del Perspectivist Data Manifesto: https://pdai.info.

Elena Cabrio

Institución: Universidad Côte d’Azur (Francia).

Título: Processing Natural Language to Extract, Analyze and Generate Arguments from Texts.

Resumen: Las máquinas inteligentes enriquecidas con modelos computacionales de argumentación pueden extraer, analizar, resumir y generar estructuras argumentativas en lenguaje natural a partir de diferentes contextos y de diversos recursos textuales. En esta charla, presentaré en primer lugar el área de investigación de la Minería de Argumentos, que aborda el reto de identificar componentes y estructuras argumentativas a partir de textos. A continuación, expondré cómo se pueden utilizar estos métodos en dos escenarios diferentes: 1) en textos médicos: para mejorar la medicina basada en pruebas con análisis argumentativos en lenguaje natural de ensayos clínicos y para generar explicaciones en lenguaje natural basadas en argumentos para las respuestas correctas e incorrectas de exámenes médicos estandarizados, y 2) en textos políticos: para identificar argumentos falaces en debates políticos. Concluiré con algunas reflexiones sobre la generación automática de contraargumentos para luchar contra la desinformación y la incitación al odio en Internet.

Bio: Elena Cabrio es profesora titular en la Universidad Côte d’Azur y miembro del equipo de investigación Wimmics de Inria-I3S. En 2021 se le concedió una Cátedra de Inteligencia Artificial en el Instituto Interdisciplinario de Inteligencia Artificial 3IA Côte d’Azur sobre «IA y Lenguaje Natural». Sus principales intereses de investigación se centran en el PLN, principalmente la minería de argumentos, la extracción de información y la detección del discurso de odio. El objetivo de su investigación es diseñar tecnologías de debate para sistemas avanzados de apoyo a la toma de decisiones, con el fin de apoyar el intercambio de información y opiniones en diferentes ámbitos (como la sanidad y la política), aprovechando la interdisciplinaridad y los avances en el aprendizaje automático para el Procesamiento del Lenguaje Natural. Ha publicado más de 100 artículos científicos, entre revistas y conferencias de primer nivel en IA y PLN. Actualmente coordina el proyecto ANTIDOTE (ArgumeNtaTIon-Driven explainable artificial intelligence fOr digiTal mEdicine) (CHIST-ERA XAI 2019).