Introduction Projets IA 2023 ¶

2023-09-13 Des giga-modèles pour le traitement automatique du langage naturel et des données multimodales ¶

Pour répondre aux enjeux scientifiques et sociétaux soulevés par l’émergence des grands modèles de langue, l’Agence nationale de la recherche (ANR) a lancé en février 2023 l’appel à projet Thématiques Spécifiques en Intelligence Artificielle (TSIA)

Huit projets sont lauréats pour la thématique « Giga-modèles pour le traitement automatique du langage naturel et des données multimodales », dont le projet MALADES coordonné par Richard Dufour, professeur à Nantes Université, membre du Laboratoire des Sciences du Numérique de Nantes (LS2N - CNRS/Centrale Nantes/Nantes Université) et Pantagruel, coordonné par Didier Schwab, professeur à l’Université Grenoble Alpes, membre du Laboratoire d’Informatique de Grenoble (LIG-CNRS/Université Grenoble Alpes)

L’adoption par la société des outils issus du traitement automatique du langage naturel (TALN), comme ChatGPT d’OpenAI, Bard de Google ou de la solution open-source Alpaca de Stanford s’est accélérée ces dernières années.

Cela est dû à leur amélioration constante : ils bénéficient de la rencontre d’approches statistiques par apprentissage profond (deep learning), de la disponibilité d’énormes quantité de données (Big Data) et de l’accès à d’importantes puissances de calcul.

Grâce à des milliards de documents textuels collectés et à des stratégies d’apprentissage non-supervisé efficaces, les derniers modèles, connus sous le nom de grands modèles de langue (Large Language Models ou LLM), intègrent notamment des capacités génératives.

Cela signifie qu’ils sont aussi capables de générer du contenu textuel. Ils peuvent ainsi être adaptés pour traiter une multitude de tâches de TALN, comme de la traduction automatique, le résumé de documents, le dialogue humain-machine, etc. Bien qu’une nouvelle étape ait été franchie en TALN, ces modèles soulèvent encore d’importants enjeux scientifiques et sociétaux.