Et si nos voix et l'IA nous aidaient à préserver nos langues?
No se pudo agregar al carrito
Add to Cart failed.
Error al Agregar a Lista de Deseos.
Error al eliminar de la lista de deseos.
Error al añadir a tu biblioteca
Error al seguir el podcast
Error al dejar de seguir el podcast
-
Narrado por:
-
De:
Aujourd’hui, les langues de France - à l’exception du français - restent largement absentes des outils numériques et des systèmes vocaux. Pour inverser cette tendance, l'Inria et ses partenaires lancent une campagne nationale et participative de collecte de voix.
Comment travailler à la pluralité des langues dans un monde dominé par l'intelligence artificielle ?
Grace à une collecte de voix, le projet COLaF (pour Corpus et Outil pour les Langues de France) cherche de la parole spontanée pour créer des outils en langue locale !
Selon la DGLFLF, il y a environ 75 langues reconnues en France, langues majoritairement absentes des outils numériques. « Mais de toute façon à part cinq ou six langues, dont le français, les langues sont très peu utilisées dans les outils numériques », précise Sam Bigeard.
L'objectif de ce projet est de créer un corpus et un jeu de données, d'enregistrements et de textes. Chaque utilisateur peut enregistrer ce qu’il veut, en allant sur une plateforme. L'utilisateur est guidé par une question : « Quelle est votre recette préférée ? » « Quelle est la maison de vos rêves ? »« Avez-vous un animal de compagnie ? », et on y répond dans sa langue !
La première langue à l'essai est l'alsacien. Selon une étude datant de 2022, 36% d'Alsaciens disent parler encore "très bien" la langue alsacienne et 10% "assez bien" . « Ce qui est intéressant, c'est qu'on entend l'alsacien qui est parlé aujourd'hui. On a un observatoire fantastique ! », ajoute Pascale Erhart.
Les enregisrements sont ensuite transcrits car le but de la manoeuvre est de pouvoir faire de la transcription automatique. « Mais ce n'est pas toujours simple car parfois certaines langues ne sont pas des langues écrites. »
Pour le moment, ils disposent de l'équivalent de 4h30 d'enregistrement en alsacien. Le picard, le breton, l'occitan, les créoles, le shimaoré, la langue des signes sont également à l'étude.
Invités :
- Sam Bigeard, ingénieur et chef de projet COLaF au sein de l'équipe Multispeech du Centre Inria de l'Université de Lorraine.
- Pascale Erhart, Maître de Conférences à l'Université de Strasbourg, Faculté des Langues, et enseignante en dialectologie alsacienne et mosellane.
Pour participer au projet, rendez-vous ici
Et la chronique Ailleurs nous emmène à Cotonou au Bénin où des initiatives similaires naissent pour préserver les langues locales. 60% de la population parle une langue locale. La plateforme J'aime ma langue a démarré en juillet 2025. Il vise à utiliser la voix des utilisateurs pour collecter des données pour les modèles d'intelligences artificielles, une première en Afrique !
Avec Jean-Eudes Awanvoeke, chef du projet Jaimemalangue.
Programmation musicale :
L'artiste Meryl en duo avec l'artiste Théodora avec le titre Instruction.