Le breton intégré à Google Translate !
Google a annoncé ce jeudi 27 juin l’intégration du breton dans son outil de traduction Google Translate. C’est une superbe reconnaissance pour la langue bretonne qui s’assure une visibilité planétaire, Google Translate étant de loin l’outil de traduction le plus utilisé au monde avec plus d’un milliard d’utilisateurs et plus de 100 milliards de mots traduits chaque jour. Cette intégration est une reconnaissance du travail de toute la communauté bretonne, tâche à laquelle le fonds de dotation Bretagne Numérique est heureux de contribuer via son projet Translate.
110 nouvelles langues ajoutées dont le breton
Avec 110 langues ajoutées lors de cette mise à jour, le breton, avec le mannois parlé sur l’île de Man, rejoint les autres langues celtiques déjà présentes dans Google Translate (gaélique écossais, gallois et irlandais). Ne manque plus à cette liste que le cornique pratiqué en Cornouailles anglaise.
Cet ajout massif a été rendu possible par l’utilisation de l’intelligence artificielle. Grâce à son grand modèle de langage PaLM 2. Par rapport à ses précédents modèles de langage, PaLM 2 est particulièrement efficace pour l’apprentissage de langues étroitement liées les unes aux autres.
Du cantonais au qʼeqchiʼ, ces nouvelles langues représentent plus de 660 millions de locuteurs et vont permettre à 8 % de la population mondiale d’effectuer des traductions. Environ un quart des nouvelles langues proviennent d’Afrique avec notamment le fon, le kikongo, le luo, le ga, le swati, le venda et le wolof.
L’écart entre les langues existantes et celles intégrées aux outils de traduction automatique reste cependant important : sur les 7000 langues existantes, moins de 7 % peuvent être traduites automatiquement.
Cette situation doit mobiliser les communautés linguistiques pour assurer l’avenir de leur langue dans un univers numérique aujourd’hui incontournable en matière de consommation culturelle : 87 % des internautes français de 15 ans et plus sont consommateurs d’au moins un bien culturel dématérialisé (ARCOM, 2023).
Le résultat d’un travail de fond de toute la communauté bretonne
L’intégration du breton dans Google est le fruit d’un travail de fond et de long terme de la communauté bretonne (linguistes, Office public de la langue bretonne, universitaires, associations,…).
Le fonds de dotation Bretagne Numérique a été heureux d’y contribuer par son travail de lobbying et des événements collaboratifs comme le Breizh Datathon.
Nous remercions à cet égard tous les bénévoles, nos partenaires et nos mécènes au premier rang desquels la Fondation du Crédit Agricole du Finistère qui nous ont apporté leur aide et leur soutien.
Un travail qui se poursuit pour améliorer la traduction du breton
Le projet Translate d’intégration du breton dans les outils de traduction se poursuit au sein de Bretagne Numérique via 3 axes :
- 👩💻👨💻 le développement d’un corpus en langue bretonne accessible à tous en open source. Il s’agit de continuer à développer, avec l’aide de la communauté linguistique, les ressources en ligne afin de permettre à d’autres outils de traduction automatisée d’intégrer la langue bretonne. Un des enjeux sera notamment de contribuer à une diversité des outils de traduction français et européens, les outils existants étant aujourd’hui polarisés entre Chinois et Américains qui utilisent toutes les ressources de l’intelligence artificielle.
- 🚀 l’ajout du breton aux plateformes de traduction les plus courantes (Microsoft Translator, Deepl,…) afin d’en assurer la plus grande diffusion possible. Le fonds de dotation va ainsi continuer ses échanges avec les plateformes.
- 🥇🥈🥉 l’évaluation et l’amélioration des traductions proposées par les différents outils de traduction automatisée. Bretagne numérique collabore avec plusieurs chercheurs et universitaires pour mettre en place des évaluations et un classement des outils de traduction existants. Cette notation vise à encourager un processus d’amélioration continue pour les traducteurs automatiques et proposer aux locuteurs, apprenants ou curieux de la langue bretonne, un nouvel outil de référence pour déterminer quel est le meilleur outil pour traduire et comprendre le breton.