Translate
Le projet Translate vise à intégrer la langue bretonne dans les traducteurs en ligne (Google Translate, Deepl, Microsoft Bing, etc.).
Google a récemment intégré le breton à l’issue d’un travail de fond et de long terme de la communauté bretonne (linguistes, Office public de la langue bretonne, universitaires, associations,…). Le fonds de dotation Bretagne Numérique a été heureux d’y contribuer par son travail de lobbying et des événements collaboratifs comme le Breizh Datathon. Notre travail se poursuit notamment par le développement d’un corpus en open source et l’intégration de la langue bretonne à d’autres plateformes de traduction.
Un travail qui se poursuit pour améliorer la traduction du breton
Le projet Translate d’intégration du breton dans les outils de traduction se poursuit au sein de Bretagne Numérique via 3 axes :
- 👩💻👨💻 le développement d’un corpus en langue bretonne accessible à tous en open source. Il s’agit de continuer à développer, avec l’aide de la communauté linguistique, les ressources en ligne afin de permettre à d’autres outils de traduction automatisée d’intégrer la langue bretonne. Un des enjeux sera notamment de contribuer à une diversité des outils de traduction français et européens, les outils existants étant aujourd’hui polarisés entre Chinois et Américains qui utilisent toutes les ressources de l’intelligence artificielle.
- 🚀 l’ajout du breton aux plateformes de traduction les plus courantes (Microsoft Translator, Deepl,…) afin d’en assurer la plus grande diffusion possible. Le fonds de dotation va ainsi continuer ses échanges avec les plateformes.
- 🥇🥈🥉 l’évaluation et l’amélioration des traductions proposées par les différents outils de traduction automatisée. Bretagne numérique collabore avec plusieurs chercheurs et universitaires pour mettre en place des évaluations et un classement des outils de traduction existants. Cette notation vise à encourager un processus d’amélioration continue pour les traducteurs automatiques et proposer aux locuteurs, apprenants ou curieux de la langue bretonne, un nouvel outil de référence pour déterminer quel est le meilleur outil pour traduire et comprendre le breton.
2024 – Breizh Datathon à Quimper
Le Breizh Datathon est une initiative de Bretagne Numérique qui s’inscrit dans la dynamique du projet Translate, projet qui vise à intégrer le breton dans Google Translate et autres traducteurs en ligne. L’initiative consiste à la production de données rassemblant des contributeurs bretonnants ou non sur le temps d’un week-end. Le premier datathon qui s’est tenu le 17 février a permis de répondre à un appel à projets lancé par l’université d’Abu Dhabi MBZUAI. Cette dernière propose de rassembler des données pour intégrer les langues régionales au sein d’outils d’intelligence artificielle qui font appel à des LLM (Large Language Model) au-delà des modèles anglais les plus courants (Google, Meta,…).
2024 – Intégration du breton dans Google Translate
L’intégration du breton dans Google est le fruit d’un travail de fond et de long terme de la communauté bretonne (linguistes, Office public de la langue bretonne, universitaires, associations,…). C’est une superbe reconnaissance pour la langue bretonne qui s’assure une visibilité planétaire, Google Translate étant de loin l’outil de traduction le plus utilisé au monde avec plus d’un milliard d’utilisateurs. Le fonds de dotation Bretagne Numérique a été heureux de contribuer par son travail de lobbying et des événements collaboratifs comme le Breizh Datathon.