Rapprocher la science et le développement

  • Cinq nouvelles langues africaines bientôt dans Google Translate

Lecture rapide

  • Google envisage d’ajouter cinq langues africaines à son outil de traduction en ligne, Google Traduction

  • Les utilisateurs sont invités à noter des traductions automatiques initiales offertes par le système

  • S’ils accueillent favorablement l’initiative, plusieurs specialistes mettent en garde contre d’importants défis à relever

Google, le géant américain de l'Internet, prévoit d'ajouter cinq nouvelles langues africaines à sa liste de langues traduisibles à partir de son outil de traduction automatique en ligne, Google Traduction.
 
Il s’agit d’une fonctionnalité permettant de traduire du texte ou une page Internet d’une langue à l’autre, à l’aide d’un système de 72 langues choisies en fonction du volume de contenus qu’elles offrent en ligne.
 
Le haoussa, le ibo, le somali, le yoruba et le zoulou s'ajouteront donc aux langues actuellement disponibles. A travers la page Google Africa, les utilisateurs sont sollicités pour tester et évaluer la qualité des traductions de ces cinq nouvelles langues.
 
Pour Pierre Sambou, enseignant-chercheur et spécialiste de linguistique descriptive à l'Université Cheikh Anta Diop de Dakar, l'initiative constitue une avancée dont les Africains doivent se féliciter, 'en ce sens qu'une partie significative de la connaissance peut être véhiculée en un clic à travers des langues africaines.'
 
Toutefois, Pierre Sambou note les limites du service de traduction en ligne, 'qui n’est pas toujours en mesure de fournir des traductions contextuelles.'
Le linguiste explique que les traductions proposées par Google sont par moments très générales et assimilables, dans certaines situations, à du contresens.
 
'Si l'on tient compte de la spécificité des langues africaines, on notera aussi qu'elles sont particulièrement riches en polysémies et comportent des particularités dans le ton, le trait ATR (Advanced Tongue Root - Avancement ou rétraction de la racine de la langue), etc., qui suffisent très souvent à varier le sens d'un mot. La technologie sera-t-elle en mesure d'en tenir compte?' s'interroge Pierre Sambou.
 
Cette observation montre les limites du service, dans la mesure où les traductions proposées par Google sont gérées par des systèmes informatiques et comportent des imperfections.  Pour être efficace, le dispositif a besoin d'analyser un grand nombre de documents traduits par l'homme dans une langue donnée, pour perfectionner sa propre traduction.

En d'autres termes, moins une langue compte de documents en ligne, moins le système est apte à effectuer des traductions de qualité acceptable. Et plus une langue est utilisée en ligne, plus sa traduction peut s'améliorer au fil du temps.
 
Pour Google, l'inclusion des cinq nouvelles langues africaines répond avant tout au souci d'ouvrir l'Internet aux utilisateurs de ces langues et de rendre accessibles au reste du monde des contenus en ligne disponibles dans ces langues.
 
Sur les sites de Google, les internautes apprécient l'initiative et manifestent volontiers leur intérêt pour ces tests. En revanche, les spécialistes se montrent quelque peu sceptiques. Invité à apprécier la précision des traductions automatiques offertes en langue haoussa, le rédacteur en chef du service haoussa de la BBC, Liman Mansur, s'est ainsi montré réservé.
 
'Dans plusieurs cas, la traduction s'est révélée comme le contraire du texte original', a-t-il expliqué à SciDev.Net. 'Il y a des situations où le texte en anglais était utilisé en lieu et place du texte en haoussa, et vice versa. Le système semble ne pas comprendre que la traduction de certains mots en langue haoussa dépend du terme précédent ou suivant. Il a tendance à traiter chaque mot de manière indépendante, sans tenir compte du contexte et, de manière générale, cela ne marche pas en langue haoussa.'
 
Google, pour sa part, soutient que les ingénieurs de l'équipe Google Translate travaillent ardemment pour améliorer la qualité des traductions, afin que chaque nouvelle langue ajoutée présente une qualité suffisamment bonne pour que les utilisateurs puissent s'y fier.
 
'Une fois qu'une langue donnée remplit nos critères de sélection, nous en évaluons les caractéristiques techniques et la rendons disponible en mode alpha', explique Dorothy Ooko, chargée de communication pour l'Afrique de l'Est et l'Afrique Francophone à Google. 'Cela signifie que c'est une version initiale du système de traduction susceptible d'être utilisée dans certaines situations.'
 
En d'autres termes, les cinq nouvelles langues africaines sélectionnées devront encore passer sous le statut de 'langue alpha' avant d'être lancées officiellement.
Toutefois, Google, comme à son habitude, se refuse d'annoncer une date officielle de lancement et se contente, pour l'heure, d'inviter les utilisateurs à essayer le système et à faire part de leurs réactions.
 
Plusieurs spécialistes contactés par SciDev.Net déplorent aussi la limitation des tests en cours à une traduction de l’anglais vers l’une des langues africaines données et vice versa, ce qui ne permet pas de capturer la richesse et la complexité des variations locales de ces langues.
 
A titre d’exemple, le yoruba est une langue qui se parle dans plusieurs pays d’Afrique, notamment au Nigeria, au Bénin et au Togo, ainsi qu’en  Amérique latine. Or, les populations du Bénin, du Togo ou de Cuba, par exemple, ne s’expriment pas en anglais et ne peuvent donc pas contribuer de manière efficace aux essais en cours, dans la mesure où le système de tests n’est ouvert qu’aux anglophones.
 
Il en va de même du haoussa, qui est également parlé au Niger, tandis que l’écrasante majorité des Nigériens s’expriment en français. Les linguistes estiment à au moins 2100 le nombre de langues et dialectes parlés en Afrique. 
 
Il est évident qu’en fonction des critères stricts de sélection de ces langues dans l’outil de traduction en ligne de Google, un grand nombre de ces langues seront laissées pour compte : moins que le nombre de locuteurs de ces langues, l’un des critères essentiels est en effet le volume de contenu en ligne.
 
Or, vu l’ampleur du fossé numérique entre l’Afrique et les autres continents, ainsi que le niveau d’analphabétisme sur le continent, il y a de faibles chances que ces langues atteignent dans un avenir proche les niveaux de présence sur Internet de plusieurs autres langues avec une présence plus importante sur la toile.

Pour tester les nouveaux services de traudction en ligne offerts dans les cinq langues africaines, veuillez cliquer sur les liens ci-dessous: