05/07/18

Le machine learning se tourne vers le développement

ML Article
Les techniques de l'intelligence artificielle ont un fort potentiel de contribution au développement des pays pauvres, à condition de savoir en éviter les pièges - Crédit image: Egor Kotenko

Lecture rapide

  • L'apprentissage automatique est utilisé pour prédire la faim, la productivité des cultures, les déplacements
  • De nouvelles méthodes ont été développées et une feuille de route expose les meilleures pratiques
  • Les pièges comprennent la fiabilité des données et l'adaptation des projets aux pays les plus pauvres

Envoyer à un ami

Les coordonnées que vous indiquez sur cette page ne seront pas utilisées pour vous envoyer des emails non- sollicités et ne seront pas vendues à un tiers. Voir politique de confidentialité.

L'apprentissage automatique est utilisé pour aider à résoudre les problèmes de développement avec des résultats prometteurs, affirment des chercheurs, qui ont élaboré une feuille de route pour aider les concepteurs de futurs projets à éviter les pièges rcurrents.
 
De plus en plus populaire dans les pays riches, l'apprentissage automatique est un type d'intelligence artificielle (IA) dans lequel les ordinateurs apprennent – sans être explicitement programmés – en trouvant des associations statistiques dans de vastes quantités de données.

Mais l'utiliser pour résoudre les problèmes de développement se révèle être une gageure.
 

Malgré plusieurs tentatives pour l'appliquer à la pauvreté, à la famine ou aux déplacements de personnes, "nous n'avons pas encore eu connaissance d'expériences réussies d'apprentissage automatique propulser le développement", selon Maria De-Arteaga, du programme d'apprentissage automatique et de politique publique de l'université Carnegie Mellon de Pittsburgh, aux États-Unis.
 
Maria De-Artega s'exprimait lors de la conférence Tech4Dev de l'UNESCO, en Suisse, la semaine dernière (27-29 juin), où d'autres chercheurs ont présenté quelques projets prometteurs.
 
Stefano Ermon, professeur adjoint au département d'informatique de l'Université de Stanford (Californie), a ainsi déclaré qu'il pensait que l'apprentissage automatique pourrait résoudre la "sécheresse des données" dans les pays en développement.
 
"Nous avons accès à de nombreux flux de données provenant des satellites, des réseaux sociaux et des téléphones", a-t-il déclaré. "Elles contiennent clairement beaucoup d'informations qui nous intéressent … ces dernières n'ont pas été utilisées en grande partie parce qu'elles sont massives et non structurées."
 
"Mais l'IA est réellement en plein essor. Il y a eu beaucoup de progrès en termes de développement de nouvelles méthodes pour donner un sens à ces données."
 
L'apprentissage automatique laisse à l'ordinateur le soin d'élaborer une formule décrivant la structure d'une masse de données. 
 
Une forme particulière – l'apprentissage automatique supervisé – fonctionne en alimentant des ensembles de données tels que des données météorologiques et climatiques dans l'ordinateur avec des données de sortie, telles que des chiffres sur le rendement des cultures.

En examinant les millions de liens possibles entre ces données, l'ordinateur détermine comment elles sont connectées. À partir de là, il peut théoriquement prédire le rendement futur des cultures à partir de nouvelles données météorologiques et climatiques.
 

Stefano Ermon a décrit le succès de son équipe qui a réussi à prédire la productivité des cultures aux États-Unis dans les mois précédant la récolte : leur précision était comparable à celle des enquêtes sur le terrain, menées par le département de l'agriculture des États-Unis. 
 
Le modèle a maintenant été utilisé en Argentine, au Brésil et en Inde, a-t-il dit, et est en train d'être étendu à l'Afrique.
 
Toutefois, il a admis qu'il y avait des problèmes d'adaptation à des tailles de champs plus petites et des données au sol plus rares pour assurer un fonctionnement optimal du système.
 
L'équipe de Stefano Ermon a également développé un outil qui associe les données d'enquête aux caractéristiques des images satellitaires de 30 pays africains. Elle peut maintenant prédire certains indices de développement à partir de ces données, tels que l'accès à l'électricité, à l'eau courante et aux eaux usées.

“Nous passons d'une recherche active d'informations à une extraction d'informations supervisée.”

Leonardo Milano

"Pour quelques mesures grossières de la qualité de l'infrastructure, ce modèle semble fonctionner plutôt bien", a-t-il déclaré.

Wesley van der Heijden, étudiant en maîtrise à l'Université de Tilburg aux Pays-Bas, a pour sa part décrit les tentatives de prédiction de la faim en Ethiopie sans avoir recours à des enquêtes coûteuses. 
 
L'ordinateur a établi des corrélations entre les données satellitaires, économiques et démographiques, d'une part, et les prévisions sur la faim du système d'alerte précoce contre la famine, FEWS NET, d'autre part. Les résultats ont fonctionné pour les situations de faim urgentes, qu'ils ont permis de prédire, mais pas pour les situations moins graves, a-t-il expliqué.
 
Enfin, Leonardo Milano, chercheur principal en données au Centre de surveillance des déplacements internes, basé à Genève, a déclaré que son système d'apprentissage automatique avait appris à extraire des informations sur les personnes déplacées à partir de 5.000 informations quotidiennes en provenance des médias. Cela produit des quantités plus petites et gérables d'informations que les humains peuvent analyser.
 
"Nous passons d'une recherche active d'informations à une extraction d'informations supervisée", a-t-il déclaré.
 
Maria De-Arteaga s'est montrée plus prudente, mettant en garde contre les dangers de l'adoption d'une approche "par ruissellement", dans laquelle un projet de machine learning réussi provenant du monde développé est réorienté vers les pays les plus pauvres.
 
"Ce qui se passe en conséquence [de cette approche], c'est que les outils dont nous disposons encodent l'infrastructure et le contexte des régions développées", a-t-elle fait valoir et ces données pourraient donc être biaisées ou inappropriées dans les pays pauvres.
 
Penser de plus près aux problèmes locaux pour lesquels elle sera utile est également important, selon Maria De-Artega. "Bien que cela puisse sembler très évident, c'est une composante très souvent absente des projets ML4D [Machine learning for development – Apprentissage automatique pour le développement], a-t-elle poursuivi.
 
Maria De-Artega collabore avec des collègues pour rassembler des documents de recherche sur ce qu'ils appellent un nouveau domaine de recherche, Machine Learning for Development (ML4D). 
 
Elle a déclaré à la conférence que la feuille de route, qui doit être publiée dans une revue à comité de lecture, définit ce qu'est le machine learning et qui devrait être impliqué, décrit ce concept et identifie les défis auxquels elle sera confrontée en termes de recherche, tels que la fiabilité des données. 
 
L'un des objectifs est d'éviter de reproduire les erreurs commises dans d'autres domaines du développement, a-t-elle déclaré.

Références