Comment l’IA donne des yeux aux machines
« Vu ce que l’on peut faire avec des données classiques, imaginez le potentiel des images ». En quelques mot Sihame Aaarab, data scientist au sein de Microsoft France, résume les attentes que suscite l’intelligence artificielle appliquée aux images. Bonne nouvelle : la démocratisation de l’IA est une réalité et il existe déjà de nombreux moyens de concrétiser son potentiel. Aux côtés de Aleksander Callebat, également data scientist chez Microsoft France, Sihame Aaarab a profité de l’édition 2017 de Microsoft Experiences pour illustrer les outils disponibles, avec ou sans développement.
À l’appui de leur visite guidée, l’Intelligent Kiosk qui propose plusieurs scénarios tirant parti des services cognitifs de Microsoft. De quoi se familiariser avec les capacités de ces services, de la reconnaissance de l’âge d’une personne à des fonctions évoluées telle que la reconnaissance des émotions. Un procédé qui pourrait être utilisé par exemple dans les rayons d’un magasin pour évaluer la satisfaction (ou non) des clients découvrant un produit. L’API utilisée – Face API – permet aussi de reconnaître des visages. Une technologie mise en oeuvre d’ailleurs sur Video Indexer pour chapitrer automatiquement une vidéo en fonction des prises de parole des intervenants.
Les développeurs de leur côté ont d’ores et déjà la possibilité d’exploiter de manière avancée ces services cognitifs. Comme Aleksander Callebat le démontre, une vingtaine de lignes de code suffisent pour transformer une image en un fichier .csv qui décrit l’ensemble des attributs (objets reconnus, dominante de couleur…). Surtout, les outils aujourd’hui disponibles comme Azure Machine Learning Studio permettent aux développeurs d’entrainer leurs propres modèles. Avec suffisamment de précision pour, au final, réussir à distinguer un chihuahua d’un muffin (regardez la vidéo ci-dessous pour comprendre…) ou, plus sérieusement, un tableau original d’une reproduction.
L’évolution des algorithmes permet d’aller plus loin encore, notamment avec le recours aux Generative Algorithm Networks (GAN) qui ne se contentent plus de reconnaître des images mais se montrent capables de les produire. Avec des applications très concrètes à la clé comme l’ajout de lunettes à un visage. C’est d’ailleurs ces GAN qui ont été exploités dans le cadre du projet Rembrandt pour produire une peinture que l’artiste… n’a jamais créée.
Regardez le Talk « Donner des yeux aux machines » (24’00)