Comment l’IA donne des yeux aux machines

Temps de lecture : 2 minutes

Publié le 15 octobre 2017

« Vu ce que l’on peut faire avec des données classiques, imaginez le potentiel des images ». En quelques mot Sihame Aaarab, data scientist au sein de Microsoft France, résume les attentes que suscite l’intelligence artificielle appliquée aux images. Bonne nouvelle : la démocratisation de l’IA est une réalité et il existe déjà de nombreux moyens de concrétiser son potentiel. Aux côtés de Aleksander Callebat, également data scientist chez Microsoft France, Sihame Aaarab a profité de l’édition 2017 de Microsoft Experiences pour illustrer les outils disponibles, avec ou sans développement.

À l’appui de leur visite guidée, l’Intelligent Kiosk qui propose plusieurs scénarios tirant parti des services cognitifs de Microsoft. De quoi se familiariser avec les capacités de ces services, de la reconnaissance de l’âge d’une personne à des fonctions évoluées telle que la reconnaissance des émotions. Un procédé qui pourrait être utilisé par exemple dans les rayons d’un magasin pour évaluer la satisfaction (ou non) des clients découvrant un produit. L’API utilisée – Face API – permet aussi de reconnaître des visages. Une technologie mise en oeuvre d’ailleurs sur Video Indexer pour chapitrer automatiquement une vidéo en fonction des prises de parole des intervenants.

Replay

Vers un numérique plus durable et soutenable

Découvrez la proposition de Microsoft pour un numérique soutenable et durable traduite en 21 actions.

Visionner le replay

Les développeurs de leur côté ont d’ores et déjà la possibilité d’exploiter de manière avancée ces services cognitifs. Comme Aleksander Callebat le démontre, une vingtaine de lignes de code suffisent pour transformer une image en un fichier .csv qui décrit l’ensemble des attributs (objets reconnus, dominante de couleur…). Surtout, les outils aujourd’hui disponibles comme Azure Machine Learning Studio permettent aux développeurs d’entrainer leurs propres modèles. Avec suffisamment de précision pour, au final, réussir à distinguer un chihuahua d’un muffin (regardez la vidéo ci-dessous pour comprendre…) ou, plus sérieusement, un tableau original d’une reproduction.

L’évolution des algorithmes permet d’aller plus loin encore, notamment avec le recours aux Generative Algorithm Networks (GAN) qui ne se contentent plus de reconnaître des images mais se montrent capables de les produire. Avec des applications très concrètes à la clé comme l’ajout de lunettes à un visage. C’est d’ailleurs ces GAN qui ont été exploités dans le cadre du projet Rembrandt pour produire une peinture que l’artiste… n’a jamais créée.

Le métavers au service de l’industrie

L’adaptive learning change les codes de l’apprentissage

Data Management: tout ce qu’il faut savoir

Comment l’IA donne des yeux aux machines

Vers un numérique plus durable et soutenable

Regardez le Talk « Donner des yeux aux machines » (24’00)

Découvrez le projet Rembrandt (0’36)

A la une