Loin de se limiter à la stricte surveillance, la vision par ordinateur est la nouvelle fondation de nombreux cas d’usage concrets de l’intelligence artificielle. Tour d’horizon.
Elle observe. Mais pas seulement. La vision artificielle, ce n’est pas une simple caméra de surveillance. C’est une nouvelle fondation pour des scénarios avancés d’intelligence artificielle. Sur cette fondation repose une couche d’analyse qui va donner à l’ensemble de l’édifice un remarquable potentiel business. Comment ? En replaçant l’observation dans un contexte enrichi qui va permettre d’en extraire toute la valeur.
Identifier n’est pas comprendre
Tout d’abord, il est important de rappeler que l’intelligence artificielle n’est pas un simple processus IFTTT (If This Then That). Avec la bonne résolution d’image et la bonne technologie d’analyse, il est plutôt simple aujourd’hui de distinguer à l’aide d’une caméra une bonne pièce d’une mauvaise sur une chaîne de production. Il n’est pas non plus très complexe d’effectuer une recherche de manière rétroactive dans une vidéo avec des outils qui vont classifier les objets. Par exemple : « montre-moi toutes les personnes avec un t-shirt rouge dans cette zone entre 13h et 13h15 mercredi dernier ». Ou encore : « montre-moi toutes les voitures roses qui ont tourné à gauche à cette intersection aujourd’hui ». Ces exemples sont basés sur des scénarios très prévisibles, des contextes prédéfinis et des objets aisément reconnaissables pour lesquels les modèles sont faciles à entraîner. La véritable promesse de l’IA est de conduire un véritable raisonnement basé sur la compréhension d’un contexte. En d’autres termes, c’est faire preuve de discernement dans une situation réelle, avec une multitude de facteurs et une multitude de résultats possibles.
Remettre la donnée dans son contexte
Mener un raisonnement basé sur le contexte est donc plus complexe. Si un algorithme détecte une personne abandonnant un bagage au milieu d’un magasin, comment savoir s’il s’agit d’un acte malintentionné ou d’un simple oubli ? Pour éviter les faux positifs et les jugements trop hâtifs, il faut élargir le champ de vision. Le propriétaire du sac a-t-il un casier judiciaire ? Est-ce un client régulier du magasin ? En corrélant en temps réel les images captées avec les informations présentes dans une ou plusieurs bases de données, il devient réellement possible d’éviter un problème avant qu’il ne se produise. Le vrai pouvoir de l’IA est ici : déclencher des actions en temps réel dans une grande diversité de contextes. C’est un système de systèmes et une intelligence en réseau combinant des données en provenance d’objets connectés et d’autres issues de bases de données (ERP, CRM, RSE…). Et c’est notamment ce que propose aujourd’hui Dell avec ses solutions IoT de surveillance et de sécurité. Une technologie comme Dell Boomi peut ici être très utile pour réaliser la fusion des données.
La caméra n’est que le point de départ d’un scénario de vision artificielle.
Un nouveau regard sur vos clients
Mais qualifier automatiquement une personne dans un magasin peut avoir d’autres intérêts que celui de la sécurité. Et si la personne qui venait de passer la porte était un de vos plus gros clients ? Il pourrait être intéressant de lui dérouler le tapis rouge. Aujourd’hui, un commerçant qui exploite efficacement la vision artificielle sait que vous avez hésité pendant 46 secondes devant des cookies en promotion avant de finalement vous rendre dans le rayon des surgelés pour jeter votre dévolu sur une glace, qui elle était pourtant au prix fort. Et ce pour la troisième fois de la semaine. Cela peut évidemment sembler effrayent mais c’est bien le niveau de précision qu’il est possible d’obtenir dans l’analyse du comportement client.
Les questions de respect de la vie privée et de confidentialité des données à caractère personnel sont bien entendu au cœur de ces innovations marketing. Mais il s’avère que les utilisateurs consentent volontiers à fournir quelques informations sur leurs habitudes, pour autant qu’ils en tirent une valeur suffisante. Il y a dix ans, personne n’aurait probablement accepté de se déplacer avec un tracker GPS dans la poche en permanence. Et c’est pourtant bien ce qui se passe actuellement, alors qu’une application mobile comme Waze compte 100 millions d’utilisateurs actifs chaque mois. Qui aurait imaginé il y a quelques années installer dans son salon des micros connectés à internet ? Aujourd’hui, on appelle cela des assistants personnels. Tout est une question de valeur ajoutée. Il y a donc fort à parier que si au moment d’entrer dans un magasin, le client se voit remettre un coupon de réduction personnalisé pour cette fameuse glace qu’il a acheté la semaine d’avant, la possibilité de faire des économies génère plus de satisfaction que d’interrogations.
Sur les traces des espèces menacées
La vision artificielle peut évidemment se rendre utile dans un cadre moins mercantile. Notre partenaire SAS par exemple, dans le cadre de son programme « Data for Good », collabore avec WildTrack, une organisation à but non lucratif qui utilise des techniques non invasives pour surveiller et protéger les espèces animales en danger. Avec l’aide de la technologie SAS, déployée sur des serveurs Dell PowerEdge, WildTrack collecte et analyse des images d’empreintes pour améliorer son travail de préservation. Le logiciel SAS est en mesure d’identifier un animal particulier, sa race, son sexe et son âge, grâce à son empreinte. Via un modèle statistique, WildTrack obtient ensuite des informations précieuses sur la densité, la localisation et le comportement de ces espèces. Les chercheurs de l’organisation utilisent également des ordinateurs portables Latitude durcis pour travailler directement sur les terres de Namibie. Avec suffisamment de données, l’intelligence artificielle de SAS peut être entraînée pour suivre une empreinte, à la manière d’un pisteur africain traditionnel, mais à une échelle beaucoup plus vaste. WildTrack a déjà développé des algorithmes pour surveiller les tigres de Sibérie et les pandas géants en Chine, les rhinocéros noirs en Namibie ou les pumas en Amérique. Et le partenariat avec SAS n’en est qu’à ses début.
Du DVR au temps réel
Pour être tout à fait honnête, la vision artificielle n’est pas nouvelle, comme de nombreux cas d’usage aujourd’hui labellisés « IoT » ou « IA » existaient en réalité déjà. Toutefois, nous arrivons à un point d’inflexion ou les progrès de la technologie rencontrent la croissance de la demande. Dans le cas de la vision, on peut notamment évoquer les avancées comme les interfaces en « glisser-déposer », qui permettent d’entraîner des modèles d’IA aussi facilement que de publier du contenu sur Pinterest, ou encore la puissance de calcul des GPUs et FPGAs, qui accélèrent de façon considérable les travaux d’analyse.
Malgré tout, il est vrai qu’environ 90 % des systèmes de surveillance aujourd’hui sont au mieux des enregistreur numériques (DVR) avec un niveau d’analyse qui se limite à la recherche rétroactive et contextuel dans des archives après un événement comme un crime. Vous avez probablement déjà vu dans des films des agents de sécurité installés devant un mur d’écrans noir et blanc. C’était une réalité pendant de nombreuses années. Aujourd’hui, il n’est plus nécessaire de laisser une personne devant un écran pendant des heures en espérant repérer un événement en temps réel. Un système avancé de vision artificielle sera non seulement plus efficace, mais permettra en plus de créer de nouveaux leviers commerciaux.