AI : des data lakes aux océans rouges.

AI : des data lakes aux océans rouges.

Qu’est-ce qu’une intelligence artificielle ?

La meilleure réponse, c’est Julien Lévy qui nous la donne dans cet interview sur le blog d’Adwise : « Ce ne sont que des algorithmes » ; et de préciser : « Le plus fascinant est que la machine produit des réponses intelligentes sans être intelligente ».

Il y a un aspect magique dans l’intelligence artificielle : un peu comme un super cerveau, capable de digérer tout et n’importe quoi pour restituer quelque-chose de pertinent et intelligible.

Moyennant quoi, on oublie de se poser la double question : un, de la qualité des données injectées dans la machine ; deux, des algorithmes mis en œuvre … et surtout de l’intelligence même de … ceux qui les ont écrits.

On oublie qu’à côté de la machine, pour la faire tourner, il y a des hommes !

Il suffit de se confronter aux AI qui tournent aujourd’hui sur de nombreux sites et applis sous forme de bots censés répondre aux questions des internautes et autres mobinautes : pourquoi ça coince si souvent, dès que le problème posé devient un peu complexe ?

Peut-être parce que comme l’AI est la mode, qualifie-t-on d’AI n’importe quel agencement d’algorithmes mal ficelés – c’est juste une métaphore …

Surtout, on devrait se poser un peu plus souvent la question de ce avec quoi on nourrit la machine ; une autre métaphore : quand on remplit un fourneau de bois pourri, on obtient beaucoup de fumée, mais rarement une bonne chaleur.

L’erreur est de croire que la machine sera capable de créer de la valeur avec tout et n’importe quoi et l’on oublie le vieil adage « garbage in – garbage out » : comment espérer obtenir des résultats réellement pertinents à partir de données qui ne le sont pas ?

« La machine apprend toute seul » : et de citer AlphaGo Zero, qui a battu AlphaGo qui a elle-même battu le champion du monde humain du jeu de go. Ce faisant, on oublie que les seules données sur lesquelles a travaillé la machine étaient des parties de go, certaines créées par elle-même.

En marketing, on est dans la « vraie vie », et les données peuvent provenir d’un peu partout : traces laissées sur le Web – partiellement car de nombreux internautes effacent les cookies ou naviguent en mode privé – ou géolocalisation de smartphones, discussions diverses avec un SAV, etc.

La machine va devoir gérer des « trous » et surtout des données aberrantes.

Quand il s’agit de conseiller en SAV ou en avant-vente un client, les AI les plus performantes – mais pas toutes, peu s’en faut ! – surmontent ces difficultés parce qu’on se situe dans un contexte clairement délimité … et en cas de problème, on peut toujours basculer sur un opérateur humain.

Quand il s’agit de la kyrielle de données enfouies au sein d’un data lake, ça se complique singulièrement : de la réponse à une demande spécifique, on passe à la gestion plus ou moins globale d’actions marketing, où la machine va prendre des décisions hors de tout réel contrôle – au début, on fera attention …

Les aberrations, l’AI va généralement les gommer pour rendre ses actions cohérentes : avec la puissance de tir mise en œuvre, les pertes seront négligeables – horrible métaphore !

Ce sont des centaines de machines qui à plus ou moins court terme vont agiter d’aussi nombreux lacs remplis de données souvent bien semblables puisque tout le monde va suivre les mêmes mobinautes et compléter ses données par celles que voudront bien leur vendre quelques brokers.

Les data lakes vont ainsi se déverser … dans les mêmes océans rouges – d’autant plus sûrement que l’on aura gommé les données « bizarres » qui elles seules auraient conduits aux océans bleus : dommage, car demain comme hier, c’est la différence qui créée la discriminance, donc la valeur de l’info…