C’est une petite révolution qui n’en a pas l’air. Le Computer Science du MIT ainsi que l’Artificial Intelligence Laboratory ont créé un algorithme qui utilise l’apprentissage en profondeur qui permet à l’intelligence artificielle d’utiliser les modes d’interaction humaine pour prédire ce qui va arriver.
Les chercheurs ont nourri le programme avec des vidéos mettant en vedette des interactions sociales humaines et testées pour voir si l’intelligence artificielle a «appris» assez bien pour être en mesure de les prévoir.
Les armes des chercheurs ? 600 heures de vidéos Youtube sur des sitcoms, de The Office à Desperate Housewives en passant par Scrubs.
« Nous voulions simplement utiliser des vidéos au hasard à partir de YouTube », a déclaré un chercheur. « La raison pour laquelle nous avons choisi la télévision est qu’il est facile pour nous d’obtenir l’accès à ces données. »
Ils ont intégré les vidéos à l’ordinateur en distinguant quatre actions: les étreintes, les baisers, le « high-fiving » et le « handshaking ». L’Intelligence Artificielle a pu deviner correctement 43% du temps par rapport à l’homme, qui a eu raison 71% du temps.
Donner à l’Intelligence Artificielle la capacité de comprendre visuellement les humains pourrait être révolutionnaire dans l’univers par exemple des assistants à domicile ainsi que des caméras de sécurité intelligentes qui pourraient appeler une ambulance ou la police à l’avance.
C’est la première tentative de prédiction vidéo, nous n’en sommes donc qu’à la naissance de ce nouveau monde, effrayant pour les uns, fascinant pour les autres…