Blog
Retour aux articlesQuel avenir pour les enceintes intelligentes ?
Partager
Catégories
Quel avenir pour les enceintes intelligentes ?
Google Home passera-t-il le cap de l’engouement éphémère des innovations de rupture ?
Par la grâce de Google, les enceintes intelligentes débarquent dans les foyers français. Le fameux petit Google Home aura certainement fait le bonheur de quelques milliers de early adopters à Noël. Passera-t-il le cap de l’engouement éphémère propre aux gadgets électroniques ou bien saura-t-il perdurer et s’ancrer durablement dans les usages digitaux qui n’en finissent pas de se démultiplier ? Et, au délà, de cette question, y aura-t-il un parti à en tirer pour les entreprises BtoC, BtoB et les autres aussi ? En somme, quelles promesses portent ces petits appareil ingénieux ?
Loin des chiffres, je positionnerai mon opinion sur le plan de l’utilité et des usages. Que peut-on vraiment faire avec ces appareils (Google Home, Echo d’Amazon, le Homepod d’Apple, et d’autres à venir encore) ? Pourra-t-on, en termes économiques en tirer de véritables bénéfices ?
Une révolution des interfaces
Pour le spécialiste UX que je suis, les enceintes intelligentes, mais surtout le logiciel qui est à l’intérieur, représentent un bond dans les usages tel qu’on l’a vu avec l’apparition de l’iPhone. C’est donc surtout cette nouvelle capacité à interagir avec les machines qu’il faut regarder de plus près.
L’enceinte dite intelligente n’est après tout qu’un haut-parleur doté d’un micro, relié à Internet. Rien de bien révolutionnaire là dedans. C’est le logiciel qui est au bout (dans le cloud) qui change tout. Je parlerai “d’agent conversationnel” : un programme capable d’interagir avec un être humain en utilisant le langage parlé (ou écrit) tout comme lui. Et ce, de manière dite “naturelle”. On peut donc parler, véritablement, à ces enceintes, et surtout, la différence est d’importance, dialoguer avec elles. Dialoguer veut dire qu’il est possible, avec de telles interfaces, d’avoir une conversation au cours de laquelle des informations peuvent être mémorisées par la machine et exploitées pour fournir un résultat.
On peut désormais dialoguer avec notre propre langage avec les machines. Et ça marche !
Par exemple, avec le “bot” de Oui.sncf, intégré à Google Home (voir mon interview de sa conceptrice à ce sujet), il est possible de demander un horaire de train comme si on s’adressait à un guichetier derrière sa vitre (le charme du guichetier en moins). Peu importe la manière dont vous formuliez votre demande, le bot se chargera de la comprendre en la complétant, si nécessaire, par d’autres questions, jusqu’à arriver à vous proposer un résultat.
C’est assez magique ! Car on est vraiment très loin des serveurs vocaux qui sévissent encore un peu partout. Quand on parle à Google Home, on a presque l’impression de s’adresser à un être vivant.
L’impression de parler à une véritable personne est magique !
Google, tout comme l’a déjà fait Amazon auparavant aux Etats-Unis, est en train d’enrichir les fonctionnalités de son Google Home, de manière à ce qu’à court terme, de plus en plus de services soient accessibles de cette manière. Séphora, Monoprix, La Redoute sont déjà dans le coup. Beaucoup d’autres vont y venir.
Et en effet, ce qu’il faut bien comprendre, c’est que Google Home n’est pas un produit figé, mais un hub destiné à évoluer en permanence et à offrir de plus en plus de services au grand public (sachant que c’est la cible de Google Home, pour l’instant). Plus encore, c’est tout un système auto-aprenant, grâce à l’utilisation de l’IA, dont l’efficacité, la capacité à comprendre des phrases complexes et leurs variantes, ira grandissant (et rapidement) avec le nombre d’utilisateurs et d’appareils présent en France et dans les pays francophones. D’autant que Google Home n’est pas le seul point d’accès à ce hub : tous les smartphones sur Android le sont déjà et on peut prendre le pari que de plus en plus d’objets connectés utiliseront les API offertes par Google pour bénéficier d’une interface vocale. Notre environnement fourmillera dans les années à venir de cette fonctionnalité.
Virtuellement n’importe quel appareil pourra y être connecté : de votre montre à la télé en passant par le frigo, et j’en passe.
Demain, nous parlerons à toutes nos machines
Demain – et c’est déjà presque aujourd’hui – nous parlerons à nos machines. Et la gêne que nous ressentons à le faire aujourd’hui disparaîtra bien vite (surtout chez les plus jeunes générations qui baigneront dans cet environnement).
L’enjeu économique
Il va sans dire que l’enjeu économique qu’il y a derrière les enceintes intelligentes n’est pas anodin. Ne serait seulement par la vente des terminaux eux mêmes qui se chiffrera en milliards de dollars dans les années à venir (c’est déjà le cas pour la version d’Amazon : Echo). De nombreux acteurs vont aller se battre sur ce marché, mais la véritable source de revenus des enceintes intelligentes ne se situent pas, en réalité, à ce niveau là.
Pour les GAFAM et les BATX évidemment, d’abord, il y aura le droit de péage à l’entrée pour utiliser ces services. Déjà riches, ils vont s’enrichir encore plus.
Mais ce ne sont pas eux qui m’intéressent ici, mais les entreprises utilisatrices de leurs services. Quel intérêt y a-t-il à mettre en place des services vocaux à travers des agents conversationnels ? Quels sources de revenus les entreprises vont-elles pouvoir en tirer ? Et tout cela n’est-il qu’un mirage ?
Des sources de revenus potentiels immenses et variées
D’après ce qu’on peut en voir, les sources de revenus sont à la fois immenses et variées. C’est, une nouvelle fois, un vaste monde qui s’ouvrent aux entreprises qui sauront utiliser ces interfaces.
L’extension du domaine de la lutte
Le premier domaine où les interfaces vocales viennent apporter un bénéfice aux entreprises est la possibilité de faire pénétrer au plus profond du foyer familial l’accès à Internet et à tous ses services. Sans téléphone, où que vous soyez chez vous, vous pouvez accéder à des services sur Internet comme demander des renseignements, commander des objets de sa maison, mais aussi acheter en ligne. Ce sont les fonctions principales que permettent déjà Amazon Echo et Google Home (en partenariat avec Wallmart aux Etats-Unis, pour la partie shopping).
L’extension du domaine de la lutte se matérialise par la possibilité de communiquer à distance avec Internet sans être proche d’une interface. Celle-ci peut-être donc située à quelques mètres d’une personne, agrandissant de fait la surface des lieux pouvant donner accès à des services Internet. Le foyer familial est le premier investi par les enceintes intelligentes, mais il y a fort à parier que d’autres lieux, comme les bureaux, les ateliers vont aussi l’être et offrir de nouvelles possibilités d’interagir avec Internet aux collaborateurs des entreprises.
La robotisation de la relation client
Là où les agents conversationnels pourraient radicalement changer la donne, c’est dans la relation client. Les promesses de l’IA sont telles que de nombreux métiers, où il ne s’agit que d’échanger des informations verbales avec les clients, vont être impactés. Du simple service téléphonique de renseignement, à la commande en ligne, des équipes entières de conseillers clientèles vont être remplacées ou supplées par des robots. Prenez un exemple simple : aller faire un tour dans un drive d’un fast-food. Toutes les commandes se font à travers une interface vocale derrière laquelle se trouve (encore) un être humain. A mon avis, il ne devrait pas être difficile de remplacer cet agent humain par une machine tant les échanges entre lui et le client sont cantonnés à un ensemble de questions/réponses extrêmement standardisées. Je serai prêt à mettre ma main au feu que ce système est déjà expérimenté.
Pareil pour un centre d’appel : il est probable qu’une majorité de requête pourrait être traitées par des machines ayant le goût et la couleur d’une voix humaine, quittte à débrayer vers de vrais humains lorsque la requête devient trop spécifique ou trop complexe à traiter.
La simplification des interfaces
Bénéfice évident des interfaces vocales : leur capacité à réduire drastiquement la phase d’apprentissage d’utilisation d’une interface, mais également à simplifier les interactions. Parler est une chose naturelle pour les humains. Pouvoir échanger avec les machines sur ce mode de communication peut simplifier grandement les interactions dans de nombreux cas.
On peut imaginer de nombreux exemples :
- Coupler des interfaces classiques à des interfaces vocales pour des populations peu à l’aise avec un écran, un clavier, ou même débordées par la complexité des fonctionnalités d’une interface. Je pense aux seniors.
- Dans le domaine médical, évidemment, les interface vocales vont pouvoir aider de nombreuses personnes empêchés de se servir de leurs fonctions moteurs essentielles
- Eviter le danger de programmer un GPS en conduisant en donnant simplement à l’oral l’adresse de destination et ce, sans quitter le regard de la route
- Enfin, last but not least, dans tout cadre professionnel où l’exercice d’une tâche nécessite l’emploi des deux mains, un assistant à commande vocal pourra se révéler redoutablement efficace pour commander une machine ou accéder à des données (dans une salle d’opération, un garage automobile, je vous laisse jouer avec votre imagination pour trouver les nombreux exemples qui s’appliquent)
La mise en oeuvre
Les promesses des interfaces vocales, on l’a vu, sont immenses. Pour autant, tout n’est pas encore parfait. Faites le test vous même. En toute honnêteté, la fluidité des dialogues sur le peu de services que j’ai testé sur Google Home n’atteint pas encore un niveau de qualité suffisante pour franchir le seuil de l’adoption massive par le grand public au delà des early adopters.
De plus, si l’on ne s’en tient qu’à la quantité de services offerts par Google Home et à leur utilité, à l’heure actuelle, la probabilité que passé l’effet de curiosité et de surprise, celui-ci risque vite de passer de la cuisine, où il est le plus souvent installé, au grenier où il ira reposer en paix pour l’éternité. Les chiffres de vente d’Amazon Echo démentent cet avenir sombre pour l’instant, mais… méfions-nous en. Ils ne garantissent en rien une adoption massive et rapide des enceintes intelligentes sur le marché français.
Comme toujours, le risque existe que la technologie soit rejetée en masse par précipitation et impréparation
Il y a donc encore un risque à développer un service sur des appareils dont l’adoption n’est pas certaine à court terme. Et cela sans compter la problématique de la sécurisation des données personnelles pour laquelle les français sont beaucoup moins tolérants que les américains.
Tenez également compte que ces technologies sont encore très peu maîtrisées par les développeurs et les équipes UX. D’après les entretiens que j’ai eu avec des précurseurs comme Oui.SNCF ou La Redoute, il n’est pas si simple de créer un agent conversationnel vocal et les embûches et les difficultés sont nombreuses et imprévisibles. C’est normal. Tout le monde est en train d’apprendre.
Malgré cela, j’aurais tendance à dire : “Allez-y, go, foncez !”. Attendre dans un contexte où les choses vont très vite peu très bien vous faire prendre un retard conséquent par rapport à vos concurrents, mais également vous faire rater des opportunités de marché.
Quelques précautions s’imposent
Un projet d’agent conversationnel vocal impose de limiter les risques et de déployer progressivement le service en évitant les écueils classiques des projets innovants.
Bien définir l’utilité du projet
Ne pas céder aux effets de mode, bien sûr, c’est le b-a-ba. Se lancer dans un projet d’agent conversationnel vocal ne doit pas résulter d’une impulsion soudaine, ni d’une envie irrépressible de se faire mousser dans un article de Ecommerce Mag, mais réellement surgir d’une réflexion menée sérieusement et selon une méthodologie qui fera émerger les opportunités probables qui existent au sein de votre entreprise.
Wexperience peut vous y aider en mettant en place des atelier de co-design ou de prototyping, mêlant à la réflexion vos équipes innovation, IT, mais aussi le public cible (qui n’est pas obligatoirement vos clients, mais peut aussi être certains de vos collaborateurs si, par exemple, vous développez une app pour un service interne à votre entreprise). Si la question business peut être abordée au cours de ces ateliers, elle ne doit pas, en revanche, dicter les orientations. Difficile de dire à ce stade si le jeu en vaut la chandelle. Rester dans l’idée d’un POC (Proof of concept) permettra d’écarter ce critère et de ne pas empêtrer les idées dans des considérations trop castratrices lors de la recherche de l’utilité.
Et comme je le disais plus haut, il me semble également important de penser “out et in of the box”. Créer un service via un agent conversationnel vocal peut ne pas s’adresser uniquement à vos clients. D’autres domaines, internes à l’entreprise doivent aussi être pris en considération.
Une chose est sûre : vous devez parfaitement bien répondre à deux questions.
- Mon service répond-il vraiment à un besoin exprimé ou supposé de mes utilisateurs ?
- Une interface vocale apportera-t-elle vraiment quelque chose en plus à ce besoin ? Amélioration de son utilisabilité, sous-entendu gain de productivité ? Capacité à soulager une population d’utilisateurs de tâches récurrentes et astreignantes ? Etc
Définir un scenario simple
Ne cherchez pas à faire de révolution. Cantonnez votre premier essai à une fonctionnalité simple. LaRedoute a mis en place un système de suivi des commandes. Oui.sncf permet de consulter des horaires de train. Sephora de prendre rendez-vous avec une esthéticienne. N’essayez pas de tout faire faire à votre agent. Testez une fonctionnalité simple. Elle vous donnera suffisamment de fil à retordre dans un premier temps.
Testez
Les surprises que réservent l’intelligence artificielle sont innombrables. Créer un dialogue avec un être humain s’avère beaucoup plus compliqué qu’il ne le parait à première vue. On ne sait jamais à quoi s’attendre avec eux et mieux vaut éprouver son service auprès de vraies personnes plutôt que de compter sur votre intuition personnelle et l’avis de vos développeurs.
En tant qu’agence UX, nous ne pouvons que vous conseiller de mettre en place des tests utilisateurs tout au long du processus de création de votre service afin de l’améliorer en permanence. N’espérez pas qu’il apprenne à s’améliorer tout seul, c’est faux. C’est vous qui devrez prendre en compte les réactions de vos utilisateurs pour les intégrer à votre projet. Par exemple, savez-vous pourquoi le bot de Oui.sncf ne donne que deux horaires à la fois ? Parce que les tests utilisateurs menés en interne ont montré que les utilisateurs finaux n’étaient pas capables d’en retenir plus. Mieux vaut s’adapter à eux que d’attendre que leur mémoire s’améliore.
Vous ne saurez jamais à quoi vous attendre avec un être humain.
Vous ne saurez jamais à quoi vous attendre avec un être humain. Alors tester, selon un protocole de test classique, tel que nous le pratiquons tous les jours chez Wexperience, reste la meilleure manière de corriger et de faire progresser votre agent conversationnel. Et si vous n’êtes pas un pratiquant avéré des tests utilisateurs, ne voyez pas cela comme une perte de temps. C’est tout le contraire ! Plus votre agent conversationnel aura été éprouvé par des vrais humains, plus vous améliorerez ses chances d’être adopté par vos vrais utilisateurs finaux. Alors, ne cédez pas aux sirènes du “je le ferai moi même” ou du “pas besoin de tester, on sait ce qui est bon pour nos utilisateurs” : testez !
Collaborez avec vos utilisateurs finaux
Il est rare, très rare qu’un produit innovant fasse rapidement l’unanimité et réjouissent d’emblée la grande masse des utilisateurs cibles de ce produit. Steve Jobs avait un don pour y parvenir, mais c’était Steve Jobs. En réalité, dans un domaine comme celui des agents conversationnels vocaux, la prudence est de mise et la communication avec vos premiers utilisateurs primordiale.
Quelque soit la cible, prévenez-les de la nature du service que vous allez leur offrir. Prévenez-les de sa probable imperfection, des erreurs qui pourraient arriver, de vos efforts permanents en cours pour l’améliorer. Ils comprendront. Et c’est d’ailleurs pour cela que cette première cible d’utilisateurs devrait être restreinte. Ne prenez pas le risque d’un rejet massif. Mieux vaut aquérir l’approbation et la confiance d’une première population d’ambassadeurs que de vous retrouver la risée des réseaux sociaux et, par extension, de vos collègues, voire (pire) n+1, +2, etc si vous voyez ce que je veux dire 🙂
Maîtrisez l’enjeu technique
Développer un agent conversationnel n’est pas le plus compliqué. Pour que son utilité soit réel, encore faut-il qu’il puisse échanger avec le SI de l’entreprise. Ce point là est particulièrement freinant pour l’aboutissement d’un projet et consituera un point prépondérant dans la prise de décision quand au service à mettre en oeuvre. Oui.sncf a fait le choix de ne donner que les horaires à travers son bot, ça n’est pas pour rien. Aller jusqu’à la prise de commande entraînait une complexité qui allait bien au delà du domaine de l’expérimentation. Aussi, ne vous faites pas d’illusion : développer un agent conversationnel avec une réelle utilité auprès d’un vrai public nécessitera quelque soit le projet des mois d’expérimentations sur un périmètre limité. Ce n’est que par la validation d’un POC qu’il faudra alors savoir se lancer dans l’aventure d’un bot à grande échelle.
Faites appel à Wexperience
Si la création d’un agent conversationnel vous titille, soyez bien accompagné, tant au niveau technique qu’au niveau conception. Dans ce domaine précoce de l’expérience utilisateur, le besoin d’une agence expérimentée comme la notre est indispensable à la fois pour déterminer l’utilité du projet, mettre en place la récolte des données nécessaires à la construction de l’agent, mais également pour conduire les tests qui découlent du besoin impérieux de faciliter l’onboarding des premiers utilisateurs. Pour la partie technologique, nous sommes accompagné par un spécialiste expérimenté de la mise en oeuvre des API d’intelligence artificielle et de langage naturel.