Etude – La révolution naissante des assistants vocaux

16 à 20 millions de Français utilisent des assistants vocaux, de façon occasionnelle ou régulière. Les assistants vocaux pourraient représenter jusqu’à 30% de la navigation web dès l’an prochain, et d’ici à 2021, la planète devrait compter plus d’as­sistants conversationnels que d’humains. Le niveau d’adoption du vocal par les entreprises diffère selon le secteur économique et l’urgence de se positionner sur ce canal. Trois modèles semblent émerger : développement propre, coopétition ou alliance avec un GAFAM.

Les assistants vocaux se diffusent progressivement dans la société. Les particuliers s’y convertissent et l’intègrent dans leur quotidien, par les smartphones, le véhicule ou la domotique, tandis que les entreprises se lancent prudemment dans des stratégies d’adoption. Qu’il s’agisse de la sphère privée ou du domaine professionnel, les assistants vocaux redéfinissent le langage et donc la manière de communiquer. Le vocal touchera chaque aspect du modèle économique des entreprises et notamment la relation client. Les acteurs doivent dès à présent réfléchir aux opportunités qu’emporte ce nouveau paradigme. Ce tout nouvel horizon va profondément changer notre relation aux machines et influer sur nos comportements.

Pour comprendre les enjeux que représentent les assistants vocaux, Roland Berger, cabinet de conseil en stratégie auprès des Directions générales, et Viseo, société de conseil et de services numériques, ont uni leurs équipes pour analyser le marché actuel, anticiper les évolutions et évaluer les freins existants à l’adoption du vocal dans les années à venir. Lire l’étude en entier.

Le vocal : une technologie au fort potentiel

francais assistants vocaux

Extrait de l’étude « La révolution naissante des assistants vocaux » de Roland Berger et VISEO

En France, les assistants vocaux ont pénétré le mar­ché dès 2012, avec l’arrivée de Siri. Aujourd’hui, la moitié des propriétaires de smart­phones utilise ou a déjà utilisé un assistant vocal, soit entre 16 et 20 millions de personnes. Mais la prise de conscience par le grand public de l’arrivée de la « voix » technologique » s’est faite au moment de la commercialisation des enceintes connectées dotées d’un assistant vocal par Amazon, Google et Apple.

La maturité du marché n’est pas la même en France qu’aux Etats-Unis, où un foyer sur quatre est équipé d’au moins une enceinte vocale. Dans l’Hexagone, ces appareils touchent 1,7 million d’utilisateurs, avec 600 000 unités vendues au cours de l’année 2018.

À l’échelle mondiale, la tendance va s’accélérer avec une croissance annuelle de 25% jusqu’en 2023, pour in fine 8 milliards d’assistants vocaux en circulation dans cinq ans.

Les limites de l’écosystème vocal

Les usages des assistants vocaux sont pour l’instant as­sez limités et génèrent des frustrations chez les utilisateurs. Néanmoins, cette immaturité technologique devrait rapidement s’effacer. La massification du recours aux assistants alimentera les algorithmes – analyse des voix et des intentions des utilisateurs – pour mieux répondre à terme aux attentes des usagers grâce à une clari­fication de la proposition de valeur des assistants vocaux, de la pertinence des interactions et de la diversification des services apportés.

Les préoccupations autour de la protection des données comme de la transparence des informations poussées sont exprimées en France avec force et figurent parmi les principaux freins à l’adoption des technologies vocales. Les particuliers et les entreprises craignent des détourne­ments et des abus dans l’utilisation de leurs données, de l’intrusion dans la sphère intime du consommateur à l’espionnage industriel. Cet obstacle ne pourra être levé qu’à la condition de fournir des garanties fortes de la part des fabricants.

Pour définir le niveau d’investissement adéquat, la question de l’indépendance technologique et de la maîtrise des données se pose avec acuité pour les marques, qui doivent choisir entre l’internalisation ou la collaboration avec les plateformes.

Le vocal marque l’avènement d’une nouvelle ère numérique. La singularité de son approche et la réponse unique contrastent avec les usages actuels, notamment ceux du web et de la suggestion infinie. Il est probable que, comme pour les autres canaux, le vocal ne se suffise pas à lui-même et trouve toute sa valeur dans une coopération avec le visuel. Cette solution mixte pourrait davantage séduire les entreprises et les utilisateurs individuels.