Künstliche Intelligenz:
Wann wird Europa aufwachen?

Intelligence Artificielle et Assistants Vocaux

Regard croisé avec l’étude

« ITIF 2020»

Il y a déjà 40 ans, Alain Peyrefitte écrivait un livre nommé « Quand la Chine s’éveillera… le monde tremblera » (édition Fayard – 1980). En 2021, la Fondation pour l’innovation et la technologie se pose une question similaire avec des termes plus actuels : « Qui va gagner la course de l’IA : la Chine, l’Europe ou les États Unis ? » (ITIF – 2021)

SIMSOFT INDUSTRY propose son regard sur cette question, pour comprendre si elle est même encore d’actualité, et dont la réponse ne va pas forcément plaire à tous. Le cas précis des assistants vocaux intelligents pour le grand public, puis pour l’industrie, va servir de guide à ce voyage au pays des retards accumulés.

Introduction

L’intelligence artificielle (IA) est aujourd’hui un mot fourre-tout qui fait tout à la fois rêver et qui fait peur. Comme Luc Julia, certains clament haut et fort que l’Intelligence Artificielle n’existe pas (édition First – 2020). D’autres qui sont légion, pensent que l’IA va envahir nos espaces privés et contrôler nos vies du matin au soir. Effectivement, aujourd’hui l’IA est « gratuite » et traite potentiellement de tous les sujets : on oublie un peu vite le prix à payer (Simsoft Industry – 2020) et les performances attendues qui dépendent fortement du sujet traité. Il n’en reste pas moins vrai que l’activité d’une communauté ou d’un pays sur ces domaines technologique est un marqueur de dynamisme en recherche, en investissement et finalement en développement économique.

Pour simplifier et ne pas se perdre dans l’ensemble des applications potentielles de l’intelligence artificielle, le propos du « qui perd gagne » entre la Chine, l’Europe et les États-Unis sera illustré par le prisme des assistants vocaux intelligents.

 

Assistants Vocaux et Intelligence Actificielle ?

Un assistant vocal, aussi appelé « assistant personnel intelligent », est une application logicielle basée sur la reconnaissance vocale du langage naturel et la restitution d’informations par synthèse vocale (Futura Sciences – 2020).

Les assistants vocaux sont devenus une réalité dans notre vie quotidienne avec l’apparition des smartphones, puis des objets connectés du quotidien. L’interaction vocale est perçue comme un complément aux interfaces tactiles des smartphones ou des tablettes, voire une alternative pour des interfaces sans contact.

Au quotidien et malgré des efforts de communication gigantesques des GAFAM et des BATX, les assistants vocaux de nos smartphones et de nos enceintes connectées sont utilisés pour 4 fonctions dans l’ordre (VoiceBot.IA – 2019)

  1. Écouter de la musique (42% quotidiennement)
  2. Demander la météo (40% quotidiennement)
  3. Poser une question (33% quotidiennement)
  4. Lancer un minuteur (24% quotidiennement)

Les autres usages sont anecdotiques… Alors quoi, tout ça pour ça ?

Pour comprendre, il faut aller plus loin dans la compréhension de la relation entre ces assistants vocaux et l’intelligence artificielle dont on parle tant. Il convient également de parler des points fondamentaux de l’adoption et de l’acceptabilité qui sont liés aux cas d’usages proposés.

Dans la définition proposée par Futura Science, deux termes doivent retenir notre attention :

  • Langage naturel: Le traitement du langage naturel est une composante importante et légitime de l’intelligence artificielle. Effectivement, il s’agit de convertir un « texte brut » fourni par un moteur de reconnaissance vocale, en une « intention de l’utilisateur ». Cette intention, une fois comprise et interprétée en fonction du contexte d’emploi, va permettre de réaliser des actions qui répondent de manière efficace aux souhaits de l’utilisateur.
  • Information: Aujourd’hui pour être entrainés, efficaces et rendre de vrais services aux utilisateurs, les assistants vocaux doivent manipuler une grande quantité d’information. Le développement des assistants vocaux est donc intimement lié au développement et à la mise à disposition du « Big Data », branche très active de l’intelligence artificielle aujourd’hui. En conséquence, ils sont systématiquement connectés à internet…

Ces deux termes « langage naturel » et « information » prendront une importance capitale dans la compréhension des avancées des acteurs américains, chinois et européens respectivement.

La seconde question d’importance concerne l’adoption et l’acceptabilité de ces assistants vocaux dans la vie quotidienne de ses utilisateurs. Si on s’arrête aux fonctions principales utilisées, on comprend rapidement que le niveau d’adoption soit faible. Même s’il est intéressant de ne pas oublier son parapluie le matin avant de partir, le réel « engagement de l’utilisateur » avec son assistant vocal reste limité.

Il convient donc de trouver et de développer des cas d’usages qui soient pertinents et acceptables pour les utilisateurs, et qui leur fournissent une réelle valeur ajoutée par rapport à une utilisation classique des interface déjà maitrisées.

A cette question, l’intelligence artificielle ne peut rien… il faut se tourner vers des approches issues de l’ergonomie et des sciences cognitives.

 

Assistants Vocaux: qui sont les acteurs du marché ?

l’on se penche sur le nombre d’assistants vocaux installés, tous terminaux confondus, on dépasse en 2019 le nombre de 2,5 milliards. À ce sujet, les principaux acteurs du marché n’hésitent pas à se livrer à une petite bataille des chiffres (Ó Célia Garcia-Montero, JDN 2020).

Aujourd’hui, les grands acteurs de l’assistance vocale connus du grand public sont les GAFAM : Google, Amazon, Facebook, Apple et Microsoft. Ces acteurs Américains sont incontournables par leur puissance de développement technique et leur pouvoir économique.

A force de ne parler que des GAFAM, on en oublierait presque les BATX qui arrivent rapidement sur nos marchés, Baidu, Alibaba, Tencen, et Xiaomi qui nous arrivent directement de Chine. De son côté, l’assistant vocal de Samsung fait une percée remarquée en Asie et aux États-Unis. A titre de comparaison, en 2020 les assistants vocaux Chinois sont plus déployés dans le monde que celui emblématique d’Apple « Siri », tout comme Bixby de Samsung.

Aujourd’hui, les assistants vocaux Chinois et Coréens sont déjà plus installés que Siri, Alexa et Cortona réunis. Seul Google Assistant résiste avec des performances comparables en termes de nombre de ventes (étude OMdia.com – Virtual Assistant ranking 2020).

 

Il est important de noter que dans cette catégorie d’acteur, pas un Français, pas un Européen ne peuvent être réellement considérés comme compétiteurs…

Pour comprendre cet écart et l’absence de champion Européen, plusieurs facteurs peuvent être mis en avant :

  • Le marché potentiel : Le nombre d’utilisateurs dont les comportements peuvent être cohérents et accessible est définitivement plus étendu en Chine et aux États-Unis, comparativement à l’Europe. Effectivement, l’Europe est caractérisée par une richesse culturelle liée à la variété de ses états membres : cette richesse peut se transformer en contrainte pour le développement de ce type de technologie.
  • La protection des données privées : L’Europe a développé et « imposé » au reste du monde le protocole de protection des données personnelles sous la forme du règlement RGPD. Cette avancée sociétale majeur pour l’indépendance des individus et la maitrise de leur environnement numérique est une force de l’Europe. Cette force se transforme en handicap quand il s’agit de colleter les quantités de données colossales nécessaires à la constitution et au renforcement de solution d’assistance vocale performantes.
  • La quantité de données accessibles : La conséquence des deux premiers points, avec des marchés homogènes de grande taille, et des données collectées avec moins de contraintes, c’est l’émergence d’acteurs géants aux États-Unis et en Chine. Ces acteurs bénéficient de vraies Big-Data collectées auprès de leurs populations sur la base desquelles ils peuvent construire des solutions performantes et opérationnelles. Ces solutions nous sont ensuite imposées à nous Européens qui n’avons pas d’autre choix que d’utiliser des concepts développés par d’autres, avec d’autres habitudes et d’autres règles sociales.

Face à ce constat assez sombre il convient de trouver des solutions de rebond en France et en Europe. Les solutions viendront d’un travail plus avancé sur les usages de ces technologies par la population en Europe, et par le développement de cas d’usages transnationaux qui permettent de retrouver une taille de population critique et les données associées, tout en respectant les règlements Européens.

 

Quelle réponse SIMSOFT INDUSTRY peut-elle apporter ?

A son niveau SIMSOFT INDUSTRY développe une stratégie adaptée à ces contraintes. Focalisée sur le marché industriel (enjeu transnational en Europe) avec un cas d’usage clairement identifié (technicien qui a les mains occupées à sa tâche), l’entreprise propose un assistant vocal intelligent (nommé « Spix ») qui répond à un usage identifié, pour des bénéfices compréhensibles.

Les Spix.SKILLS (services d’Assistance Vocale Intelligents) de SIMSOFT INDUSTRY participent au développement de l’intelligence artificielle en Europe :

  • Ils reposent sur le traitement automatique des langues pour identifier l’intention d’un technicien à partir de son expression orale en langage naturel. C’est une composante importante des travaux de recherche et de développement en intelligence artificielle en Europe à l’heure actuelle.
  • Ils exploitent les données de production ou de maintenance déjà utilisées par les techniciens pour comprendre le contexte de la requête. L’analyse de données massives est un axe de développement très à la mode en Europe actuellement. La spécificité des données industrielles c’est qu’elles ne sont pas toujours « massives » et souvent « confidentielles ».

Si l’on veut résumer ses caractéristiques techniques, l’assistant vocal industriel Spix de SIMSOFT INDUSTRY apporte des réponses issues de l’intelligence artificielle à des contraintes spécifiques du domaine industriel : peu de données, une exigence de fiabilité, fonctionnel dans le bruit, efficace hors connexion, acceptable comme un outil de travail par les salariés de l’industrie (acceptabilité), adapté aux situations de travail où le technicien doit disposer de ses deux mains (cas d’usage).

Toujours techniquement, cet assistant vocal industriel est capable de dialoguer avec l’ensemble des contenus (les données) déjà validés et utilisés de manière opérationnelle dans l’industrie. On peut facilement imaginer qu’aucun industriel ne va remettre en question ce qu’il a validé dans SAP pour mettre en place un assistant vocal …

L’assistant vocal industriel « Spix » de SIMSOFT INDUSTRY répond à ces impératifs industriels pour mieux maitriser les outils de production, ou les systèmes en maintenance. Effectivement, l’investissement à réaliser dans la mise en place d’un assistant vocal industriel est rentable si l’industriel y gagne des points de productivité ou de rentabilité de ses opérations. L’assistant vocal au service des salariés permet à l’industriel de recueillir plus de données sur l’état de son outil de production, ou d’être mieux informé de l’état d’un système complexe dont ses salariés ont la charge (le bénéfice). L’assistant vocal « Spix » de SIMSOFT INDUSTRY est au service de l’expertise des salariés et leur permet de remonter plus facilement une information de terrain vers les systèmes d’information de l’entreprise.

 

Conclusion

La question posée : Quand l’Europe se réveillera-t-elle ? La réponse de SIMSOFT INDUSTRY sur son segment de marché : quand elle fera le choix de faire émerger des champions, sur des thématiques d’intelligence artificielle pan-européenne, pour des usages et des bénéfices clairement identifiables, dans le respect des règles sociales en vigueur en Europe.

Les outils existent déjà comme Horizon Europe, les EIT (pour l’industrie l’EIT Manufacturing), avec les relais des pôles de compétitivité nationaux : ils constituent une base solide pour assurer le succès de cette stratégie. Faisons le pari audacieux que les conclusions de l’étude de ITIF seront différentes dans 5 ans !

Références :

Contact Presse : André JOLY, andre.joly@simsoft-industry.fr, 05 31 61 85 10 / 06 25 17 27 94

A propos de SIMSOFT INDUSTRY (www.simsoft-industry.com & www.spix.ai)

SIMSOFT INDUSTRY développe le premier Assistant Vocal Intelligent 100% dédié aux techniciens de l’Industrie 5.0. L’assistant vocal intelligent Chez les aras de Spix, les relations avec leur milieu sont basées sur l’apprentissage et la transmission.

„>SPIX est opérationnel dans des conditions d’utilisation industrielles. Le programme « Spixify Your Industry » de SIMSOFT INDUSTRY replace les hommes et les femmes au cœur de la production industrielle avec des assistants spécialisés dans le guidage par la voix des opérateurs, le relevé de mesure, le contrôle qualité, et dans la structuration à chaud de leurs retours d’expérience.

Chez les aras de Spix, les relations avec leur milieu sont basées sur l’apprentissage et la transmission.

„>SPIX est une marque et un modèle déposé de SIMSOFT INDUSTRY (INPI Ref : 19 4 528 622 et 19 4 528 627)