Comment fonctionne Alexa : explications

Amazon Alexa est un assistant qui se trouve dans le cloud et qui fonctionne avec de nombreux appareils connectés. Ici, je vous explique brièvement comment Alexa fonctionne, en abordant les aspects tels que sa structure, comment elle écoute et répond aux commandes vocales. Vous pourrez ainsi profiter au mieux de votre expérience avec cet assistant vocal.

Vous comprendrez comment Alexa traite et interagit avec les commandes vocales.

Comment fonctionne Alexa
Comment fonctionne Alexa

Comment fonctionne Alexa : vue d’ensemble

Les éléments de base d’Alexa, du point de vue de l’utilisateur, sont un compte Amazon et un appareil compatible avec Alexa connecté à Internet, généralement une enceinte ou un écran connecté.

Le compte vous permet de créer un profil, d’enregistrer les paramètres logiciels et matériels et de connecter des appareils, services et accessoires compatibles.

Les appareils Alexa écoutent les commandes vocales, les envoient aux serveurs d’Amazon pour traitement, puis fournissent les résultats sous forme de contenu audio, vidéo ou de déclencheurs d’appareils/accessoires.

Toutes les commandes vocales commencent par un mot d’éveil qui indique à l’appareil d’écouter. Le mot d’activation par défaut est évidemment « Alexa », mais vous pouvez le modifier avec l’application pour Android ou iPhone/iPad : « Amazon », « Ordinateur », « Echo » ou « Ziggy ».

En réalité, l’application Alexa est un troisième élément de base, car elle est généralement nécessaire pour l’installation des appareils et la connexion avec votre compte Amazon.

Vous pouvez utiliser de nombreuses commandes Alexa pour de nombreuses choses, telles que des questions de connaissances, des informations ou le contrôle des objets connectés dans la maison.

Par exemple :

  • « Alexa, quel temps fait-il dehors ? »
  • « Alexa, joue la meilleure playlist de jazz sur Spotify. »
  • « Alexa, règle le thermostat du salon à 21 degrés. »
  • « Alexa, à quelle distance se trouve l’étoile la plus proche ? »

Certaines fonctions nécessitent d’activer des « compétences » (qu’on appelle skills), que ce soit au travers du site Internet d’Amazon ou avec l’application Alexa. Par exemple, la commande liée à la musique ne fonctionnera pas sans un skill lié au compte Spotify, et le contrôle du thermostat nécessitera un skill de la marque appropriée, comme Ecobee ou Google Nest.

La plupart des skills sont gratuits car ils permettent d’utiliser des produits et services existants. Les skills payants sont rares, mais ils existent.

L’application Alexa permet également de créer des routines, qui sont des automatisations personnalisées. Elles sont déclenchées par des commandes vocales ou diverses conditions, telles que la localisation, le statut de l’accessoire ou l’heure de la journée.

Une routine “Bonjour” pourrait, par exemple, automatiquement allumer les lumières, diffuser la radio France Info, faire démarrer la cafetière à l’aide d’une prise connectée. Pour faire tout ça, il vous suffit de dire « Alexa, ma journée commence. »

Pour être contrôlés par Alexa, les accessoires d’une maison connectée doivent être compatibles avec la plateforme Alexa ou le standard de connectivité universel Matter.

Presque tous les types d’accessoires sont disponibles :

  • les prises connectées ;
  • les thermostats intelligents ;
  • les ampoules connectées ;
  • les purificateurs d’air ;
  • et même les aspirateurs-robots.

Ces accessoires sont appairés à l’aide de l’application Alexa, quelle que soit la manière avec laquelle ils sont connectés (les skills, le Wi-Fi, Thread et/ou Zigbee).

Comment fait Alexa pour nous écouter ?

Tous les appareils équipés d’Alexa ont au moins un microphone, et souvent deux ou plus sur les enceintes et écrans connectés. Cela permet d’isoler les voix du bruit ambiant en créant des données directionnelles qui peuvent être comparées et filtrées grâce à des algorithmes de traitement du signal.

Mais il y a des limites : il ne faut pas s’attendre à ce qu’une enceinte Echo vous comprenne si vous êtes à côté d’une télévision ou d’un lave-vaisselle bruyant.

Contrairement aux idées reçues, Alexa n’enregistre pas en continu tout ce que vous dites. Alexa est constamment à l’écoute du mot d’éveil et des sons audio qui suivent (et cela se termine quand vous cessez de parler). L’enregistrement des sons est généralement envoyé à Amazon pour interprétation. Amazon a expérimenté le traitement hors ligne sur des appareils comme l’Echo de 4e génération ou l’Echo Show 10, équipés d’un processeur plus puissant. Cependant, cette idée semble avoir été abandonnée (nous n’en connaissons pas la raison).

Amazon affirme crypter les enregistrements audio envoyés, mais les conserve par défaut et analyse un « très petit échantillon » d’extraits anonymisés pour améliorer les performances d’Alexa.

Des enregistrements ont été utilisés dans des affaires judiciaires et certains sons ou phrases peuvent être mal interprétés comme des mots d’éveil. Si vous êtes soucieux de votre vie privée, vous devrez désactiver l’enregistrement ou supprimer régulièrement votre historique vocal. Je vous recommande la lecture de ce guide sur la confidentialité pour une maison connectée.

Comment Alexa fait pour répondre ?

Alexa dépend principalement du cloud pour traiter les commandes en raison de la complexité du traitement du langage naturel. Chaque commande est analysée en unités de phonèmes qui sont ensuite comparées à une base de données pour déterminer les mots les plus appropriés. Le logiciel doit ensuite identifier la structure des phrases et les termes propres à différents sous-systèmes.

Alexa est aussi capable de reconnaître différents accents et dialectes grâce à des bases de données spécifiques pour chaque langue et variation régionale. Il est nécessaire pour les utilisateurs de sélectionner la langue appropriée dans l’application Alexa. Par exemple, une enceinte Echo utilisée en France ne comprendra pas l’allemand (par défaut).

L’apprentissage automatique est essentiel pour aider Alexa à mieux deviner les intentions de l’utilisateur en se basant sur le contexte et l’historique des commandes. Voici quelques exemples de tâches que vous pouvez demander à Alexa de réaliser :

  • Skills : utilisez des skills pour ajouter des fonctionnalités à votre appareil.
  • Météo : obtenez des informations météorologiques en temps réel.
  • Musique : demandez à Alexa de jouer de la musique à partir de services tels que Spotify.
  • Sports : recevez les scores et des informations sur les événements sportifs.
  • Listes : créez et gérez des listes de courses ou de tâches.
  • Routines : configurez des séquences d’actions personnalisées.
  • Télécommunication : passez des appels et envoyez des messages à d’autres utilisateurs d’Alexa.
  • Services de proximité : trouvez des restaurants et des commerces à proximité.
  • D’autres services incluent la réservation de trajets Uber, la consultation de la circulation, la lecture de livres Kindle, et la possibilité de commander des produits en ligne.

En exploitant ces vastes données, Alexa continue d’évoluer et de s’améliorer avec le temps pour vous offrir une expérience utilisateur optimale.

Je vais maintenant vous communiquer des informations plus poussées sur le fonctionnement technique d’Alexa (ça peut vous intéresser).

La technologie qui fait fonctionner Alexa

Alexa Voice Service

Après avoir reçu vos instructions, l’appareil équipé d’Alexa les envoie à un service basé dans le cloud appelé Alexa Voice Service (AVS). Considérez l’AVS comme le cerveau des appareils compatibles Alexa, effectuant toutes les opérations complexes telles que la reconnaissance automatique de la parole (ASR ou Automatic Speech Recognition) et la compréhension du langage naturel (NLU ou Natural Language Understanding).

L’AVS identifie l’intention de l’utilisateur, puis effectue une demande de service Web au serveur tiers si nécessaire. Grâce à cette technologie, vous pouvez utiliser Alexa pour diverses tâches telles que connaître la météo, les actualités, écouter de la musique sur Spotify, suivre les résultats sportifs, les mises à jour des actualités, commander des produits, écouter des stations de radio, réserver un Uber et augmenter votre productivité. Les membres Amazon Prime bénéficient également d’avantages supplémentaires avec Alexa.

Le TALN dans la technologie qui fait fonctionner Alexa ?

Le traitement automatique du langage naturel (TALN) est une convergence entre l’intelligence artificielle et la linguistique computationnelle qui permet aux machines d’interagir avec les langages naturels des humains. Grâce à cette technologie, les machines peuvent communiquer en utilisant le langage naturel sous différentes formes, telles que la parole ou l’écriture.

Comprendre le langage humain est une tâche complexe en raison de sa diversité :

  • nombre infini de façons d’organiser les mots dans une phrase ;
  • mots ayant plusieurs sens ;
  • nécessité d’informations contextuelles pour interpréter les phrases correctement.

Lorsque le système reçoit une entrée en langage naturel, il convertit celle-ci en langage artificiel, comme la reconnaissance vocale. Ainsi, les données sont transformées en une forme textuelle que le module de compréhension du langage naturel (NLU, mentionné ci-dessus) traite pour en saisir la signification.

Voici quelques éléments clés du TALN :

  • Intelligence artificielle : permet aux machines d’apprendre et d’évoluer pour mieux interagir avec le langage humain.
  • Commandes vocales : facilitent l’interaction avec les assistants virtuels et d’autres dispositifs activés par la voix.
  • Mot d’activation : sert à réveiller un assistant virtuel pour qu’il commence à écouter et répondre aux commandes.
  • Apprentissage automatique : permet d’entraîner des systèmes pour qu’ils comprennent et communiquent en utilisant des langues naturelles.

En résumé, le TALN permet aux machines et aux assistants virtuels d’interagir avec les utilisateurs de manière naturelle et contextuelle, ce qui améliore la communication entre les humains et la technologie.

A partir de là, la technologie devient bien plus complexe à comprendre et expliquer (et dépasse l’objectif de cet article).

Questions fréquentes sur le fonctionnement d’Alexa

Est-ce qu’Alexa écoute tout ce que je dis ?

Alexa n’enregistre pas tout ce qu’elle entend. Elle écoute constamment le mot d’éveil, mais n’enregistre votre voix que lorsqu’elle détecte ce mot et cesse d’enregistrer une fois que vous avez fini de parler. Si vous êtes préoccupé par la confidentialité, désactivez l’enregistrement des données vocales ou supprimez régulièrement votre historique vocal.

Est-ce qu’Alexa fonctionne avec Android et avec iOS ?

Alexa fonctionne avec Android et avec iOS. Il vous suffit de télécharger l’application dédiée. Ensuite, vous devez connecter vos appareils aux services Amazon et aux services tiers pour profiter des fonctionnalités offertes.

Peut-on comparer Alexa avec Google Assistant et Siri ?

Google Assistant et Siri sont des concurrents d’Amazon Alexa. Chaque assistant dispose de fonctionnalités similaires, et l’application appropriée peut être utilisée avec quasiment tous les téléphones Android et iOS.

Est-ce qu’Alexa est une intelligence artificielle ?

Alexa fonctionne avec un type d’intelligence artificielle (AI) faible : elle est capable d’apprentissage et de résolution de problèmes limités. Elle n’a pas la même adaptabilité qu’un esprit humain ou animal et ne peut pas avoir de véritable conversation.

Néanmoins, Amazon prévoit des améliorations avec l’introduction de conversations d’IA génératives, bien qu’elles simulent seulement des discussions naturelles sans qu’Alexa ait de réelle personnalité.