Le LAM
20 MOTS DE L’IA FORMATIVE, LE PETIT TEMNA EXPLIQUE
Les Large Action Models (LAM), appelés aussi dans la littérature « agents autonomes », s’inscrivent dans la continuité des avancées en intelligence artificielle centrée sur l’autonomie des systèmes. L’anglais « agency » réfère à leur capacité à agir de manière indépendante, tandis qu’en français, on parle souvent d' »assistants numériques intelligents ».
De quoi s’agit-il ?
Contrairement aux agents conversationnels traditionnels, les LAM sont des systèmes capables d’exécuter directement plusieurs tâches complexes de manière autonome. Ils ne se limitent pas à répondre à des requêtes conversationnelles, mais agissent concrètement, marquant l’avènement de ce que l’on pourrait appeler « l’âge du faire ».
Les LAM peuvent analyser une situation, segmenter le travail, planifier chaque action, et apprendre de leurs interactions, qu’elles soient supervisées (avec un Human-in-the-loop) ou non supervisées.
Par exemple, plutôt que d’expliquer comment remplir un formulaire de financement de la formation, le LAM le réalise lui-même en s’appuyant sur les données disponibles sur l’ordinateur ou en ligne.
Des capacités accrues : vers des agents universels
Depuis Google Duplex (2018), il a été démontré qu’un LAM pouvait prendre un rendez-vous chez un coiffeur en respectant les disponibilités et les préférences de l’utilisateur, tout en étant indiscernable d’un humain pour son interlocuteur — validant ainsi une forme avancée du Test de Turing (Turing, 1950).
Le CES 2024 a mis en avant le Rabbit R1 (https://www.rabbit.tech/), un assistant capable d’interagir avec de nombreuses interfaces sans API dédiées. Cet assistant peut commander un Uber, envoyer des messages au chauffeur et effectuer des achats en ligne, sans besoin d’apprentissage préalable. Ce caractère universel en fait une avancée considérable.
Des avancées majeures avec les leaders du marché
Anthropic, avec Claude 3.5, a illustré comment un agent LAM pouvait remplir automatiquement des formulaires en explorant les fichiers locaux et, si besoin, compléter les informations en ligne.
Des entreprises comme Salesforce capitalisent sur ces capacités pour proposer des solutions d’automatisation du traitement des données administratives et commerciales. Imaginez l’impact sur la rédaction des appels d’offres : il suffira de demander et de relire, permettant ainsi une validation rapide et une industrialisation des processus.
L’intégration de la RAG (Retrieval-Augmented Generation)
Les Large Action Models intègrent des technologies comme la RAG (Retrieval-Augmented Generation), qui permettent d’adapter les actions en fonction des habitudes et spécificités de chaque entreprise. Ces systèmes prennent en compte la situation actuelle tout en anticipant les conséquences futures, fonctionnant selon une logique d’objectifs précis.
De l’invention à l’innovation
L’automatisation des tâches via les LAM représente un formidable atout pour les entreprises, offrant une disponibilité 24 heures sur 24 et favorisant l’inclusion numérique. Ces agents peuvent s’adapter à chaque utilisateur, qu’il soit novice ou expert, et simplifier des processus souvent complexes.
Encore une fois, le potentiel des Large Action Models ne se réalise pleinement que lorsqu’ils trouvent des usages concrets dans la société. La différence entre une invention et une innovation réside dans l’appropriation par le public et les entreprises.
Fait à Paris, le 23 janvier 2025
@StephaneDIEB pour vos commentaires sur X