Big learning data
20 MOTS DE L’IA FORMATIVE, LE PETIT TEMNA EXPLIQUE
Le volume des données disponibles est tellement important qu’on ne sait plus quelle en est la limite.
En 2024, on estime que l’on aura produit 147 zettaoctets (1 zettaoctet est un 1 suivi de 21 zéros).
80 % des données sont traitées en MtoM (Machine to Machine) sans intervention de l’homme, les machines parlent aux machines.
Depuis 2020, il existe plus d’objets connecté, IoT (Internet of Thinks), que d’humains sur terre (8 milliards), mais d’ici à 2030, il devrait y avoir 25 à 30 milliards d’objets, et donc autant de création de nouvelles données.
L’inflation des données devrait se poursuivre.
Si l’infobésité a été inventée,en 1996, le concept n’est pas nouveau puisque déjà en 1613, certains s’en plaignaient à propos de la littérature : « L’une des maladies de notre époque est la multiplicité des livres. Ils surchargent tellement le public que celui-ci est incapable de digérer l’abondance de matières oiseuses quotidiennement éclose et répandue dans le monde. » (Barnabe Rich qui sera une source d’inspiration pour William Shakespeare).
L’infobésité est là, mais avec des métriques différents.
Michael Cox et David Ellsworth, deux chercheurs de la NASA, ont qualifié la situation de « big data » (https://www.researchgate.net/publication/3736976_Application-controlled_demand_paging_for_out-of-core_visualization ).
La volumétrie des datas appelle nécessairement l’IA pour le traitement.
Quelles conséquences pour la formation ?
Sans être exhaustif, dans la chaîne de valeur de la data la première étape est la création de datas brutes.
Prenons l’exemple de la montée en puissance des soft skills dans les compétences à construire. Quel capteur d’information veut-on développer pour créer de la data ? Si l’on choisit la Scanwatch de Withings, entreprise française, qui est une montre connectée capable d’analyser en continu les paramètres vitaux de l’apprenant : électrocardiogramme, rythme cardiaque, mesure du taux d’oxygène dans le sang, la température,… on peut mesurer pour chaque apprenant son intelligence émotionnelle, ainsi que son évolution suite à la formation. Samsung propose des Galaxy Ring, des bagues intelligentes pour collecter de la donnée. Neuralink propose des implants cérébraux.
Tout est bon, à condition de construire le capteur de data.
Une fois produite l’information doit être traitée.
Mick Lévy (Sortez vos données du frigo, 2021) a montré que dans nos entreprises, 68 % des données produits ne sont pas traitées et avec la montée en puissance des objets connectés le chiffre devrait progresser encore.
Comme le disait Henri Poincaré : « On fait la science avec des faits, comme on fait une maison avec des pierres : mais une accumulation de faits n’est pas plus une science qu’un tas de pierres n’est une maison » (La science et l’hypothèse, 1902).
C’est l’histoire qui donne du sens à la data.
Reste alors à construire une réalité qui donne le sens que l’on désire au réel.
Si l’on retient comme histoire, celle de l’apprenant rationalisant, il devient nécessaire de construire des indicateurs pour assurer le pilotage de son engagement : la présence, la complétude, le nombre d’interventions sur le tchat ou les sondages, les eyes trackers,…
L’IA générative étoffe le catalogue des indicateurs d’évaluation.
Ce n’est pas la machine qui évalue la formation, c’est la formation qui choisit sa data en fonction de l’histoire qu’elle veut raconter.
D’autres alternatives sont proposées par les neurosciences avec la possibilité de déposer de l’information directement dans le cerveau comme avec le projet Neuralink.
Depuis 2013, l’équipe de Susumu Tonegawa a créé un savoir directement déposé dans le cerveau d’une souris (https://www.science.org/doi/10.1126/science.1239073). Les conséquences sont vertigineuses pour la formation.
Fait à Paris, le 31 octobre 2024
@StephaneDIEB pour vos commentaires sur X