Intelligence Artificielle : Aux frontières de notre réalité
#13 ChatGPT. MidJourney. Stable Diffusion. LLaMa. Alexa. Siri. Skynet.
Comment appréhender les Intelligence Artificielles (IA) ?
L'Intelligence Artificielle, pilier de la 4ème révolution industrielle
Il y a quelques semaines, j'avais écris un article sur l'importance pour les femmes de se former aux technologies blockchain, qui font partie des piliers de ce qu'on appelle la "4ème Révolution Industrielle", concept théorisé par Klaus Schwab, un économiste allemand et le fondateur du Forum Économique Mondial de Davos.
Aujourd'hui, nous parlerons d'un autre pilier de cette nouvelle révolution industrielle, qui est peut-être le plus important : l'Intelligence Artificielle (IA en français, AI en anglais).
L'intelligence artificielle est certainement aussi révolutionnaire que les ordinateurs, les téléphones portables et l'invention de l'Internet.
Chat-GPT, l'arrivée d'un OVNI
Cette révolution de l'Intelligence Artificielle est partout. Elle touche tous les domaines.
Ces derniers mois, vous n'êtes sans doute pas passé à côté du phénomène de "Chat GPT", développé par OpenAI.
Cet outil, ludique pour certains, affolant pour d'autres, est une révolution. C'est la plus grosse avancée technologique en matière d'Intelligence Artificielle disponible pour le grand public depuis l'arrivée des assistants vocaux dans les foyers (comme Siri, Alexa, Google Home).
Depuis son lancement, le site internet de ChatGPT a reçu la visite de plus d'un milliard d'utilisateurs et le nombre d'utilisateurs actifs de cet outil dépassait les 100 millions en janvier 2023, deux mois à peine après son lancement.
C'est la plus grosse croissance jamais enregistrée par une plateforme en ligne.
Les données récoltées depuis son lancement sont folles et ont enclenché un processus d'évolution exponentielle.
En quelques semaines, cet outil est passé de la version 3.5 à la version 4. La version 3.5 permettait à l'IA de passer le concours du barreau américain et de finir dans les 10% des derniers.
La version 4 lui permet de réussir le concours et de finir dans les 10% des meilleurs.
Cet outil est capable d'effectuer toutes les tâches et de répondre à toutes les questions, en se basant sur des centaines de milliards de paramètres. Une mise à jour prochaine lui permettra de se connecter à des plugins via des API. Et donc de pouvoir apprendre et communiquer avec toutes les applications de la planète.
Ce n'est pas la seule révolution. Du côté de la génération d'images, vous avez peut-être entendu parler de "Midjourney".
Ces interfaces, basées sur des modèles, sont maintenant capables de générer tout type d'image, aussi réalistes qu'une photo prise avec votre smartphone.
Stable Diffusion : la révolution Open-Source de la génération d'images
La révolution de l'intelligence artificielle ne concerne pas seulement les outils payants et propriétaires tels que ceux d'OpenAI et de Midjourney.
Des centaines de start-ups se lancent sur le marché et n'ont pas la puissance financière d'OpenAI. Elles utilisent principalement des outils Open-Source qui se développent à une vitesse exponentielle.
C'est le cas, par exemple, de "Stable Diffusion", un modèle d'apprentissage automatique qui permet de générer des images numériques photo-réalistes à partir de descriptions en langage naturel.
Étant donné que ces modèles et outils sont Open-Source, les limitations imposées par les sociétés, telles que la pornographie et la violence, n'existent plus.
Il suffit d'écrire ce qu'on appelle un "prompt", et l'outil va utiliser la puissance de la machine de l'utilisateur pour générer des images. Vous pouvez trouver des exemples de prompts ici, et vous pouvez télécharger l'outil sur Github. (Le dépôt webUI Github compte 54 000 étoiles, montrant un très grand engouement.)
Ces outils reposent sur ce que l'on appelle des "modèles". Pour faire simple, ce sont des sortes de bases de données entraînées à partir d'images que l'on donne à l'outil.
Par exemple, si vous souhaitez entraîner cet outil à générer des voitures, vous pouvez lui faire analyser des milliards d'images de voitures. Pour chaque image, vous lui passerez un fichier de description qui contiendra la marque de la voiture, le modèle, sa couleur, sa taille, etc.
Cet exercice peut se révéler fastidieux, et c'est pourquoi des bases de données de modèles communautaires existent. C'est le cas du site Civitai.com, qui permet de télécharger des modèles déjà entraînés. Vous pourrez ainsi générer vos propres images à partir d'un texte sur votre propre machine. Les licences permettent souvent une utilisation commerciale, il vous sera donc possible de construire des produits et des services au-dessus. Tout cela gratuitement.
J'utilise moi-même ces outils depuis plusieurs semaines. L'image ci-dessous est, par exemple, une photographie que j'ai générée avec l'IA :
Bluffant, hein ?
Les LoRa, la démocratisation des "Deep Fake"
Qu'est-ce que la réalité ?
C'est la question que l'on pourrait poser aux lycéens lors des prochaines épreuves du bac de philosophie.
Cette photo est-elle réelle ? Cette scène a-t-elle vraiment eu lieu ? Cette vidéo est-elle authentique ?
Staline était connu pour faire censurer des images, afin de faire disparaître jusqu'à l'existence même de ses opposants. Mais qu'en est-il de créer des scènes qui n'existent pas ?
C'est là qu'intervient la technique du "Deep Fake", dont vous avez sans doute entendu parler. Elle consiste à prendre le visage d'une personne, par exemple une célébrité, pour le détourner. Parfois à des fins mal intentionnées.
Il y a quelques années, cette technique se faisait uniquement via Photoshop, avec des limitations techniques propres aux retouches photo. Aujourd'hui, n'importe qui peut générer des scènes "deep fakes" grâce à l'intelligence artificielle.
Pour ce faire, on utilise ce qu'on appelle les LoRa (Low-rank Adaptation). C'est une méthode d'apprentissage qui permet de travailler sur des données et de les adapter à des tâches particulières, et ce en étant beaucoup moins coûteuse et en consommant beaucoup moins de ressources que les gros modèles comme GPT-3 et ses 175 milliards de paramètres.
Sans rentrer dans les détails techniques, on peut entraîner un modèle à partir du fil Instagram d'une star ou d'un particulier, avec pour objectif de reproduire sa morphologie et son visage. Une fois ce LoRa créé, on peut le mélanger à un modèle beaucoup plus large, comme des paysages et des tenues, afin de pouvoir changer les vêtements de cette personne à volonté et de la faire voyager partout sur la planète.
Les possibilités sont infinies et il est presque impossible de différencier le vrai du faux.
Le cinéma utilise déjà des méthodes algorithmiques pour remplacer des acteurs morts ou les rajeunir.
D'où ma première question, qu'est-ce que la réalité ? Comment différencier un deep fake d'un contenu authentique ?
LLAMA de Meta (Facebook): un ChatGPT dont le code source a fuité sur Internet
Les IA textuelles, comme "ChatGPT", étaient jusqu'à très récemment la propriété de grosses entreprises uniquement. Le coût pour créer et héberger ce type de logiciels est beaucoup trop élevé (plusieurs millions), empêchant ainsi les particuliers de pouvoir créer leur propre IA "dans leur garage". Cela limite la concurrence en obligeant les entrepreneurs à utiliser des services existants au lieu de construire les leurs à partir de zéro.
Mais cela a récemment changé. Le 3 mars 2023, LLaMA, le dernier modèle d'IA générative de Meta (Facebook), a été partagé illégalement sur Internet. En d'autres termes, le code source, censé être réservé aux chercheurs agréés et aux organisations gouvernementales, a été partagé de manière non autorisée sur Internet.
Cela a lancé le début de la véritable révolution. N'importe qui peut lire le code. N'importe qui peut l'améliorer. N'importe qui peut l'installer. N'importe qui peut l'utiliser. Et surtout, sans aucune restriction.
Ainsi, des "milliers de ChatGPT" se sont retrouvés dans la nature. La version de base (7 milliards de paramètres) s'installe facilement sur un MacBook Pro. Cependant, pour les versions plus grosses, il est nécessaire d'avoir du matériel adapté, qui est coûteux, mais pas assez coûteux pour empêcher les start-ups de les utiliser. Les versions plus grandes sont plus puissantes que GPT-3 (mais moins que 3.5 ou 4).
Si vous voulez le code, vous pouvez rechercher sur Internet ou ici sur le Github llama.cpp.
Le plus intéressant n'est pas le code, mais les modèles qu'utilise l'IA. Et cela tombe bien! Il y a quelques jours, tous les modèles de données utilisés par Meta pour faire fonctionner l'IA, soit plus de 200 Go de données, ont fuité sur le forum internet 4chan. Meta a bien entendu tenté de les faire supprimer, mais il était déjà trop tard, ils étaient déjà "dans la nature" et disponibles sur de nombreuses plateformes de peer-to-peer.
Ils ne pourront donc plus être censurés. Si vous souhaitez télécharger ces modèles, il vous suffit de cliquer sur ce lien torrent (il est nécessaire d'avoir un client Torrent installé).
Le code étant disponible pour tous, différents outils sont partagés sur GitHub, comme celui de cet internaute qui a ajouté des fonctions vocales à l'assistant virtuel IA.
GitHub Copilot, la révolution des outils de programmation
La révolution portée par l'intelligence artificielle ne concerne pas uniquement ce domaine, elle touche tous les secteurs. Il y a un peu plus de deux ans, GitHub, racheté en 2018 par Microsoft, a lancé une intelligence artificielle appelée "GitHub Copilot". Cette IA, développée en partenariat avec OpenAI, assiste les développeurs en temps réel et leur permet de coder plus rapidement.
Bien que certains la méprisent et que d'autres la sous-estiment, cette IA est déjà un changement de paradigme.
J'ai eu la chance de tester l'outil dès l'ouverture de sa phase bêta. J'ai été bluffé par sa performance et j'avais alors donné mes identifiants à un de mes anciens manager, pour qu'il puisse me faire un retour. Je voulais être sûr d'avoir bien compris le potentiel d'un tel outil, que je jugeais déjà révolutionnaire. Ses retours ont confirmé mes impressions.
Cette intelligence est capable d'écrire des fonctions de code entières à partir d'une simple demande formulée par l'utilisateur. Pendant que le développeur code, elle analyse la logique déjà écrite et propose la suite en temps réel.
Selon moi, la révolution est déjà là, sous nos yeux. Et pourtant, deux ans après, l'outil n'est pas encore démocratisé chez tous les développeurs.
GitHub vient tout juste d'annoncer le lancement prochain d'une nouvelle version, Copilot X, qui sera boostée par GPT-4. L'ambition affichée est de révolutionner la manière de programmer.
L'IA sera capable de reconnaître le code tapé et les messages d'erreur affichés. Elle avertira automatiquement les développeurs s'il manque des tests et leur suggérera des tests potentiels qui pourront être édités, acceptés ou rejetés en fonction des besoins d'un projet. Les développeurs obtiendront une analyse approfondie de leur code en temps réel. L'IA leur fournira des explications, commentera automatiquement le code et pourra même leur générer des tests unitaires. Elle sera également capable de proposer des correctifs pour des bugs trouvés dans le code. Elle pourra également écrire de la documentation et remplir automatiquement des pull requests en fonction du code modifié.
La manière de programmer change radicalement. Les méthodes d'apprentissage des écoles d'informatique ne sont plus adaptées à ces technologies. Les méthodes actuelles pour tester les connaissances des élèves n'ont plus de sens.
Un développeur n'a plus besoin de comprendre tout son code, ni de coder toutes ces fonctions "from scratch". Il a juste à formuler ses besoins et l'IA s'occupera du reste. L'IA sera capable de lui expliquer chaque morceau de code.
Une IA comme Copilot permet de faire la même chose qu'un développeur, plus rapidement et mieux. Le métier de développeur évolue rapidement d'un métier "d'ouvrier" (production de code) à un métier "chef de produit".
N'importe qui sera capable de produire du code de qualité, beaucoup plus rapidement et avec un niveau de connaissance beaucoup moins élevé qu'aujourd'hui.
L'outil Copilot X remet en question les modèles pédagogiques des universités, des bootcamps et des écoles d'informatique, y compris les écoles peer-to-peer telles que 42 et Epitech.
Ces formations enseignent le code de la même manière depuis 15 à 20 ans, alors que les technologies évoluent. Les paradigmes enseignés restent inchangés, ce qui nécessite une refonte complète de ces programmes et l'intégration de nouveaux outils tels que Copilot X. Sinon, les diplômés de ces écoles risquent d'être dépassés par l'évolution rapide du monde de la technologie.
Une Révolution du système Éducatif
Une révolution du système éducatif est en cours, qui ne concerne pas seulement les écoles d'informatique, mais toutes les écoles et les universités.
Récemment, Sciences Po Paris a jugé bon d'interdire ChatGPT, malgré son désir de se positionner en tant que précurseur de la régulation des IA et formateur des élites de demain.
Sur ce point, cette Grande École brille surtout par sa bêtise. Cela rappelle les temps où les calculatrices et même Wikipédia étaient interdites dans les salles de classe. Le but d'une école est de former les élèves à la vie, à un métier et au monde qui les entoure. Ce monde baigne déjà dans la technologie, avec des IA partout, dans nos téléphones, dans les caméras de surveillance, dans nos appareils électroniques, partout.
Au cours des cinq à dix prochaines années, les logiciels basés sur l'IA révolutionneront la façon dont les gens enseignent et apprennent, avec les assistants virtuels qui changent la donne. La manière d'apprendre, de travailler et de produire sera complètement différente.
L'IA pourra connaître les intérêts et le style d'apprentissage des élèves pour adapter le contenu qui les maintiendra engagés, mesurera leur compréhension, remarquera quand ils se désintéressent et comprendra le type de motivation auquel ils répondent. Elle donnera un retour immédiat.
Les IA peuvent aider les enseignants et les administrateurs en évaluant la compréhension d'un élève d'une matière et en donnant des conseils sur la planification de carrière. Des enseignants utilisent déjà des outils tels que ChatGPT pour fournir des commentaires sur les devoirs d'écriture.
Certains parlent déjà de réguler l'utilisation de l'IA, mais comment arrêter une technologie qui évolue aussi rapidement qu'une avalanche dévale la pente d'une montagne ?
L'IA, entre peur, incompréhension et risques réels
Il est vrai que certains arguments en faveur de la limitation de ces technologies sont à prendre en compte.
Nous connaissons les risques liés aux IA depuis plusieurs décennies. Les romans et films de science-fiction ont mis en évidence les principaux.
Comme la plupart des inventions, l'intelligence artificielle peut être utilisée à des fins bonnes ou malveillantes.
Ensuite, il est également possible que les IA échappent à tout contrôle. Une machine pourrait-elle décider que les humains sont une menace, conclure que ses intérêts sont différents des nôtres ou simplement cesser de se soucier de nous ?
Nous en sommes encore très loin techniquement. Les IA super-intelligentes sont assurément une étape dans notre avenir.
Comparé à un ordinateur, notre cerveau fonctionne à un rythme d'escargot : un signal électrique dans le cerveau se déplace à 1/100 000ème de la vitesse du signal dans une puce de silicium ! Une fois que les développeurs pourront généraliser un algorithme d'apprentissage et l'exécuter à la vitesse d'un ordinateur, nous aurons une IA incroyablement puissante qui pourra faire tout ce qu'un cerveau humain peut faire, mais sans aucune limite pratique sur la taille de sa mémoire ou la vitesse à laquelle elle opère.
Ces IA "fortes", comme on les appelle, seront probablement en mesure d'établir leurs propres objectifs. Quels seront ces objectifs ? Que se passe-t-il s'ils entrent en conflit avec les intérêts de l'humanité ? Faut-il essayer d'empêcher le développement d'une IA forte ? Ces questions deviendront plus urgentes avec le temps.
Ou, comme dans Matrix, vivons-nous dans une simulation ? Sera-t-on capable d'en créer une, comme on crée un jeu vidéo ?
Toutes ces questions se poseront peut-être un jour. Je pense personnellement qu'elles se poseront plus tôt qu'on ne le pense.
Pour en revenir aux problématiques actuelles, les questions sont plus pratiques :
- Faut-il interdire aux étudiants d'utiliser des intelligences artificielles comme ChatGPT ?
- Comment repenser nos modèles éducatifs ?
- Les IA doivent-elles être bridées ? Censurées ?
- Comment authentifier les vraies photos et vidéos ?
- Comment différencier une fake news d'une vraie news ?
- Que deviendront les emplois qui disparaîtront ? Seront-ils tous remplacés ?
- Les œuvres produites par les IA doivent-elles être taxées ? Comment ?
- Les IA et les robots ont-ils des droits ?
- Est-il éthique de créer un profil "influenceur" à partir d'une IA ?
- En cas de problème (par exemple, un accident d'une voiture autonome), qui est responsable de l'accident ? De dédommager les victimes ?
- Faut-il labelliser les produits et œuvres réalisés par des humains ?
- Faut-il favoriser davantage les produits fabriqués par des humains ou ceux créés par des IA ?
- Peut-on tomber amoureux de son IA ? Se marier avec ? Adopter avec ? Que se passe-t-il lorsque votre amoureuse créée par l'IA cesse de vous aimer ?
Cette dernière question s'est posée la semaine dernière, quand l'entreprise Replika IA a annoncé le retrait des jeux de rôle érotique de son application. Laissant ses utilisateurs en plein désarroi.
C'est ainsi que se termine cette newsletter. J'espère qu'elle vous a plu.
Je vous laisse méditer sur toutes ces questions qui se posent et qui ne sont plus uniquement de la Science-Fiction.
Abonne-toi à la Newsletter
À la semaine prochaine ! ☀️
Member discussion