Accéder directement au contenu

Image d'illustration

L'intelligence artificielle générative: diviser pour simplifier ou ajouter pour créer?

L'intelligence artificielle générative (GenAI) divise-t-elle pour simplifier, ou ajoute-t-elle pour créer? Ce sont les questions que je me suis posées depuis que j'ai lu "Savoir penser demain", un article écrit début août 2023 par Xavier Comtesse [1], un digital shaper reconnu, qui a fait le pari d'un modèle d'IA basé sur l'addition plutôt que la soustraction. Un point de vue intrigant qui, à mon humble avis, nécessite une analyse plus approfondie.

L'idée de Xavier Comtesse est que l'IA fonctionne en ajoutant de nouvelles informations à chaque étape d'un processus, à l'image de la marche humaine, où chaque pas est une addition au mouvement. C'est un modèle qui rappelle l'impression 3D, où l'on construit par addition de matière. Mais est-ce vraiment ainsi que l'IA travaille?

Imaginons un exemple. Vous écrivez la phrase : "Pour imprimer, j'ai besoin d'une rame de...". L'IA propose "papier" à 95% - "A4" à 70% - "blanche" à 50%, se basant sur la probabilité que vous vouliez imprimer sur du papier plutôt que sur une rame de bateau. Dans ce cas, l'IA ajoute-t-elle pour créer, ou divise-t-elle pour simplifier? La réponse semble se situer quelque part entre les deux. Personnellement, je "rame" à 85%, mais selon l'IA j'aurais dû utiliser "suis" à 95% ou "vais" à 90%.

D'après mon expérience personnelle, je constate que l'IA a encore besoin d'une certaine forme de division pour fonctionner efficacement. Par exemple, lorsque je demande à ChatGPT de composer des réponses en utilisant un certain nombre de mots, ou lorsque je veux générer des images d'une même personne avec des expressions différentes, l'IA peine à répondre à mon besoin de manière satisfaisante. Souvent, le nombre de personnes est incorrect, l'apparence des personnes change ou elles ont quatre mains... Vous voyez où je veux en venir?

Prompt : 4 fois la même personne, portant les mêmes vêtements. Tenant 4 expressions différentes. De gauche à droite :

  1. Expression est neutre, les bras pendent nonchalamment le long du corps.
  2. Expression triste, presque en pleurs, les bras croisés.
  3. Expression de colère et de nervosité, les bras croisés.
  4. Expression joyeuse, elle rit, les bras croisés.

Image générées par MidJourney

MidJourney ne génère que 3 personnes. Ces personnes ont des tenues différentes. L'IA a-t-elle ajouté des mains?

Image générées par Dall-e 3

Dall-e cadre de façon trop serrée les images, pour réduire le risque d'erreur.

4 images générées par Dall-e 3

Génération de 4 images par Dall-e, en utilisant la même seed pour garder une unité de style.

Lorsque je lui demande de rédiger un article, je suis souvent confronté aux limitations de la taille mémoire de ChatGPT. Dans le cas de cette IA, cette limite est fixée à 10 000 tokens, soit 6 à 7 mille mots. Cette mémoire limitée contient les documents sources que l'IA doit utiliser pour répondre à une question ou pour rédiger un article, ainsi que le texte généré. Et si les informations nécessaires dépassent cette limite? L'IA générative est alors incapable de répondre à 100% à mes attentes.

 

Cela montre que la GenAI, bien qu'elle fasse des pas de géant, a encore des limites lorsqu'il s'agit de traiter des demandes complexes. L'approche "diviser pour simplifier" semble donc encore nécessaire pour garantir la précision et la cohérence des résultats générés par l'IA.

Cela dit, cela ne signifie pas que l'IA ne progresse pas. Au contraire, il est impressionnant de voir les énormes avancées réalisées par des IA comme ChatGPT et ClaudeAI. Cependant, prétendre qu'elles peuvent déjà imiter les processus de pensée ou d'action humaine semble un peu prématuré.

En conclusion, je ne suis pas encore convaincu que l'IA a fait le saut du modèle "diviser pour simplifier" au modèle "ajouter pour créer". Il y a encore du chemin à parcourir avant que l'intelligence artificielle puisse pleinement intégrer une approche contextuelle, intuitive et créative dans ses processus. Cela dit, il est passionnant de suivre ces développements et de voir où nous mènera l'évolution de l'IA.

Quelle est votre opinion sur ce sujet? L'IA est-elle plus proche du modèle "diviser pour simplifier" ou du modèle "ajouter pour créer"? Je vous invite à partager vos réflexions dans les commentaires.

[1] Xavier Comtesse, Agefi, Savoir penser demainhttps://agefi.com/actualites/acteurs/savoir-penser-demain, publié le 2 août 2023, consulté en ligne le 29 octobre 2023

Mots-clés

Articles similaires

Commentaires

  • Pas de commentaire