Comprendre l'IA

IA générative : les limites qu’il vaut mieux connaître

Hallucinations, biais, confusion… L’IA a ses limites. Voici les plus importantes à connaître avant de l’utiliser dans vos projets (touristiques ou non).

25 juin 2024 — Nicolas François

📬

Cet article est extrait de la newsletter IA, Tech & Travel Café publié le 25 juin 2024 : Tour d'horizon de ChatGPT : fonctionnalités, limites, gratuit ou payant, cas d'usage dans le tourisme...

Quand on voit la liste des fonctionnalités, je vous dresse un portrait finalement assez flatteur de ChatGPT mais, tout en étant un outil très puissant, il a comme toutes les IA génératives de grosses limites qu'il est important de comprendre pour utiliser ces outils en toute connaissance de cause.

Les biais

*Images générée par Google Gemini et publiée dans Frandroid.com “**Les IA seront toujours biaisées, n’en déplaise au patron de Google*”

En raison des données sur lesquelles il a été entraîné, des teraoctets de données provenant notamment de diverses sources internet, ChatGPT peut parfois refléter des biais culturels, sociaux et politiques présents dans ces données d’entraînement et dans les milliards de paramètres écrits par des humains... Tout cela peut alors influencer l'objectivité des réponses fournies et obliger les utilisateurs à être très vigilants pour détecter et corriger ces éventuels biais.

Plus vous lui demanderez de générer des contenus factuels basés sur sa base de connaissance, plus le risque qu'il vous retourne des données biaisées sera grand... Pour atténuer ces biais, il faut essayer de diversifier les sources de données.

Ça oblige clairement à rester vigilant et à ne pas utiliser les yeux fermés ce qu'il vous génère. Et cela peut parfois limiter le gain de temps attendu…

Du côté des éditeurs de ces outils, pas de magie, il faut sans cesse que des humains corrigent et améliorent les paramètres pour éviter ou au moins limiter au maximum ces biais... au risque d'avoir de gros soucis sur les contenus générés (cf l'exemple de Gemini en illustration).

🧐 A noter le lancement d'un projet soutenu par Bpifrance pour "Débiaiser l'IA" (plus d'infos dans le post Linkedin de l'excellente Fabienne Billat)

La confidentialité

*Capture d’écran des paramètres liés à la gestion des données dans ChatGPT (avec un compte “ChatGPT Team”)*

Concernant la confidentialité, la version gratuite de ChatGPT peut poser certains problèmes… Par défaut, les données fournies par les utilisateurs lors des interactions sont utilisées pour améliorer le modèle d’entrainement, ce qui peut provoquer des soucis de confidentialité notamment pour les données sensibles.

Là encore, il faut être vigilant et il est conseillé de ne pas partager d'informations personnelles ou confidentielles sans avoir désactivé le partage des données pour l’entraînement des modèles (je vous explique comment faire plus bas).

Que vous décidiez de partager ou non vos données, voici quelques conseils pratiques qu’il est toujours bon d’appliquer (c’est surtout du bon sens) :

Évitez de partager des informations sensibles : Ne saisissez pas de données personnelles ou confidentielles dans vos interactions avec ChatGPT.
Utilisez des pseudonymes : Si vous devez mentionner des personnes ou des lieux, utilisez des pseudonymes pour protéger leur identité.
Nettoyez régulièrement votre historique de conversations : Vérifiez et supprimez régulièrement l'historique des conversations pour minimiser les risques de fuite d'informations.

Les hallucinations

gifs disney - Page 12 | Jungle book disney, Animated ...

Un autre problème, et oui encore un, est celui des "hallucinations". ChatGPT peut parfois produire des informations factuellement incorrectes voir complètement inventées… ça arrive surtout lorsqu'il est confronté à des questions en dehors de ses domaines d'expertise ou à des requêtes très spécifiques. Ces erreurs peuvent être particulièrement problématiques dans des contextes où la précision est essentielle.

On parle d’hallucination car au premier coup d’oeil le texte généré peut paraître tout à fait crédible et ChatGPT n’exprimera pas forcément de doute. On a l’impression que c’est vrai…

Pour minimiser ce risque, il faut mieux :

Valider les informations en vérifiant toujours les réponses de ChatGPT avec des sources fiables et indépendantes (surtout sur des sujets sensibles)
Utiliser des prompts clairs et précis (plus la question est spécifique et claire, moins il y a de chances que ChatGPT produise des hallucinations)
Poser des questions supplémentaires pour clarifier si une réponse semble incorrecte ou incomplète… et n’hésitez pas à lui dire que vous avez un doute ou qu’il s’est trompé.

La pertinence

La pertinence des réponses de ChatGPT peut également être assez variable 🧐 et c’est en partie une résultante des problèmes de biais et d'hallucinations. Comme le mentionne Luc Julia dans le dernier numéro d’IA, Tech & Travel Café, la pertinence des réponses de ChatGPT se situerait à seulement 64% (d’après une étude publiée en février 2023), ce qui signifie donc que 36% des réponses pourraient contenir des erreurs, ce qui est énorme… Même si on peut penser que les choses s’améliorent (pas de nouvelles études plus récentes à ma connaissance), on parle d’une pertinence qui pourrait atteindre les 90%… mais est-ce satisfaisant d’avoir encore 10% d’erreur ? Cette problématique souligne encore une fois l'importance de vérifier et de corroborer les informations fournies par l'IA avec d'autres sources que l’on sait fiables.

Bon, vous êtes peut-être en train de vous dire “humm… est-ce que ça vaut vraiment le coup d’utiliser ChatGPT, parce que là… ” 😅. Personnellement, je ne pense pas qu’il faille ni foncer tête baisser, ni ne pas s’en servir… ChatGPT reste un outil et un outil plutôt puissant avec un très large éventail d'applications, il est surtout important de rester conscient de toutes ses limites. Comprendre ces contraintes permet d'utiliser l'IA en toute connaissance de cause et de manière plus efficace et éthique, en essayant de tirer parti de ses points forts tout en minimisant les risques.