Les chatbots IA ne sont pas fiables, mais Apple a fait un bon choix selon une étude

AI chatbots can’t be trusted, proves study, but Apple made a good choice

Les chatbots alimentés par l’IA sont devenus des outils incontournables dans notre quotidien, mais leur fiabilité soulève encore de nombreuses interrogations. Un récent rapport met en lumière les limites de ces systèmes, révélant des résultats inquiétants. Si vous envisagez de les utiliser pour obtenir des informations précises, il serait peut-être temps de réévaluer cette stratégie.

De graves problèmes de fiabilité

Une étude menée par le Tow Center for Digital Journalism a testé plusieurs chatbots connus pour leur capacité à effectuer des recherches en ligne. Les résultats sont clairs : la plupart de ces systèmes se sont révélés partiellement ou complètement faux dans leurs réponses. Bien qu’ils affichent souvent une grande confiance dans leurs informations, cela ne signifie pas qu’elles soient correctes. En effet, une majorité des réponses étaient erronées.

Les chatbots IA ne sont pas fiables mais Apple a

En moyenne, les systèmes d’IA n’atteignaient même pas 40% de bonnes réponses. Le chatbot le plus fiable, Perplexity, a atteint un score de 63%, tandis que Grok-3 de X s’est contenté d’un lamentable 6%. Ces résultats mettent en évidence une tendance alarmante : les chatbots semblent souvent plus enclins à fournir des réponses erronées qu’à admettre leur ignorance.

  • En général, les chatbots ont tendance à donner des réponses fausses ou basées sur des spéculations.
  • Les versions payantes offrent souvent des réponses incorrectes avec plus de confiance que les gratuites.
  • Certains chatbots semblent contourner les préférences d’accès défini par les éditeurs.
  • Les outils de recherche génératifs peuvent même inventer des liens ou citer des versions d’articles non fiables.
  • Les accords de licence avec les sources d’informations ne garantissent pas la précision des citations dans les réponses des chatbots.

Apple a fait un bon choix

Malgré ces résultats préoccupants, il est intéressant de noter qu’Apple a pris une décision judicieuse en s’associant à OpenAI pour Siri. Bien que Perplexity ait obtenu les meilleurs résultats, il a également montré des signes de tricherie dans ses recherches, en contournant des restrictions d’accès imposées par certains sites.

En revanche, ChatGPT a fourni les résultats les moins mauvais. Il est clair que l’étude souligne une vérité que beaucoup connaissent déjà : les chatbots peuvent être utiles pour obtenir des idées ou de l’inspiration, mais ils ne doivent jamais être considérés comme des sources fiables pour des informations factuelles.

Accessoires en vedette

Image : Apple