Perplexity : Une Controverse Évolutive dans le Monde du Web
L’affaire Perplexity continue de susciter des réactions vives. Accusée de contourner des mesures anti-scraping pour extraire du contenu web, la société semble être au cœur d’un débat sur l’éthique de l’utilisation des données en ligne. Bien que Perplexity ait toujours rejeté ces accusations, les récents rapports suggèrent que la situation pourrait se détériorer.
Les Accusations de Contournement
Tout a commencé en juin 2024, lorsque Wired et d’autres médias ont mis en lumière les pratiques de Perplexity concernant l’ignoration du Robots Exclusion Protocol. Cette norme vise à réguler l’accès des robots aux sites web, mais Perplexity aurait choisi de l’ignorer. Aravind Srinivas, CEO de la société, a alors imputé la responsabilité à un fournisseur tiers de services de crawling, évoquant un malentendu sur le fonctionnement de ces technologies.
Les accusations n’ont pas tardé à s’intensifier, avec des publications réputées comme le New York Times et la BBC menaçant Perplexity de poursuites judiciaires. En réponse, la société a qualifié ces accusations de manipulation, affirmant que les critiques ne comprenaient pas pleinement les enjeux technologiques et juridiques.
La Définition Floue du Scraping
Pour Perplexity, la distinction entre crawling et scraping est primordiale. La société argue que si un utilisateur fournit manuellement une URL, leur IA n’opère pas comme un robot d’exploration, mais comme un outil d’assistance. Pourtant, pour de nombreux éditeurs, cette nuance ne change rien. L’action de visiter une URL pour extraire des informations afin de les résumer ressemble trop à du scraping, surtout lorsque cela se produit des milliers de fois par jour.
Srinivas avait promis de faciliter l’accès aux sources originales des contenus présentés par leur moteur de réponse. Cependant, cela ne résout pas la question fondamentale du sourcing, qui reste problématique.
Les Révélations de Cloudflare
Récemment, Cloudflare a publié un rapport accusant Perplexity de continuer à accéder à des serveurs qui interdisent explicitement l’accès automatisé. Le rapport indique que la société utilise non seulement son agent utilisateur déclaré, mais aussi des navigateurs génériques pour contourner les restrictions.
En effet, Cloudflare a observé que Perplexity tentait d’accéder à des contenus en se faisant passer pour Google Chrome, même lorsque des règles précises bloquaient ces tentatives. Ce comportement a été observé sur des dizaines de milliers de domaines, générant des millions de requêtes par jour.
La Position D’Apple en Jeu
Alors qu’Apple envisage potentiellement d’acquérir Perplexity, la question se pose : l’entreprise à la pomme devrait-elle vraiment intégrer une société avec une réputation aussi controversée ? Si Apple est réputée pour son engagement envers la vie privée et l’éthique, l’acquisition de Perplexity pourrait sembler en contradiction avec ces valeurs.
Il est possible qu’Apple croie qu’elle pourrait redresser la barre en intégrant Perplexity dans sa culture d’entreprise. Cependant, cela ne change pas le fait que la société a prospéré en partie grâce à des pratiques discutables. Une telle décision pourrait aussi refléter une pression sur Apple pour rattraper son retard dans le domaine de l’IA, une réalité qui pourrait décevoir de nombreux observateurs.
