Une nouvelle action en justice a été déposée aujourd’hui dans un tribunal fédéral en Californie du Nord, visant Apple pour son utilisation présumée illégale de livres pour entraîner ses modèles d’intelligence artificielle. Cette accusation soulève des questions importantes sur les droits d’auteur et l’éthique dans le domaine technologique.
Des accusations appuyées par des documents internes d’Apple
Selon Reuters, les auteurs Grady Hendrix et Jennifer Robertson affirment qu’Apple a utilisé un ensemble de données piraté, lequel inclut leurs œuvres. Un extrait de la plainte précise :
« Apple construit une partie de cette nouvelle entreprise en utilisant Books3, un ensemble de données de livres protégés par des droits d’auteur. »
Ces accusations reposent sur des éléments révélés par Apple dans un article concernant OpenELM, un modèle open-source que la société a même mis à disposition sur Hugging Face. Dans ce document, le dataset RedPajama est cité, lequel utilise également Books3, un ensemble reconnu pour comporter des livres piratés.
Les plaignants souhaitent obtenir le statut de class action et demandent au tribunal plusieurs réparations, dont :
- La reconnaissance de cette action comme une class action, avec les plaignants en tant que représentants;
- Des dommages-intérêts, une restitution et d’autres recours légaux;
- Une interdiction permanente des actes jugés illégaux et non équitables;
- La destruction de tous les modèles d’IA d’Apple incorporant les œuvres des plaignants;
- Le remboursement des frais d’avocat et des coûts associés.
Un contexte juridique complexe avec des résultats variés
Étrangement, cette plainte intervient peu après qu’Anthropic a atteint un accord record de 1,5 milliard € dans une affaire similaire. De son côté, Meta a récemment fait face à un procès similaire, mais le juge a statué que l’utilisation de livres protégés relevait du fair use.
Cette décision suscite des débats houleux sur la compensation des auteurs. Comme l’a affirmé l’ancien président Trump, il serait difficile d’avoir un programme d’IA performant si chaque source d’information devait être payée. Cela soulève des questions sur l’équilibre entre innovation technologique et respect des droits d’auteur.
La façon dont les entreprises technologiques navigueront dans ces eaux troubles pourrait redéfinir l’avenir de l’IA et des droits d’auteur dans le domaine numérique. Les auteurs ne demandent rien de moins que la reconnaissance de leur travail et une compensation appropriée.
