La vague de controverses entourant l’intelligence artificielle semble inextinguible. Cette fois, Meta est au cœur d’une tempête juridique, accusée d’avoir utilisé du contenu piraté pour former son modèle de langage, Llama. Cette affaire soulève des questions cruciales sur les pratiques de l’industrie et la légalité des méthodes utilisées pour nourrir l’apprentissage des machines.
Meta AI : la controverse des contenus piratés
En 2023, Meta a été confrontée à un procès retentissant dénonçant l’utilisation de matériaux protégés pour former Llama, son modèle de langage. Les auteurs Richard Kadrey et Christopher Golden ont porté plainte, affirmant que leurs œuvres avaient été exploitées sans autorisation. Le dossier « Kadrey et al. v. Meta Platforms » met en lumière des affirmations graves sur l’utilisation abusive de contenus protégés.
Récemment, des documents ont été rendus publics suite à une décision du juge Vince Chhabria. Ils révèlent d’inquiétantes conversations entre employés de Meta, certains ingénieurs exprimant des doutes sur l’utilisation de l’ordinateur portable de l’entreprise pour le téléchargement illégal. Une mention de l’approbation de Mark Zuckerberg concernant ces pratiques aurait également été faite, ajoutant du poids aux accusations portées contre la société.
Selon les informations, Meta aurait utilisé des ressources de LibGen, une bibliothèque bien connue pour sa distribution de livres et articles piratés. Avec une origine russe, LibGen lutte contre plusieurs poursuites judiciaires, tout en opérant dans l’anonymat le plus total. D’autres « bibliothèques fantômes » auraient également alimenté Llama.
Les préoccupations autour de l’intelligence d’Apple

La situation n’est pas unique à Meta. En effet, Apple a également été sous le feu des critiques pour des accusations similaires. Un rapport a révélé que son modèle OpenELM contenait des sous-titres de plus de 170 000 vidéos YouTube, laissant supposer que la firme utilisait des données protégées pour alimenter son Intelligence. Cependant, Apple a rapidement affirmé qu’OpenELM n’était qu’un modèle open source destiné à la recherche et étrangement, ne soutenait pas l’Intelligence d’Apple.
D’après les déclarations de la société, les caractéristiques d’intelligence artificielle présentes dans iOS et macOS sont développées à partir de données sous licence soigneusement sélectionnées, ainsi que de données publiques récupérées via un robot d’indexation. Malheureusement, de nombreux grands éditeurs comme The New York Times ont choisi de ne pas participer à l’entraînement des modèles d’Apple, soulignant les enjeux de droits d’auteur qui continuent de diviser l’industrie.
