Accueil
Le quotidien du droit en ligne
-A+A
Article

Utilisation de données protégées par le droit d’auteur pour l’entraînement de systèmes d’IA : l’affaire Thomson Reuters c/ Ross Intelligence

Le 11 février 2025, une première décision concernant l’entraînement d’un système d’IA avec des données protégées par le droit d’auteur a été rendue aux États-Unis. Le juge Bibas a statué en grande partie en faveur de Thomson Reuters, estimant entre autres que l’utilisation faite du contenu ne relève pas de la doctrine du fair use, notamment au regard de l’impact sur le marché et de la nature non transformative de l’opération. 

« Un homme intelligent sait quand il a raison ; un homme sage sait quand il a tort. La sagesse ne me trouve pas toujours, alors j’essaie de l’accueillir quand elle le fait, même si elle arrive tard, comme ce fut le cas ici » (traduction libre). C’est sur ces mots que le juge Bibas ouvre son nouveau summary judgement concernant l’affaire Thomson Reuters c/ Ross Intelligence.

Faits

L’affaire en l’espèce implique Thomson Reuters, propriétaire de la plateforme Westlaw, et Ross Intelligence, le développeur d’un outil de recherche juridique utilisant un système d’intelligence artificielle (IA). Pour développer son outil, Ross a tenté d’obtenir une licence pour utiliser le contenu Westlaw de Thomson Reuters afin d’entraîner son modèle d’IA. Thomson Reuters refusa. Ross décida donc de contacter un tiers, la société LegalEase pour acheter des paires de questions et de réponses (appelées « Bulk Memos »).

Les Bulk Memos sont des compilations de questions juridiques posées par des avocats, avec des bonnes et mauvaises réponses. Pour créer ces questions, LegalEase avait fourni aux avocats un guide expliquant comment procéder, en utilisant les notes d’en-tête de Westlaw. Il était précisé que les avocats ne devaient pas simplement copier et coller les notes d’en-tête directement dans les questions. Ross utilisa donc 25 000 Bulk Memos pour entraîner son système.

Après avoir découvert cela, Thomson Reuters décida de poursuivre Ross pour violation de ses droits d’auteur. Thomson Reuters se fonde sur l’utilisation des notes d’en-têtes de Westlaw et du système de numéros clés que Ross aurait utilisé pour entraîner son système d’IA.

En 2023, le juge Bibas avait rendu un premier jugement, refusant d’accorder un summary judgment aux parties, et concluant qu’un jury était nécessaire pour déterminer si la doctrine du fair use pouvait s’appliquer en l’espèce (District of Delaware, 25 sept. 2023, Thomson Reuters Enterprise Centre GmbH et West Publishing Corp. c/ Ross intelligence inc., n° 1:20-cv-613-SB). Aux États-Unis, un summary judgment est un pouvoir discrétionnaire accordé aux juges pour statuer sur une demande ou une question sans passer par un procès impliquant un jury. Le tribunal accorde ce type de jugement si le requérant démontre qu’il n’y a pas de véritable litige sur un fait matériel et que le requérant a droit à un jugement sur la base d’une question de droit.

Toutefois, dans ce nouveau summary judgment rendu le 11 février 2025, le juge Bibas annule une grande partie de sa décision de 2023, concluant que de nombreuses questions pouvaient d’ores et déjà être résolues en faveur de Thomson Reuters, au lieu d’être soumises à un jury.

Solution

Pour l’analyse de cette décision, le nouveau jugement peut être décomposé en deux parties.

Originalité et copie substantielle du contenu utilisé

Tout d’abord, le juge procède à une analyse du contenu utilisé pour déterminer si ce dernier est original et si Ross a effectivement copié ledit contenu. Le juge Bibas estime alors que la sélection et l’arrangement des notes d’en-têtes sont originaux, et plus encore, que les notes d’en-têtes individuelles sont assez...

Il vous reste 75% à lire.

Vous êtes abonné(e) ou disposez de codes d'accès :