Accueil
Le quotidien du droit en ligne
-A+A
Le droit en débats

Réguler l’IA et protéger les créateurs : point de vue après la conférence de Namur des 8 et 9 avril 2024

Une conférence sur le droit d’auteur était organisée à Namur les 8 et 9 avril dans le cadre de la présidence belge du Conseil de l’Union européenne. Parmi les défis actuels, celui de l’intelligence artificielle était évidemment traité ; l’occasion de soumettre ici, à la réflexion collective et au débat, quelques éléments d’une intervention présentée le 9 avril 2024.

Par Stéphanie Le Cam le 24 Avril 2024

Dans le cadre de la présidence belge du Conseil de l’Union européenne, le SPF Économie invitait quelques acteurs de l’écosystème de la propriété littéraire et artistique à une conférence sur le droit d’auteur à Namur les 8 avril et 9 avril afin de traiter les nouveaux défis du droit d’auteur européen. Au titre d’une introduction engagée, Paul Laurent, membre de cabinet du ministre de l’Économie Pierre-Yves Dermagne, a pu rappeler qu’au moment de la rédaction de l’article 4 de la directive DSM (Dir. [UE] 2019/790 du 17 avr. 2019 sur le droit d’auteur et les droits voisins dans le marché unique numérique et modifiant les dir. 96/9/CE et 2001/29/CE), l’exception de fouille de données (dite « TDM ») n’avait pas été envisagée comme couvrant l’IA générative et concluait qu’il serait sans doute nécessaire de réviser la directive sur ce point pour éviter toute surinterprétation au détriment de la protection des droits de propriété intellectuelle.

Tamas Szigeti (Unité droit d’auteur de la Commission européenne) défendait à l’inverse que le champ d’application de l’exception TDM intègre l’IA générative… Écartant l’idée même d’un besoin de réforme et occultant d’une certaine façon le problème du respect des œuvres pour la constitution des bases de données indispensables à l’entraînement des modèles d’IA, le représentant de la Commission évoquait alors l’opt-out comme un garde-fou garant d’un équilibre entre les intérêts en cause. On comprendra donc que son intervention ait pu susciter une certaine préoccupation au sein de l’assemblée ; ce droit de réserve ne fonctionnant pas de manière optimale, faute notamment de transparence (les auteurs et titulaires ne pouvant pas procéder à la vérification du respect de leurs droits de réserve, v. en ce sens, S. Le Cam et F. Maupomé, IA génératives de contenus : pour une obligation de transparence des bases de données !, Dalloz actualité, 11 mai 2023 ; A. Bensamoun, To be or not to be…transparent - Pour un principe matriciel de transparence dans l’environnement numérique, Dalloz actualité, 3 déc. 2023).

Heureusement, l’intervention de la présidente d’European Writers Council (EWC) lors de la table ronde réunissant également Nevena Kostova (Google), Paul Keller (Open Future) et Agnieszka Horak de Sousa (IFPI) était particulièrement éclairante. Nina George a pu souligner notamment que pour certains auteurs, aucune forme de compensation liée à un hypothétique droit à rémunération ne saurait jamais être considérée comme suffisante, face aux préjudices à la fois d’ordre moral et d’ordre économique qu’ils endurent. Elle aura même osé poser la question très pertinente de savoir si les quelques leaders du marché de l’IA présents à Namur seraient prêts à recommencer à zéro leurs opérations d’extractions et d’entraînements sur la base de données proprement obtenues, condamnant alors fermement ce qui peut s’apparenter au second pillage massif du patrimoine culturel et informationnel au mépris de toutes les règles du droit d’auteur. Au résultat, on retiendra de ce colloque qu’il fut marqué par une tension. Et c’est dans ce contexte que nous avons été conviée à intervenir sur la question de savoir « Comment éviter l’appropriation illégitime du travail des créateurs par l’IA ? »

Cette interrogation épineuse avait été soigneusement choisie par les organisateurs de la conférence, reflétant la complexité des enjeux discutés. Nous saisissons donc ici l’occasion de présenter, en vue de les soumettre au débat, quelques éléments de réponse qui ont été présentés lors de cette intervention à Namur.

Contexte préoccupant pour les métiers de la création

L’avènement de l’IA s’inscrit dans un contexte déjà fort préoccupant pour les métiers de la création ; le monde de la création ayant été confronté à une crise sanitaire majeure qui a exacerbé de nombreuses tensions (entre les fermetures de salles et les annulations de projets artistiques…). À peine remis, les métiers créatifs sont maintenant confrontés aux impacts économiques de l’IA qui feront bientôt l’effet d’un tsunami pour les plus fragiles d’entre eux.

Ce sont des pertes d’activité et de rémunérations qui menacent clairement les métiers de la création dans leur existence. Plus complexes encore, ce sont les distorsions de marché que ces professionnels craignent, car l’IA joue évidemment sur le seuil de prix psychologique du travail de création. On peut en effet se demander s’il sera possible d’envisager qu’un illustrateur touche encore 500 € pour la réalisation d’une couverture de livre, alors qu’un abonnement à Midjourney pour une vingtaine d’euros par mois permet de générer des milliers d’images. Enfin, le phénomène d’éviction et d’invisibilisation est fort. Les auteurs étaient déjà confrontés à une forte concurrence, et ils se trouvent désormais contraints de se faire remarquer au milieu d’un océan de contenus où leurs créations sont submergées par les produits synthétiques générés par l’IA. Le contexte n’est donc pas rassurant.

Alors répondre à la question de savoir comment éviter l’appropriation illégitime du travail des créateurs par l’IA pourrait laisser d’abord place à une certaine inquiétude ; les plus pessimistes pouvant considérer que toute action est vaine dorénavant, les artistes devront s’adapter. Mais la réalité est peut-être plus complexe qu’elle n’y paraît, et il y a tout de même une faiblesse dans les modèles d’IA.

Modèles d’IA et problème d’approvisionnement

Plusieurs journalistes et chercheurs américains ont mis en lumière un problème d’approvisionnement des données dans une enquête publiée récemment au New York Times (v. C. Metz, C. Kang, S. Frenkel, S. A. Thompson et N. Grant, How Tech Giants Cut Corners to Harvest Data for A.I., NY Times, 8 avr. 2024). On y apprend que fin 2021, OpenAI avait épuisé tous les réservoirs de textes en anglais et avait eu besoin de plus de données pour sa nouvelle technologie. Il a donc transcrit plus d’un million d’heures de vidéos YouTube (sans permission des auteurs), afin que les textes soient introduits dans le système GPT-4. Depuis, la course à la tête de l’IA est devenue une quête des données numériques les plus fraîches et les plus fiables (v. en ce sens, R. Nirina, Scandale : Stability AI accusé de vol par Midjourney, les tensions à leur comble !, Le Bigdata, 11 mars 2024).

Pendant des années, internet était une source de données apparemment inépuisable, mais à mesure que l’IA progresse, les entreprises recherchent davantage de référentiels, et il en résulte qu’elles utilisent les données plus rapidement qu’elles ne sont produites. Les modèles d’IA ont besoin de données nouvelles et fiables, car lorsqu’ils apprennent sur la base de leurs propres résultats, ils sont pris dans une boucle où ils renforcent leurs propres bizarreries.

Ce sont donc les données qui n’existent pas encore qui doivent retenir notre attention. Et parmi ces données, il s’agit du travail des auteurs qui n’a pas encore été réalisé et que l’on doit protéger si l’on veut que ces futures œuvres ne soient aussitôt captées pour nourrir l’IA.

En réalité, lorsque nous discutons de l’IA, nous avons tendance à la considérer comme quelque chose d’impersonnel, alors qu’en fait, elle repose largement sur le travail humain, notamment au sein des entreprises. Parler de l’IA de manière générale ne permet pas d’examiner de manière spécifique les responsabilités des individus qui, par leurs actions, entraînent des conséquences significatives pour les professions créatives. Il faudrait donc procéder à un classement en trois catégories :

  • ces humains et structures qui sont chargés de l’extraction de données, pour la constitution de base d’entraînement ;
  • ces humains et structures qui mettent en ligne des services commerciaux ou non commerciaux d’IA ;
  • ces humains et structures, enfin, qui utilisent pour leur usage privé, ou professionnel ou commercial les services d’IA.

Le problème n’est pas que l’IA peut faire le travail des auteurs à leur place, c’est le fait que ces humains et ces structures pensent qu’avec l’IA, ils pourront faire et vendre le travail des auteurs à leur place. Un retour à l’équilibre est donc souhaité.

Balance des intérêts et recherche d’un équilibre

Imaginons une balance symbolique représentant l’ensemble des acteurs impliqués : d’un côté, les auteurs et titulaires de droits et de l’autre, ces humains et ces structures, qui aspirent, entraînent, surentraînent, proposent des services IA ou les utilisent. Cette représentation met en évidence un déséquilibre flagrant entre les deux plateaux et des auteurs en position de faiblesse.

Pour rétablir l’équilibre, il faut jouer sur les deux plateaux de la balance. D’une part, l’ensemble des acteurs ayant une responsabilité en matière d’IA doit être soumis à des réglementations concrètes pour ne pas peser autant dans la balance. Ce serait comme une sorte de mise au régime hypocalorique dans l’intérêt aussi des lois du marché, puisque les richesses sont actuellement captées par les trois ou quatre entreprises américaines les plus importantes au détriment de structures plus jeunes ou plus petites. D’autre part, il faut apporter aux auteurs et titulaires de droits un vrai soutien en protégeant leurs droits de propriété intellectuelle et leurs intérêts professionnels, une sorte de régime hypercalorique pour un nécessaire retour à l’équilibre.

Du côté des acteurs de l’IA, le législateur devrait intervenir à trois stades : au moment de l’extraction de données pour la constitution de base d’entraînement au moment de l’édition de services d’IA et au moment de l’utilisation de ces services d’IA.

Premier stade : extraction des données et database publishers

Les enjeux qui se dessinent autour de l’extraction de données sont nombreux et les objectifs poursuivis par les databases publishers doivent être déclarés : nourrir une base d’entraînement pour générer des contenus médicaux en vue d’aider les hôpitaux dans l’intérêt de la santé publique n’a rien de comparable avec le fait de procéder à l’extraction de plusieurs milliards d’images protégées dans le but de générer des produits synthétiques venant directement en concurrence avec les œuvres des artistes. Un prérequis est indispensable, le triple test doit être un phare, mais il serait tout de même important de rappeler l’esprit du texte de la directive DSM afin qu’on n’acte pas trop rapidement que tout tombe sous le coup des exceptions (pour aller plus loin, v. not., B. Casar, L’importance de la gouvernance des données dans l’usage de systèmes d’IA générative, Dalloz IP/IT 2023. 513 ; J. Elkaim, Quel avenir pour la propriété intellectuelle dans la nébuleuse IA ?, Revue pratique de la prospective et de l’innovation, nov. 2023, p. 9).

Lorsque les fouilles sont réalisées, il s’agirait de mettre en place au minimum quatre règles, lesquelles seraient différentes selon que la fouille est faite dans le but d’une recherche publique ou dans une autre finalité.

Première règle, il faudrait exiger une déclaration préalable de l’activité afin de savoir si l’extraction se fait dans le but d’une recherche publique ou dans une autre finalité. Le déclarant devrait présenter ses motivations et objectifs poursuivis à un comité de régulation et d’éthique qui vérifierait le respect du triple test et le respect d’un fonctionnement éthique. Ce comité aurait le mérite d’éviter une judiciarisation systématique.

Deuxième règle, il faudrait exiger une obligation de transparence et de registre afin de pouvoir contrôler les données utilisées pour l’entraînement et, le cas échéant, de vérifier le respect du droit de réserve de l’auteur.

Troisième règle, il s’agirait de mettre en place une chronologie dans l’exploitation des datas. Les modèles d’IA ont besoin de données fraîches et fiables, mais nous devons aussi sauvegarder l’exploitation de l’œuvre. La recherche publique implique des fouilles sur des données fraîches et fiables. On comprend que s’entraîner sur des données dépassées n’a pas d’intérêt pour la recherche médicale. Le principe pourrait être celui de l’absence de chronologie, sauf exception dans le cas de données plus sensibles qui pourraient être prévues par la loi. Dans les finalités étrangères à la recherche publique, la possibilité de procéder à l’extraction de données fraîches doit être limitée aux données plus anciennes (3 ans ou plus, il s’agirait de réfléchir à un délai). Il en résulterait une interdiction de procéder à l’extraction de données récentes, en revenant à un opt-in et une possibilité d’accords avec le titulaire des droits si ce dernier accepte le principe d’une extraction sur des contenus plus récents. Cette solution n’est sans doute pas à l’abri de la critique, car elle donne l’impression qu’on remet en cause la durée de protection de la propriété intellectuelle, mais elle permettrait d’assurer la protection des œuvres nouvelles qui à peine éditées n’ont pas été suffisamment exploitées pour permettre à l’auteur d’en tirer assez de revenus.

Enfin, quatrième règle, les database publishers doivent rémunérer les auteurs. À ce titre la mise en œuvre d’un droit incessible à rémunération, inspiré des modèles belges, allemands et espagnols, devrait nous servir d’exemple. Ce droit combinerait alors la logique des accords collectifs et de la gestion collective pour procéder à la collecte et à la répartition de ces rémunérations.

Deuxième stade : édition des services d’IA

À propos des éditeurs de services d’IA, un prérequis indispensable doit être respecté, il s’agit de l’ordre public économique. Les éditeurs de services d’IA proposent des abonnements dont les prix sont largement inférieurs à la valeur du travail aspiré, laissant présager des ventes à perte et des actes de concurrence déloyale… Il faut appliquer les règles que nous connaissons déjà pour lutter contre ces pratiques contraires aux lois du marché, lutter contre les abus de position dominante et les ententes illicites et réguler les entreprises en situation d’oligopoles.

Quatre règles devraient être mises en place également.

Première règle, il faut aussi connaître les intentions des éditeurs de services d’IA et imposer une déclaration préalable de l’activité et un contrôle par le comité de régulation et d’éthique. Ce dernier aurait – au regard des règles d’éthique – le pouvoir d’en interdire l’accès (si, par ex., le service consiste à générer des images attentatoires aux principes les plus fondamentaux de notre État de droit). Il faut également leur imposer des obligations de lutte contre les fake news, des obligations de respecter la transparence et le droit de la propriété intellectuelle.

Deuxième règle, il faudrait leur imposer une obligation de contribuer à la création en fonction d’un pourcentage des capitaux générés. Cet outil existe déjà, rappelons que depuis juillet 2021, les services étrangers de vidéo sur abonnement sont soumis aux mêmes règles de contribution au financement de la création que les groupes de télévision traditionnels. Il s’agirait de transposer et de capter une partie des chiffres d’affaires réalisés, à destination de la production d’œuvres.

Troisième règle, il faudrait une obligation de labelliser l’ensemble des produits synthétiques générés qui circuleront en mettant en place évidemment des sanctions suffisamment dissuasives pour forcer les éditeurs à identifier ce que leurs services produisent.

Et bien évidemment, il faudrait, quatrième règle, une obligation de rémunération dans les conditions que nous avons déjà identifiées ; le droit incessible à rémunération combinant accords collectifs et gestion collective étant une solution pertinente.

Troisième stade : l’utilisation des services d’IA

Enfin, le dernier acteur à réguler, sans doute le plus compliqué, serait l’utilisateur du service d’IA. Quelques impératifs doivent être aussi rappelés.

Premièrement, il faudrait informer et sensibiliser les utilisateurs : non, le droit d’auteur ne protège pas les produits synthétiques entièrement générés par l’IA. Un prompt aussi raffiné soit-il ne saurait créer de la propriété intellectuelle. Il génère un nombre trop important de variations de productions synthétiques (plusieurs milliards parmi lesquels l’utilisateur ne verra qu’un nombre limité de sorties, de l’ordre de 4, affichées au hasard pour Midjourney). Certes, cela ne règle pas le problème des produits mixtes – dont la part de l’humain sera plus ou moins substantielle. Les juges auront du travail et sans doute qu’une exigence de transparence devra être mise en place aussi à ce titre.

Deuxièmement, il faudrait que l’utilisateur respecte une labellisation systématique. La déontologie, certes c’est un peu naïf, devra être exigée.

Troisièmement, les dispositifs et encouragements qui ont été mis en place pour protéger les œuvres dans le domaine fiscal et dans le domaine de la protection sociale ne devront pas être appliqués aux produits synthétiques (par ex., une TVA réduite pour un livre entièrement généré par l’IA, des aides à la création, des avantages fiscaux, l’accès au régime social des artistes-auteurs ; v. S. Le Cam et F. Maupomé, Images et textes générés par l’IA à l’épreuve des règles fiscales et sociales, Dalloz actualité, 17 oct. 2023).

Enfin, quatrièmement, il faudrait penser à un mécanisme pour rémunérer les auteurs. En ce sens, le professeur Valérie-Laure Bénabou a soulevé une piste très intéressante en proposant un domaine public corollaire de la non-protection des contenus a priori générés par les IA (v. V.-L. Bénabou, Du test en trois étapes au domaine public payant - Quelques idées pour mieux associer les titulaires de droit à la production des intelligences artificielles génératives dans le champ de la création intellectuelle). Un domaine public payant pourrait émerger pour ces produits synthétiques. Et les sommes qu’il générerait pourraient être fléchées aux financements des besoins des professionnels les plus impactés.

Toutes ces mesures de réglementation et de régulation permettraient de faire remonter le plateau de la balance vers le centre, mais ce ne serait sans doute pas suffisant. Il faudrait également peser sur le plateau des auteurs et leur reconnaître un statut pour leur donner plus de poids et rétablir l’équilibre.

Enjeux de transformation du travail et statut professionnel

Nous sommes face à des enjeux de transformation du travail qui doivent nous pousser à trouver un juste équilibre où l’innovation peut avoir sa place tout en garantissant le respect des droits et des conditions sociales et professionnelles des artistes. Conditions sociales et professionnelles des artistes qui ont fait l’objet d’une résolution récente adoptée le 21 novembre 2023 par le Parlement européen en vue justement de les améliorer. Cette résolution a été suivie d’un engagement de la Commission européenne, le 21 février dernier, de faire progresser le dossier du statut dès la prochaine législature qui commence dans quelques semaines.

Il faut tout de même être prudent. Lorsque l’on observe le manque de considération des représentants de la Commission à Namur à propos des répercussions de l’IA sur les professions créatives, on peut craindre que la question du statut ne soit utilisée comme un sparadrap sur une blessure plus profonde. La question du statut professionnel ne pourrait pas être vue comme une simple alternative, mais comme une voie d’actions complémentaires, d’autant que certains sujets ne relèvent pas de la compétence de l’Union européenne.

Ce statut reposerait alors sur quatre piliers fondamentaux.

Premier pilier, il implique des règles encadrant les relations individuelles contractuelles des auteurs. Il faut réaffirmer la place du droit d’auteur et peut-être le faire évoluer pour qu’il soit davantage un droit des auteurs et des autrices. Cesser de prétendre que les auteurs peuvent agir devant le juge pour actionner le mécanisme de révision en cas de rémunération dérisoire, car les délais et le coût de procédure ne le permettent pas.

Deuxième pilier, le statut implique un dialogue social. La Commission le met très bien en avant dans sa réponse du 21 février, le rôle des organisations professionnelles est indispensable, mais elles doivent avoir les moyens de faire leur travail de représentation et de négociation collective, c’est l’équilibre et l’intégrité du dialogue social qui sont en jeu.

Troisième pilier, le statut compte sur une protection sociale efficace et des règles fiscales adaptées, une protection complète contre les accidents du travail, contre les risques de la vie, contre les pertes de revenus et une taxation adaptée pour tenir compte de l’aléa des revenus et de la variabilité des revenus.

Enfin, quatrième pilier, le statut implique une identité professionnelle reconnue et objet de réflexion. L’absence de distinction entre les professionnels et les non-professionnels empêche d’identifier ceux qui ont besoin d’être aidés en tant que professionnels. Les créateurs vont subir des pertes, mais tous ne verront pas leurs conditions d’existence impactées de la même manière.

La reconnaissance d’un statut professionnel ne doit pas être perçue comme un frein à l’innovation, mais plutôt comme une garantie de justice sociale et de respect des droits les plus fondamentaux et un socle indispensable au développement de nos industries culturelles et créatives, parasitées par trois ou quatre groupes mondiaux. À la veille des élections européennes, dont la prévision des résultats inquiète tous les démocrates, partageons l’espoir d’une Europe inclusive, créative, sociale et solidaire !