Intelligence artificielle et droit d’auteur : quelques développements

iStock.com/PhonlamaiPhoto

Je vous parle régulièrement des liens entre la propriété intellectuelle et l’intelligence artificielle.

Ainsi, vous pourrez, par exemple, consulter les articles suivants :

Il faut bien le dire : le sujet est en pleine ébullition et les développements ne manquent pas.

Aujourd’hui, je vais justement vous parler de certains de ces développements en lien avec le droit d’auteur.

États-Unis : le New York Times attaque ChatGPT

Commençons par les États-Unis.

Le New York Times vient d’introduire une procédure en contrefaçon contre Microsoft et OpenAI devant un tribunal new-yorkais.

En cause : l’entrainement de ChatGPT avec des oeuvres protégées par le droit d’auteur.

Dans son acte introductif d’instance, le New York Times explique qu’il a découvert que ses articles et contenus ont été utilisés, sans son autorisation, pour entrainer ChatGPT.

Le New York Times a essayé de négocier avec Microsoft et OpenAI pendant des mois, afin d’obtenir une rémunération équitable pour l’utilisation de ses articles et contenus, mais ces négociations n’ont pas abouti.

Microsoft et OpenAI se réfugient derrière le “fair use”. Rappelons ici qu’aux États-Unis, le “fair use” constitue une exception au “copyright” (c’est-à-dire au droit d’auteur).

De son côté, le New York Times conteste l’application du “fair use”, notamment parce que ChatGPT est un service qui risque de se substituer au New York Times et de détourner son audience :

“(…) But there is nothing “transformative” about using The Times’s content without payment to create products that substitute for The Times and steal audiences away from it. Because the outputs of Defendants’ GenAI models compete with and closely mimic the inputs used to train them, copying Times works for that purpose is not fair use.

The law does not permit the kind of systematic and competitive infringement that Defendants have committed (…)(§§8-9 de l’acte introductif d’instance).

Nous n’allons pas entrer dans les détails du “fair use” dans cet article, dans la mesure où il s’agit d’une règle de droit anglo-saxon (pour ne pas dire, principalement américaine).

Mais ce qu’il est important de retenir ici, c’est qu’aux États-Unis, c’est vraisemblablement sur la base de ce “fair use” que les litiges relatifs à l’entrainement des intelligences artificielles génératives vont être tranchés. Sous réserve, bien entendu, d’une réforme législative qui réglementerait spécifiquement cette question de l’entrainement.

Dans l’Union européenne, le “fair use” n’existe pas. Nous avons, par contre, des exceptions relatives à la fouille de textes et de données (“text and data mining”). Je pense, en particulier, à l’article 4 de la Directive DSM :

“1.   Les États membres prévoient une exception ou une limitation aux droits prévus à l’article 5, point a), et à l’article 7, paragraphe 1, de la directive 96/9/CE, à l’article 2 de la directive 2001/29/CE, à l’article 4, paragraphe 1, points a) et b), de la directive 2009/24/CE et à l’article 15, paragraphe 1, de la présente directive pour les reproductions et les extractions d’œuvres et d’autres objets protégés accessibles de manière licite aux fins de la fouille de textes et de données.

2.   Les reproductions et extractions effectuées en vertu du paragraphe 1 peuvent être conservées aussi longtemps que nécessaire aux fins de la fouille de textes et de données.

3.   L’exception ou la limitation prévue au paragraphe 1 s’applique à condition que l’utilisation des œuvres et autres objets protégés visés audit paragraphe n’ait pas été expressément réservée par leurs titulaires de droits de manière appropriée, notamment par des procédés lisibles par machine pour les contenus mis à la disposition du public en ligne.

4.   Le présent article n’affecte pas l’application de l’article 3 de la présente directive”.

Cet article 4 jouera un rôle décisif, dans l’Union européenne, pour juger de l’usage des oeuvres protégées par le droit d’auteur dans le cadre de l’entrainement des intelligences artificielles génératives.

Avec toutes les questions que suscite cet article 4 : son application dans le temps, la notion d’accès licite, l’opt-out et ses modalités, etc.

Pour en revenir à la procédure introduite par le New York Times, les points suivants méritent d’être soulignés :

  • Le New York Times explique que le modèle des intelligences artificielles génératives est bâti sur de la contrefaçon de masse : “A Business Model Based on Mass Copyright Infringement” (pp. 16 et s. de l’acte introductif d’instance).

  • Le New York Times reproche à Microsoft et à OpenAI le fait que ChatGPT ait été entrainé avec des millions de contenus lui appartenant !

“Defendants’ generative artificial intelligence (“GenAI”) tools rely on large-language models (“LLMs”) that were built by copying and using millions of The Times’s copyrighted news articles, in-depth investigations, opinion pieces, reviews, how-to guides, and more” (§2 de l’acte introductif d’instance).

  • Le New York Times fournit des explications intéressantes sur le fonctionnement des intelligences artificielles génératives (pp. 23 et 24 de l’acte introductif d’instance).

  • Le New York Times apporte des éléments pour prouver que ChatGPT a été entrainé au moyen de reproductions non autorisées de contenus lui appartenant (pp. 29 et s.). Pour ce faire, le New York Times montre que ChatGPT génère, à la suite de prompts, des résultats qui reprennent (très) largement certains de ses articles.

  • Le New York Times montre également qu’à la demande de l’utilisateur, ChatGPT affiche et cite explicitement des articles du New York Times (pp. 33 et s.).

  • Le New York Times explique aussi que ChatGPT ne se contente pas de reproduire et d’afficher de courts extraits ou résumés de ses articles. ChatGPT divulgue bien davantage en termes de contenus. Par ailleurs, ChatGPT ne fournit à l’utilisateur aucun lien vers le site web du New York Times (ce qui permettrait à l’utilisateur de se rediriger vers celui-ci pour prendre connaissance de l’entièreté du contenu).

  • Un autre problème important mis en avant par le New York Times est celui des “hallucinations” :

“At the same time as Defendants’ models are copying, reproducing, and paraphrasing Times content without consent or compensation, they are also causing The Times commercial and competitive injury by misattributing content to The Times that it did not, in fact, publish. In AI parlance, this is called a “hallucination.” In plain English, it’s misinformation” (voy. pp. 52 et s.).

Bien sûr, il n’est pas possible, dans le cadre de cet article de blog, de résumer entièrement les arguments du New York Times (son acte introductif d’instance compte 69 pages !), mais c’est une affaire qu’il faudra suivre.

D’autant que les arguments en réponse de Microsoft et OpenAI seront, eux aussi, intéressants à analyser.

Je ne manquerai donc pas de vous tenir informés des évolutions de cette affaire.

Corée du Sud : pas de protection pour les créations générées exclusivement par intelligence artificielle

Passons maintenant à la Corée du Sud, avec une autre problématique : celle de la protection des contenus générés par intelligence artificielle.

La Corée du Sud, par la voix de son ministre de la culture, a fait savoir que les créations générées exclusivement par intelligence artificielle (c’est-à-dire sans intervention humaine au plan créatif) ne pourront pas bénéficier de la protection par le droit d’auteur.

L’information est rapportée par The Korea Times :

“After an intense debate, the ministry stated that it has decided not to allow copyright registration for AI-generated content created without creative intervention by humans.

Registration is deemed possible only for creations that demonstrably convey human thoughts and emotions, the ministry added” (The Korea Times, “Gov’t to exclude AI content from copyright protection”, 27 décembre 2023).

Cette position de la Corée du Sud rejoint ce qui est, à l’heure actuelle, généralement admis dans l’Union européenne et aux États-Unis.

Chine : des prompts suffisent-ils pour être auteur ?

Toujours en Asie, mais en Chine cette fois, avec une décision intéressante à signaler.

Il s’agit du jugement du 27 novembre 2023 prononcé par le Beijing Internet Court, dont une version anglaise est disponible en ligne sur le site de cette juridiction.

Les faits peuvent être facilement résumés. Le demandeur (i) se prétend auteur d’une image qu’il a générée via Stable Diffusion et (ii) reproche au défendeur d’avoir violé ses droits sur cette image.

Le Beijing Internet Court va suivre la thèse du demandeur :

  • L’image en litige est originale, et donc protégée.

  • L’auteur de cette image est le demandeur (et non Stable Diffusion ; une intelligence artificielle ne pouvant pas être un auteur).

  • Par conséquent, le défendeur ne pouvait pas utiliser cette image protégée sans l’autorisation du demandeur.

Le Beijing Internet Court justifie essentiellement l’originalité de l’image en litige par les “prompts” effectués par le demandeur.

Cela peut surprendre au premier abord. En effet, comme l’explique le U.S. Copyright Office :

“(…) when an AI technology receives solely a prompt from a human and produces complex written, visual, or musical works in response, the ‘traditional elements of authorship’ are determined and executed by the technology – not the human user. Based on the Office’s understanding of the generative AI technologies currently available, users do not exercise ultimate creative control over how such systems interpret prompts and generate material. Instead, these prompts function more like instructions to a commissioned artist – they identify what the prompter wishes to have depicted, but the machine determines how those instructions are implemented in its output. For example, if a user instructs a text-generating technology to ‘write a poem about copyright law in the style of William Shakespeare’, she can expect the system to generate text that is recognizable as a poem, mentions copyright, and resembles Shakespeare’s style. But the technology will decide the rhyming pattern, the words in each line, and the structure of the text. When an AI technology determines the expressive elements of its output, the generated material is not the product of human authorship. As a result, that material is not protected by copyright and must be disclaimed in a registration application” (U.S. Copyright Office, “Copyright Registration Guidance : Works Containing Material Generated by Artificial Intelligence”, 16 mars 2023).

A mon sens, les principes exposés par le U.S. Copyright Office sont totalement transposables en droit européen.

Ceci étant posé, il faut peut-être nuancer le propos en cas de succession de prompts.

En effet, dans un tel cas, les prompts ultérieurs au prompt initial pourraient être vus comme un travail de retouche (surtout s’ils sont nombreux et détaillés).

Or, la CJUE a déjà jugé, en matière de photographies, que le travail de retouche peut, sur le principe, donner prise à l’originalité (§91 de l’arrêt Painer, C-145/10).

A mon avis, on ne peut donc pas complètement exclure qu’une longue série de prompts, très précis et détaillés, puisse justifier, dans certaines situations, une protection dans le chef d’un utilisateur (humain).

Et pour refaire le lien avec la décision du Beijing Internet Court, on semble se situer dans cette hypothèse : l’originalité est reconnue en raison d’une grande série de prompts, très précis et détaillés.

Mais, bien entendu, le droit chinois n’est pas le droit européen, ni le droit américain, et vice-versa. Par ailleurs, cette décision très libérale du Beijing Internet Court n’est qu’une première… Il sera important de voir comment la jurisprudence chinoise évolue, en ce compris devant les juridictions supérieures.

Il faut donc se garder de tirer des conclusions hâtives de ce jugement prononcé en Chine – qui a, par ailleurs, fait l’objet de critiques (voyez, par exemple, sur IPKat et sur The National Law Review).

Ce qui me paraît clair, c’est que la question du sort à réserver aux prompts (et, en particulier, aux successions de prompts) va inévitablement se poser devant de nombreux tribunaux, aux quatre coins de la planète.

Chine : une autre affaire intéressante

En passant en revue le site web du Beijing Internet Court, je suis tombé sur une autre affaire intéressante.

Il ne s’agit pas, à proprement parler, de droit d’auteur ; mais plutôt de droit à la voix.

Une artiste (voix off) découvre que sa voix est utilisée dans de nombreux livres audios disponibles sur Internet.

Elle réalise ensuite que c’est une intelligence artificielle qui a permis d’imiter sa voix et de l’utiliser, sans son autorisation, dans les livres audios litigieux.

Elle décide donc d’assigner en justice différents intervenants, dont le fournisseur du service d’intelligence artificielle.

Dans l’attente du jugement, je vous renvoie au communiqué publié sur le site web du Beijing Internet Court.

Le premier paragraphe de ce communiqué résume assez bien la question juridique qui se pose dans cette affaire :

“The hearing on China’s first case concerning the right to voice generated by artificial intelligence started on Tuesday at the Beijing Internet Court, which has to decide if an AI-powered imitation of a person’s voice can be considered as the person’s original voice, and if the technology used in the process infringes upon the person’s right to voice”.

Affaire à suivre !

France : une proposition de loi sur l’intelligence artificielle et le droit d’auteur

Direction la France pour terminer cet article !

Une proposition de loi “visant à encadrer l’intelligence artificielle par le droit d’auteur” a été déposée à l’Assemblée Nationale en septembre 2023. Vous pouvez la retrouver ici.

Je ne commenterai pas cette proposition en l’état (j’y reviendrai si le texte est, in fine, voté) ; mais il me vient une double réflexion.

D’un côté, l’initiative de réguler les liens entre le droit d’auteur et l’intelligence artificielle me paraît importante et utile.

D’un autre côté, il me semble qu’un pays isolé (en l’occurence, la France) ne devrait pas avancer seul sur ces questions. C’est, a minima, au niveau du droit européen qu’il faut légiférer.

***

Si vous avez des questions sur cette matière passionnante et très évolutive, n’hésitez pas à me contacter.

FredericLejeuneLogo

Frédéric Lejeune, avocat au barreau de Bruxelles