Le droit d’auteur à l’épreuve des systèmes d’intelligence artificielle

Décembre 2023

« La machine conduit l’Homme à se spécialiser dans l’humain » disait Jean Fourastié qui avait indéniablement le sens de la formule. Les progrès de l’intelligence artificielle (IA) viennent nous rappeler l’exigence de cette spécialisation. Ce qui fait le propre de l’humain tend à se raréfier si bien que l’on est en droit de se demander si cela ne va pas un jour disparaitre.

Les frontières entre l’humain et la machine se brouillent, mais le droit lui nous réserve encore une place particulière dont il convient de profiter. N’en déplaise à certains, les machines ont beau être bavardes, elles, restent pour l’instant dépourvues de personnalité juridique. Ce privilège, nous ne le partageons qu’avec les personnes morales.

Il y en a un autre encore que nous nous réservions tout à fait. C’est la qualité d’auteur.[1] Certes les personnes morales peuvent être titulaires des droits, mais elles ne sont jamais auteurs.[2] Plus encore, nous sommes une condition intrinsèque à l’existence même de ce droit. Une œuvre pour être protégeable par le droit d’auteur doit être une création intellectuelle portant la personnalité de son créateur[3]. Autrement dit, elle doit nécessairement émaner d’un humain.

À première vue, les œuvres générées par les intelligences artificielles sont donc exclues du champ de protection. C’est notamment ce qu’a retenu l’Office des États-Unis du Copyright (USCO) dans une décision du 21 février 2023.[4]

Pourtant, il est difficile d’en faire une solution générale. Cela serait oublier qu’en pratique des personnes interviennent tout au long du processus de création des systèmes d’IA génératives. Ces personnes influent nécessairement sur les résultats produits par les systèmes d’IA, qu’elles interviennent au moment de sa conception ou au moment de son utilisation. Il est donc légitime de s’interroger sur la potentialité que ces personnes soient les auteurs de ces contenus générés (I).

Les systèmes d’IA génératifs ne sont pas seulement des créatures prolifiques, ils sont aussi des outils voraces. Leur entrainement requiert l’utilisation de bases de données contenant de nombreuses œuvres réalisées par des personnes physiques. Cette utilisation est source de tension entre d’une part les auteurs de ces œuvres, qui voient leurs créations utilisées dans des projets auxquels ils ne sont pas associés, et d’autre part les concepteurs des systèmes d’IA, qui mettent en avant le progrès technique et le développement de nouveaux outils innovants. La Class action lancée contre Microsoft GitHub et Open IA par Matthew Butterick en novembre 2022 et son équipe illustre bien ces conflits au centre duquel se trouve le droit d’auteur (II).

  1. La titularité des droits d’auteur sur les contenus générés par les systèmes d’IA

Il convient d’analyser la possibilité pour le (a) concepteur et, (b) l’utilisateur des systèmes d’IA, d’obtenir une protection au titre du droit d’auteur.

  1. La titularité du concepteur du système d’IA

Il semble tout naturel de s’intéresser à la possibilité pour le concepteur du système d’IA de revendiquer la titularité des droits sur les œuvres générées. Après tout, ils sont déjà titulaires des potentiels droits sur le logiciel sous-jacent s’ils ont développé ce dernier.

Lorsqu’on y réfléchit, la phase de conception implique de nombreux choix aussi bien techniques que conceptuels qui vont impacter les capacités du système d’IA et nécessairement influencer les résultats produits. Le choix des données d’entrainement va notamment jouer un rôle essentiel. Par exemple, les systèmes d’IA génératifs d’images s’entrainent généralement à reconstruire des images dégradées par l’ajout de « bruit » numérique. Le choix des images d’entrainement impacte donc les possibilités créatrices du système d’IA, à tel point que certains voudraient faire des auteurs de ces derniers, les titulaires des droits sur les œuvres générées.  [5]

Comme l’indique le CSPLA dans son rapport, ces choix de conceptions vont déterminer les possibilités du système, lui fixer un cadre créatif.[6] En fonction des possibilités offertes par l’outil, l’utilisateur final n’exercera parfois qu’une influence limitée ou dérisoire sur les résultats générés.[7]

Dans ces conditions, reconnaître que les œuvres générées par le système d’IA portent la personnalité de son concepteur ne parait pas si absurde. Cette possibilité est cependant source de difficulté. Comme le soulève justement le CSPLA, il n’est pas évident d’identifier le concepteur d’un système d’IA. Cette qualité doit-elle revenir au programmeur, à la personne qui détermine les bases de données sur lesquelles le système d’IA va s’entrainer, à la personne qui corrige les erreurs constatées en phase d’entrainement ? Devant cette difficulté, il est probable que les dispositions applicables à l’œuvre collective trouvent à s’appliquer et que la personne morale sous l’initiative de laquelle le système d’IA aura été conçu sera désignée comme titulaire des droits d’auteur.

En pratique, il est également délicat de démontrer le lien entre les choix opérés lors de la conception et le contenu généré, d’autant plus lorsque l’utilisateur peut l’influencer et que le concepteur n’est pas en mesure de prévoir l’ensemble des contenus créé grâce à son outil, ou même de comprendre l’intégralité du « raisonnement » de l’algorithme pour arriver aux résultats produits.

En l’état de la jurisprudence, il paraît peu probable qu’un juge reconnaisse la titularité des droits des œuvres générées au concepteur, faute de pouvoir démonter en quoi l’empreinte de la personnalité ou l’apport intellectuel des concepteurs se retrouvent dans les œuvres générées.

Pour contourner cette difficulté, le rapport du CSPLA propose de s’appuyer sur le mécanisme de l’accession par production permettant au propriétaire d’acquérir les accessoires que produit sa chose. Le titulaire des droits sur le système d’IA pourrait donc par le biais de ce mécanisme se voir reconnaître la titularité des œuvres générées.

Cette possibilité semble pourtant en contradiction avec l’analyse au cas par cas pratiqué jusqu’alors concernant l’originalité des œuvres. Elle limiterait également la possibilité pour l’utilisateur de revendiquer sa paternité sur l’œuvre alors même que ce dernier peut influencer la création, et dans un certain cas, revendiquer légitimement la titularité des droits.

b- La titularité de l’utilisateur du système d’IA

La technique a depuis toujours fait évoluer le processus de création. La question du numérique dans l’œuvre artistique a donc déjà trouvé à s’appliquer en jurisprudence. Les juges ont ainsi pu juger qu’une œuvre générée au moyen d’un système d’information était protégeable à partir du moment où celle-ci était originale.[8] Quel que soit le moyen de création utilisé, le principe reste donc le même. L’œuvre est protégée si elle porte l’empreinte de la personnalité de son auteur.

En théorie, l’utilisateur pourra donc être considéré comme l’auteur d’une œuvre générée par un système d’IA, si ce dernier démontre qu’il a fait des choix créatifs suffisants. La réalisation technique de l’œuvre n’est pas nécessaire pour revendiquer la qualité d’auteur. Il est établi depuis de longue date que l’auteur peut être tout à fait étranger au processus de fabrication de l’œuvre tant que ses directives ont été suffisamment précises pour que la création finale porte l’empreinte de sa personnalité. [9]

Toute la question qui se pose est donc la liberté laissée à l’utilisateur pour influencer la création. Il semble évidemment que si l’utilisateur se contente d’instructions vagues et basiques, il ne pourra prétendre à la qualité d’auteur. Cela sera considéré comme la simple fourniture d’idées, ce qui n’est pas protégeable.[10]

 En revanche l’utilisation d’indications précises, l’originalité de la demande ou encore la démonstration d’itérations successives permettant la démonstration de la recherche d’un résultat final, pourrait constituer des éléments permettant de caractériser l’originalité de la création. Par exemple, la Cour d’Appel de Riom a déduit l’originalité d’une œuvre au regard des choix d’amélioration successifs, notamment de couleurs, de contrastes et de luminosité. [11]

Comme le notent certains auteurs, un raisonnement similaire pourrait trouver à s’appliquer en matière de contenus créés via un système d’IA génératif. En fonction des usages, un travail d’itérations et d’améliorations du contenu généré par le système d’IA est nécessaire avant d’obtenir le contenu désiré. [12]  C’est ce travail qui pourrait permettre de qualifier l’originalité de l’œuvre.

Par ailleurs, il est intéressant de noter que le Code de propriété intellectuelle prévoit une présomption de titularité au profit de la personne sous le nom de laquelle l’œuvre est divulguée. [13] Cette présomption bénéficie aux utilisateurs des systèmes d’IA qui maitrisent le processus de divulgation. En pratique, le moyen de création de l’œuvre ne sera pas forcément connu, l’utilisateur n’était pas tenu d’indiquer que l’œuvre a été générée par un système IA. Dans ces conditions, renverser la présomption pourrait être difficile, voire impossible.

Dans les faits, c’est donc l’utilisateur qui sera souvent considéré comme l’auteur de la création générée par le système d’IA.

Une autre possibilité est que le titulaire du contenu généré soit en réalité l’auteur ou les auteurs des œuvres sur lesquelles le système d’IA s’est entrainé. C’est en tout cas ce qu’il est reproché à Copilote par Matthew Butterick et son équipe qui ont lancé en novembre 2022 une Class Action considérant que Copilot reproduisait des morceaux de codes sources publiés sur Github au mépris du respect des droits d’auteur des développeurs et des licences d’utilisation.

Cette action illustre parfaitement les tensions entre d’un côté les fournisseurs de système d’IA et les créateurs, essentiels au processus de développement d’un système d’IA, mais qui ne sont pas associés à l’exploitation de ce dernier.

  1. L’utilisation des œuvres protégées par les systèmes d’IA

L’utilisation par les systèmes d’IA d’œuvres protégées n’est pas sans poser des questions concernant l’application du droit d’auteur (a) et ses réformes envisagées (b).

  1. Œuvres protégées et entrainement des systèmes d’IA

Les systèmes d’IA génératifs sont des ventres gigantesques qui se nourrissent de millions voire de milliards de données pour se développer. Ces systèmes sont entrainés sur des bases de données publiques qui contiennent de nombreux contenus protégés par le droit d’auteur (image, son, code source, etc.). Leur utilisation pour l’entrainement des algorithmes est une source de tension pour de nombreux artistes, qui considèrent que leur travail est repris alors même qu’ils ne sont pas associés au projet. Ils s’en retournent alors naturellement vers le droit d’auteur qui semble offrir une protection contre l’utilisation non autorisée de leurs œuvres.

Pourtant, si le droit d’auteur est l’allié naturel des artistes, il ne leur permet pas pour autant un contrôle absolu de leur création. Certaines utilisations peuvent être hors champ d’application de ce dernier, ou encore relevé des nombreuses exceptions aux droits des titulaires.

Les auteurs disposent notamment du droit d’autoriser ou d’interdire toute reproduction ou représentation de l’œuvre.[14]  En pratique, il est peu probable qu’une œuvre existante soit recréée par les systèmes d’IA génératif (à l’exception de la génération de code source). Si des similitudes de style peuvent se retrouver, la probabilité que le système d’IA créer un contenu contenant des éléments originaux d’une autre œuvre semble faible. Le cas échéant, il s’agirait alors de la création d’une œuvre dérivée dont l’exploitation serait soumise à l’autorisation de l’auteur de l’œuvre primaire.

La véritable difficulté se pose concernant le droit de reproduction.  Ce droit fait l’objet d’une appréhension large puisqu’il inclut non seulement la reproduction définitive, mais également les reproductions provisoires.[15] Néanmoins le législateur a prévu des exceptions au nombre duquel figure celle relative à la fouille de textes et de données. Cette exception permet, l’analyse d’une œuvre et de ses données, sauf à ce que l’auteur s’y soit opposé. [16]

Elle vise directement l’utilisation des créations dans le cadre d’entrainement de système d’IA. Sans opposition de la part des auteurs, les concepteurs d’IA peuvent donc librement utiliser les œuvres dont ils ont obtenu l’accès de façon licite.

Ce nouveau droit d’Opt-out consacré par la directive de 2019 sur le droit d’auteur et les droits voisins dans le marché unique numérique est une réponse intéressante de la part du législateur pour tenter de trouver un équilibre entre les différentes parties en tension. Pourtant, faute de solution technique simple à disposition des artistes pour exprimer leur souhait, la concrétisation de leur droit est compliquée à mettre en place.

Une autre difficulté concerne la preuve de l’utilisation d’une œuvre par les systèmes d’IA. En effet, tous les concepteurs de système d’IA ne communiquent pas de façon transparente sur les bases de données utilisées afin d’entrainer leur modèle. À défaut de retrouver des éléments originaux de l’œuvre dans les créations du système d’IA la preuve de la reproduction s’avère délicate.  

Devant ces difficultés, les créateurs peuvent toujours se rabattre sur des solutions techniques plus drastiques comme « l’empoissonnement » des algorithmes. Des chercheurs ont en effet mis au point plusieurs algorithmes permettant de modifier les images de façon imperceptible pour les humains, mais rendant l’apprentissage via cette image impossible, voire contreproductive, pour les algorithmes. [17] Ces outils pourraient constituer un moyen efficace de rendre concret l’opt-out en attendant d’autres mesures législatives que certains appellent de leurs vœux.

  1. Vers une réforme du droit d’auteur ?

Les crispations autour de l’utilisation des œuvres dans le cadre de l’apprentissage des systèmes d’IA sont devenues telles que de nombreux acteurs appellent à une réforme du droit d’auteur. En particulier du côté des créateurs qui voient d’un mauvais œil l’utilisation de leur travail à des fins commerciales sans contrepartie.

Une première tentative de réforme du droit d’auteur a donc été lancée le 12 septembre 2023. [18] Elle vise en particulier à établir un cadre de redistribution au profit des auteurs des artistes dont les œuvres sont utilisées. La proposition de loi prévoit que l’exploitation d’une œuvre par un système d’IA est soumise à autorisation des auteurs ou ayants droit. Elle prévoit également que « Lorsque l’œuvre est créée par une intelligence artificielle sans intervention humaine directe, les seuls titulaires des droits sont les auteurs ou ayants droit des œuvres qui ont permis de concevoir ladite œuvre artificielle ».[19]

Dans le cas où ces auteurs ne peuvent être déterminés, une taxe destinée à la valorisation de la création devrait être payée par la société exploitant le système d’IA et dont les fonds seraient gérés par une société de gestion collective. La proposition de loi prévoit également l’obligation d’indiquer lorsque les œuvres ont été générées par un système d’IA.

Cette proposition de loi est loin de tout régler et n’est pas sans poser quelques difficultés. Il convient déjà de noter que les termes concernant les systèmes d’IA ne sont pas harmonisés. On parle tantôt de dispositif d’IA, de logiciel d’IA ou de système d’IA, pour parler de choses identiques ce qui nuit à la clarté du texte et posera inévitablement des questions d’application. Harmoniser les termes avec ceux proposés au travers du règlement de l’IA Act aurait été bienvenu.[20]

La mise en place de ces modifications pourrait également s’avérer difficile notamment concernant l’identification des auteurs ou la répartition des revenus issus de la taxe sur les exploitants de système d’IA. On peut aussi légitimement s’interroger sur le champ d’application de cette taxe et les entreprises qui y seront soumises dans la mesure où les grands acteurs du secteur ne sont pas forcément implantés en France.

Face à ces derniers, une réponse de l’UE semble plus adaptée. Une réglementation concernant les systèmes d’IA est d’ailleurs en discussion depuis 2021. Un accord entre les députés et la Commission vient d’être trouvé début décembre 2023. Cette réglementation, si elle ne s’étend que peu sur le sujet du droit d’auteur, prévoit néanmoins des obligations de transparence. En particulier, le projet de règlement prévoit la mise à disposition par les fournisseurs de certains systèmes d’IA d’une documentation technique incluant notamment les fiches décrivant « les méthodes et techniques d’entraînement et les jeux de données d’entraînement utilisés, et des informations sur leur provenance, leur portée et leurs principales caractéristiques. »[21] Cette obligation, qui pèsera notamment sur les fournisseurs de système d’IA génératifs est un premier jalon vers une plus grande traçabilité des données d’entrainement utilisées. Selon les modalités de sa mise en place et notamment de la profondeur des informations communiquées, cela pourrait à tout le moins permettre d’assurer le suivi du respect de l’opt-out.

L’arrivée en grande pompe des systèmes d’IA est une révolution qui pose plus d’une question juridique. En l’état, le droit d’auteur est suffisamment souple pour offrir une réponse théorique concernant l’encadrement des droits de propriété intellectuelle. Il est à espérer que l’arrivée de nouvelles obligations de transparence puisse permettre d’assurer son effectivité.


[1] Cass. 1re civ., 15 janv. 2015, n° 13-23.566

[2] Art. L.113-5 du Code de Propriété intellectuelle

[3] CJUE, Case C-145/10 – Eva-Maria Painer, para. 88.

[4] USCO,  21 févr. 2023, aff. ID : 1-5GB561K ; SR # VAu001480196 “Zarya of the Dawn »

[5] Proposition de loi n°1630 visant à encadrer l’intelligence artificielle par le droit d’auteur, https://www.assemblee-nationale.fr/dyn/16/textes/l16b1630_proposition-loi

[6] CSPLA, Mission intelligence artificielle et culture, Rapport Final, 27 janvier 2020

[7] P. Samuelson, « Allocating Ownership Rights in Computer-Generated Works »

[8] Cour d’appel de Bordeaux – 31 janvier 2005 n° 03/05512

[9] Cass 1re chambre civile, 6 janvier 2021 – n° 19-14.205

[10] Cass. 1re civ., 8 nov. 1983

[11] CA. Riom, 14 mai 2003,

[12] Hugenholtz, P.B., Quintais, J.P. Copyright and Artificial Creation: Does EU Copyright Law Protect AI-Assisted Output?. IIC 52, 1190–1216 (2021). https://doi.org/10.1007/s40319-021-01115-0

[13] L.133-1 CPI

[14] Art. L.122-1 CPI

[15] Art. 2 Directive 2001/29/CE 

[16] Art. L.122-5, 10° CPI

[17]Charlotte Mauger, Numérama, Comment va-t-on empêcher les IA de voler des images ?, https://www.numerama.com/tech/1569375-comment-va-t-on-empecher-les-ia-de-voler-des-images.html

[18] Proposition de loi n°1630 visant à encadrer l’intelligence artificielle par le droit d’auteur, https://www.assemblee-nationale.fr/dyn/16/textes/l16b1630_proposition-loi

[19] Article 2, Proposition de loi n°1630

[20] Proposition de règlement du parlement européen et du conseil établissant des règles harmonisées concernant l’intelligence artificielle (législation sur l’intelligence artificielle) et modifiant certains actes législatifs de l’union. 2021/0106 (cod).

[21] Annexe IV, Proposition de règlement du Parlement européen et du Conseil établissant des règles harmonisées concernant l’intelligence artificielle (législation sur l’intelligence artificielle) et modifiant certains actes législatifs de l’Union – Orientation générale (6 décembre 2022), 14954/22 + ADD 1

Retour en haut