Au début de l’été, certains auteurs nord-américains ont déposé
une paire de recours collectifs presque identiques contre OpenAI,
l’accusant d’avoir formation ChatGPT utiliser illégalement des copies pirates
copies pirates de leurs livres. La société a maintenant déposé, pour les deux
une demande de rejet des accusations.
OpenAI
a demandé à un tribunal de district américain en
Californie de rejeter toutes les plaintes sauf une, qui allègue
qu’il y a violation directe du droit d’auteuret qu’OpenAI espère pouvoir réfuter « à un stade ultérieur de la procédure » ;
être en mesure de réfuter « à un stade ultérieur de la procédure ».
Les auteurs avaient formulé d’autres allégations (prétendue violation indirecte
de droit d’auteur, violation du Digital Millennium Copyright Act,
concurrence déloyale, négligence et enrichissement sans cause), qui, selon OpenAI, devraient être retirées des deux procès ;
OpenAI devrait être retirée des deux poursuites car elles sont « infondées » ;
« infondées ».
En particulier, OpenAI affirme que les auteurs ont « mal compris la
portée du droit d’auteurne prenant pas en compte les limitations et
exceptions (y compris l’utilisation licite) qui laissent de la place aux innovations telles que les grands modèles linguistiques qui sont maintenant à l’avant-plan de la scène ;
des innovations telles que les grands modèles de langage qui sont aujourd’hui à l’avant-garde
de l’intelligence artificielle ». En d’autres termes, selon l’entreprise
En d’autres termes, selon la société californienne, si même les livres des auteurs constituent
une « petite partie » de l’énorme ensemble de données sur lequel ChatGPT a été
formé, « l’utilisation de matériel protégé par le droit d’auteur par des innovateurs
de manière transformatrice n’enfreint pas le droit d’auteur ».
OpenAI veut souligner la différence avec ceux qui cherchent à tirer profit
;
directement de la distribution de matériel protégé et que son objectif était plutôt d' »enseigner à ses modèles à dériver le matériel protégé » ;
objectif était plutôt d' »apprendre à ses modèles à dériver les règles de base du langage humain » ;
règles de base du langage humain ». Nous lisons plus loin dans les motions
présentées que la loi sur le droit d’auteur vise à
« promouvoir l’avancement de la science et des arts utiles » en protégeant la
la façon dont les auteurs expriment leurs idées, mais « pas l’idée elle-même, les faits
intégrés dans le message articulé de l’auteur ou les autres éléments constitutifs
briques créatives », qui sont vraisemblablement les éléments des auteurs
qui seraient utiles pour entraîner le modèle ChatGPT.
OpenAI s’appuie sur un précédent relatif à Google Books et déclare que « bien qu’un auteur puisse enregistrer le droit d’auteur de son livre, le droit d’auteur de l’auteur est un droit fondamental ;
» alors qu’un auteur peut enregistrer le droit d’auteur de son livre, les « informations statistiques » relatives aux « fréquences de mots, modèles » ne sont pas enregistrées ;
informations statistiques » relatives à la « fréquence des mots, aux modèles
syntaxiques et les marqueurs thématiques » de ce livre ne relèvent pas de la protection du droit d’auteur ;
de la protection du droit d’auteur. Par conséquent, la création de copies intégrales d’une œuvre protégée par le droit d’auteur ne constitue pas une contrefaçon ;
contrefaçon la création de copies intégrales d’une œuvre en tant qu’étape
préliminaire au développement d’un nouveau produit « non contrefaisant », même si
le nouveau produit « concurrence » l’original.
La stratégie d’OpenAI pour convaincre le tribunal que l’accusation de
;
violation indirecte du droit d’auteur faite par les auteurs est une
« conclusion juridique erronée ». Le principe sur lequel se fondent les
auteurs et signataires du recours collectif que toute production réalisée par
ChatGPT représente un travail dérivé, indépendamment de la présence de toute similitude entre le résultat et le matériel de formation ;
toute similitude entre le résultat et le matériel de formation.
L’entreprise cherche également à prouver qu’il n’y a pas d' »intérêt financier direct » dans ce qui constituerait l’infraction alléguée ;
intérêt financier direct » dans ce qui serait la violation alléguée du droit d’auteur des œuvres des écrivains, puisqu’il n’y aurait pas d’intérêt financier direct ;
droits d’auteur des œuvres des écrivains, puisqu’il n’existerait
aucun « lien de causalité direct entre la violation du droit d’auteur du demandeur
plaignant et tout profit pour (le défendeur) ».
Les auteurs ont également, comme indiqué ci-dessus, accusé OpenAI de la
violation du DMCA lorsque ChatGPT émet une sortie qui copie leurs
œuvres sans spécifier d’informations sur la gestion des droits d’auteur, telles que les noms des auteurs ou les noms des auteurs ;
par exemple les noms des auteurs ou l’année de publication. En fait, selon les
auteurs, ces informations sont intentionnellement supprimées dans le but
de « profiter injustement et de s’attribuer le mérite d’avoir développé
un produit commercial basé sur des reproductions non attribuées de ces
écrits et idées volés ».
OpenAI qualifie ces accusations d' »insuffisantes et dépourvues de toute
explication », notamment sur la manière et les raisons pour lesquelles elle supprimerait les noms des auteurs et les années de publication ;
les raisons pour lesquelles elle supprimerait elle-même les noms des auteurs et les années de publication des livres de sa formation ;
de publication des livres dans ses données d’apprentissage, ou quelles sont les motivations des
auteurs pour le croire. Ce qui est dénoncé par les
auteurs, à savoir que leurs livres ont été « copiés dans leur intégralité depuis
OpenAI », serait en contradiction directe avec les allégations de suppression intentionnelle
;
suppression intentionnelle d’informations sur la gestion des droits d’auteur.
En tout état de cause, OpenAI soutient que « même en supposant que les résultats de
ChatGPT sont des œuvres dérivées, le DMCA n’interdit pas la distribution d’œuvres dérivées sans les informations de gestion des droits d’auteur qui sont nécessaires pour les protéger ;
œuvres dérivées sans les informations de gestion des droits d’auteur qui
accompagnaient l’original », mais n’interdit leur retrait que lorsque vous distribuez des œuvres originales ou des copies de celles-ci ;
distribuer des œuvres originales ou des copies de celles-ci.
Comme nous l’avons dit au début, OpenAI a choisi de répondre à l’accusation de violation directe du droit d’auteur à un stade ultérieur ;
violation directe de la loi sur le droit d’auteur à un stade ultérieur,
laissant ainsi au tribunal le soin de décider si le modèle d’apprentissage
de l’intelligence artificielle est effectivement « coupable » de
de reproduire et de distribuer des œuvres originales ou d’en faire des œuvres dérivées
sans autorisation ou modification suffisante.