Un juge fédéral donne raison à Anthropic dans un procès sur l'entraînement d'IA avec des livres sans autorisation d'auteurs

A federal judge sides with Anthropic in lawsuit over training AI on books without authors’ permission

Un juge fédéral donne raison à Anthropic dans un procès sur l'entraînement d'IA avec des livres sans autorisation d'auteurs

Le juge fédéral William Alsup a statué qu'Anthropic avait le droit d'entraîner ses modèles d'IA sur des livres publiés sans l'autorisation des auteurs. Cette décision marque la première fois que les tribunaux reconnaissent l'argument des entreprises d'IA selon lequel la doctrine de l'usage loyal peut les exonérer de faute lorsqu'elles utilisent des œuvres protégées par le droit d'auteur pour entraîner des modèles de langage volumineux (LLM).

Cette décision constitue un revers pour les auteurs, artistes et éditeurs qui ont intenté des dizaines de poursuites contre des entreprises comme OpenAI, Meta, Midjourney, Google et d'autres. Bien que le jugement ne garantisse pas que d'autres juges suivront l'exemple du juge Alsup, il établit un précédent pour que les tribunaux prennent parti pour les entreprises technologiques plutôt que pour les créateurs.

Ces procès dépendent souvent de l'interprétation qu'un juge fait de la doctrine de l'usage loyal, une exception notoirement complexe de la loi sur le droit d'auteur qui n'a pas été mise à jour depuis 1976, une époque antérieure à Internet, sans parler des ensembles de données d'entraînement pour l'IA générative. Les décisions sur l'usage loyal prennent en compte l'objectif de l'utilisation (parodie et éducation peuvent être valables), si l'œuvre est reproduite à des fins commerciales (on peut écrire une fanfiction de "Star Wars", mais pas la vendre) et à quel point une œuvre dérivée est transformative par rapport à l'original.

Des entreprises comme Meta ont avancé des arguments similaires sur l'usage loyal pour justifier l'entraînement sur des œuvres protégées, mais avant cette décision, il était moins clair comment les tribunaux se prononceraient. Dans le cas spécifique de Bartz contre Anthropic, le groupe d'auteurs plaignants a également remis en question la manière dont Anthropic a obtenu et stocké leurs œuvres.

Selon la plainte, Anthropic a cherché à créer une "bibliothèque centrale" de "tous les livres du monde" à conserver "pour toujours". Mais des millions de ces livres protégés par le droit d'auteur ont été téléchargés gratuitement sur des sites pirates, ce qui est sans ambiguïté illégal. Bien que le juge ait estimé que l'entraînement sur ces matériaux par Anthropic relevait de l'usage loyal, le tribunal tiendra un procès sur la nature de cette "bibliothèque centrale".

"Nous tiendrons un procès sur les copies piratées utilisées pour créer la bibliothèque centrale d'Anthropic et les dommages qui en résultent", a écrit le juge Alsup dans sa décision. "Le fait qu'Anthropic ait ensuite acheté une copie d'un livre qu'il avait précédemment volé sur Internet ne l'exonérera pas de sa responsabilité pour vol, mais cela pourra influer sur l'étendue des dommages-intérêts statutaires."

Tòa liên bang phán quyết ủng hộ Anthropic trong vụ kiện sử dụng sách không xin phép tác giả để đào tạo AI

Thẩm phán liên bang William Alsup đã phán quyết rằng Anthropic có quyền hợp pháp khi sử dụng các cuốn sách đã xuất bản để đào tạo mô hình AI mà không cần xin phép tác giả. Đây là lần đầu tiên tòa án công nhận lập luận của các công ty AI rằng nguyên tắc sử dụng hợp lý có thể miễn trách nhiệm cho họ khi sử dụng tác phẩm có bản quyền để đào tạo các mô hình ngôn ngữ lớn (LLM).

Phán quyết này là một đòn giáng mạnh vào các tác giả, nghệ sĩ và nhà xuất bản đã khởi kiện hàng loạt vụ án chống lại các công ty như OpenAI, Meta, Midjourney, Google và nhiều công ty khác. Dù phán quyết không đảm bảo các thẩm phán khác sẽ làm theo tiền lệ của Thẩm phán Alsup, nó đặt nền móng cho việc tòa án đứng về phía các công ty công nghệ thay vì giới sáng tạo.

Các vụ kiện này thường phụ thuộc vào cách thẩm phán diễn giải nguyên tắc sử dụng hợp lý - một ngoại lệ phức tạp trong luật bản quyền chưa được cập nhật từ năm 1976, thời kỳ trước khi Internet ra đời, chứ chưa nói đến khái niệm dữ liệu đào tạo AI. Các phán quyết về sử dụng hợp lý xem xét mục đích sử dụng (châm biếm và giáo dục có thể được chấp nhận), việc tái sản xuất có vì lợi nhuận thương mại không (bạn có thể viết truyện fanfic "Star Wars" nhưng không được bán), và mức độ chuyển đổi của tác phẩm phái sinh so với bản gốc.

Các công ty như Meta từng đưa ra lập luận tương tự về sử dụng hợp lý để bảo vệ việc đào tạo AI trên tác phẩm có bản quyền, nhưng trước phán quyết tuần này, vẫn chưa rõ tòa án sẽ nghiêng về hướng nào. Trong vụ án cụ thể Bartz kiện Anthropic, nhóm tác giả nguyên đơn cũng chất vấn cách thức Anthropic thu thập và lưu trữ tác phẩm của họ.

Theo đơn kiện, Anthropic đã cố gắng tạo ra một "thư viện trung tâm" chứa "tất cả sách trên thế giới" để lưu giữ "mãi mãi". Nhưng hàng triệu cuốn sách có bản quyền này đã được tải xuống miễn phí từ các trang web vi phạm bản quyền - hành vi rõ ràng là bất hợp pháp. Dù thẩm phán công nhận việc Anthropic sử dụng dữ liệu này để đào tạo AI là hợp lý, tòa án sẽ mở phiên xét xử về bản chất của "thư viện trung tâm" này.

"Chúng tôi sẽ tổ chức phiên tòa về các bản sao vi phạm bản quyền được dùng để xây dựng thư viện trung tâm của Anthropic và những thiệt hại phát sinh", Thẩm phán Alsup viết trong phán quyết. "Việc Anthropic sau đó mua lại bản sao của cuốn sách mà họ đã lấy trộm từ Internet trước đó sẽ không miễn trừ trách nhiệm pháp lý về hành vi trộm cắp, nhưng có thể ảnh hưởng đến mức bồi thường theo luật định."