Une IA de génération vidéo révolutionnaire formée exclusivement sur des films du domaine public

New Video-Generating AI Trained 100 Percent on Public Domain Films

Une IA de génération vidéo révolutionnaire formée exclusivement sur des films du domaine public

Les intelligences artificielles génératrices de vidéos font partie des technologies les plus controversées. Ces algorithmes complexes, qui assemblent des millions de données pour produire de courtes séquences vidéo, sont généralement entraînés sur du matériel protégé par des droits d'auteur, soulevant d'importantes questions éthiques et juridiques. (Sans même mentionner l'énergie colossale nécessaire à la synthèse vidéo par IA.) Les milliardaires de la tech affirment souvent que cette pratique est inévitable – pour développer l'IA, il faudrait nécessairement lui fournir des livres, de la musique et des vidéos sous copyright. Cependant, une startup californienne prouve le contraire.

Moonvalley, une jeune pousse basée à Los Angeles, propose un modèle de synthèse vidéo 'conscient en 3D' entièrement formé sur des films du domaine public. Son produit phare, Marey, lancé en version limitée en mars, est désormais accessible au grand public via un système de crédits, comme le rapporte TechCrunch. L'entreprise attire l'attention de poids lourds du cinéma, comme Ed Ulbrich, artiste VFX et producteur ayant travaillé sur 'Titanic', 'Benjamin Button' et 'Top Gun : Maverick'.

Engagé en juin comme interlocuteur auprès des studios, Ulbrich a été séduit par le 'modèle propre' de Moonvalley. Initialement sceptique face à l'IA générative, il explique que l'approche éthique de la startup a changé son opinion. 'Ce qui m'a convaincu, c'est l'idée d'un modèle éthique, formé légalement, sans pixels volés ni moissonnage sauvage sur internet', a-t-il déclaré à Deadline. 'C'est fait proprement. Et c'est crucial que cela existe.'

D'autres initiatives similaires émergent. En juin, une équipe de chercheurs a entraîné un modèle linguistique (LLM) sur des données libres de droits, démontrant qu'il est possible de créer une IA conversationnelle sans recourir à des millions de livres piratés. Un travail titanesque – huit téraoctets de données analysés deux fois (l'équivalent de 1 685 461 Bibles) – mais qui a produit un LLM rivalisant avec les modèles Llama 1 et 2 7B de Meta, certes anciens mais performants.

Si la provenance des données de Moonvalley reste à vérifier, cette approche pourrait contredire l'argument des géants tech sur la 'nécessité' de piller des données protégées. Une lueur d'espoir pour une IA plus éthique.

AI tạo video đột phá: 100% đào tạo từ phim thuộc phạm vi công cộng

Trí tuệ nhân tạo tạo video là một trong những công nghệ gây tranh cãi nhất hiện nay. Các thuật toán phức tạp này, kết hợp hàng triệu điểm dữ liệu để tạo ra những đoạn video ngắn, thường được đào tạo trên nội dung có bản quyền, dẫn đến nhiều lo ngại về đạo đức và pháp lý. (Chưa kể đến lượng năng lượng khổng lồ để tổng hợp video bằng AI.) Các tỷ phú công nghệ thường biện minh rằng đây là điều bắt buộc – muốn có AI thì phải 'nuôi' nó bằng sách, nhạc và video có bản quyền. Tuy nhiên, một nhóm nghiên cứu đang chứng minh điều ngược lại.

Moonvalley, startup AI tại Los Angeles, đã phát triển mô hình tổng hợp video 'nhận thức 3D' được đào tạo hoàn toàn từ phim thuộc phạm vi công cộng. Sản phẩm chủ lực Marey ra mắt phiên bản giới hạn vào tháng 3, nay đã chính thức mở cửa cho công chúng với hệ thống trả phí theo credit, TechCrunch đưa tin. Công ty thu hút sự chú ý của nhiều tên tuổi lớn trong làng phim, như Ed Ulbrich – chuyên gia hiệu ứng hình ảnh từng tham gia 'Titanic', 'Benjamin Button' và 'Top Gun: Maverick'.

Được Moonvalley mời làm cầu nối với các hãng phim từ tháng 6, Ulbrich bị thuyết phục bởi 'mô hình sạch' của họ. Từng chỉ trích AI generative, ông thừa nhận cách tiếp cận này đã thay đổi quan điểm. 'Điều khiến tôi ấn tượng chính là triết lý đào tạo AI bằng nguồn dữ liệu hợp pháp, minh bạch', Ulbrich chia sẻ với Deadline. 'Không đánh cắp pixel, không cào dữ liệu lậu. Cách làm này cực kỳ quan trọng.'

Các dự án tương tự cũng xuất hiện ở lĩnh vực khác. Tháng 6/2024, nhóm 20+ nhà nghiên cứu đã huấn luyện mô hình ngôn ngữ lớn (LLM) bằng dữ liệu miễn phí bản quyền, chứng minh rằng không cần hàng triệu cuốn sách 'chùa' vẫn xây dựng được chatbot AI. Quá trình tốn hàng nghìn giờ với 8TB dữ liệu (tương đương 1.685.461 cuốn Kinh Thánh) được kiểm tra bản quyền kỹ lưỡng. Kết quả là LLM có thể sánh ngang Meta Llama 1 và 2 7B – dù là phiên bản cũ nhưng vẫn ấn tượng.

Nếu tuyên bố của Moonvalley về nguồn dữ liệu công khai là chính xác, đây sẽ là bằng chứng phản bác lập luận 'thiếu dữ liệu hợp pháp' của các đại gia công nghệ. Một tia hy vọng cho tương lai AI bền vững và đạo đức hơn.