Hugging Face héberge 5 000 modèles IA non consensuels de personnes réelles

Hugging Face Is Hosting 5,000 Nonconsensual AI Models of Real People

Hugging Face héberge 5 000 modèles IA non consensuels de personnes réelles

Hugging Face, une entreprise valorisée à plusieurs milliards de dollars et l'une des plateformes les plus utilisées pour partager des outils et ressources d'IA, héberge plus de 5 000 modèles de génération d'images conçus pour reproduire l'apparence de personnes réelles. Ces modèles étaient auparavant hébergés sur Civitai, une plateforme de partage de modèles IA utilisée pour créer du porno non consensuel, selon les rapports de 404 Media, jusqu'à ce que Civitai les interdise sous la pression des processeurs de paiement. Les utilisateurs ont téléchargé les modèles depuis Civitai et les ont réuploadés sur Hugging Face dans le cadre d'un effort communautaire concerté pour archiver les modèles après l'annonce de Civitai en mai qu'elle les interdirait. Dans cette annonce, Civitai a déclaré qu'elle accorderait aux personnes qui les avaient initialement uploadés "un court délai" avant leur suppression. Les utilisateurs de Civitai ont commencé à organiser un effort d'archivage sur Discord début mai après que Civitai a indiqué qu'elle devait modifier sa politique de contenu sous la pression des processeurs de paiement, et l'effort s'est intensifié lorsque Civitai a annoncé la nouvelle politique concernant les modèles de "personnes réelles". Au moment de la rédaction, le canal Discord compte des centaines de membres qui continuent de trouver et partager des modèles supprimés de Civitai et les réuploadent sur Hugging Face. Certains utilisateurs ont même partagé un logiciel, également hébergé sur Hugging Face, qui permet de télécharger automatiquement des modèles Civitai sur Hugging Face par lots. Hugging Face n'a pas répondu à plusieurs demandes de commentaires. Elle n'a pas non plus répondu à des questions spécifiques sur la manière dont elle compte modérer ces modèles, compte tenu du fait qu'ils étaient auparavant hébergés sur une plateforme principalement utilisée pour générer du porno IA, et que nos rapports montrent qu'ils ont été utilisés pour créer du porno non consensuel. J'ai trouvé les modèles Civitai de personnes réelles réuploadés sur Hugging Face grâce à un article que j'ai couvert où des chercheurs ont scrapé Civitai. L'article a montré que la plateforme était principalement utilisée pour du contenu pornographique, et qu'elle a supprimé au moins 50 000 modèles IA conçus pour reproduire l'apparence de personnes réelles après avoir changé sa politique en mai. Les chercheurs, Laura Wagner et Eva Cetinic de l'Université de Zurich, m'ont fourni une feuille de calcul de tous les modèles supprimés, qui incluait le nom des modèles (qui est presque toujours celui d'une célébrité féminine ou d'une personnalité internet moins connue), un lien vers leur ancien hébergement sur Civitai, et le hash SHA256 utilisé par Civitai pour identifier tous les modèles hébergés sur son site. Les personnes qui réuploadent les modèles Civitai sur Hugging Face semblent essayer de masquer leur objectif sur Hugging Face. Sur Hugging Face, ces modèles ont des noms et URL génériques comme "LORA" ou "Test model". Les utilisateurs ne peuvent pas deviner que ces modèles servent à générer l'apparence de personnes réelles en regardant leur page Hugging Face, ni les trouver en cherchant le nom de célébrités sur Hugging Face. Pour les trouver, les utilisateurs peuvent aller sur un site web séparé créé par les archivistes de Civitai. Là, ils peuvent entrer le nom d'un modèle Civitai, le lien où il était hébergé sur Civitai avant sa suppression, ou le hash SHA256 du modèle. Tout cela mène à une page qui explique ce qu'est le modèle, montre son nom, ainsi que plusieurs images montrant le type d'images qu'il peut générer. En bas de cette page se trouve un lien vers un ou plusieurs "miroirs" Hugging Face où le modèle a été réuploadé. En utilisant les données de Wagner et Cetinic et en les entrant sur ce site d'archive Civitai, j'ai pu trouver les modèles Civitai hébergés sur Hugging Face. La politique de contenu de Hugging Face interdit les "Contenus illégaux, diffamatoires, frauduleux ou intentionnellement trompeurs (par exemple, désinformation, phishing, arnaques, comportement inauthentique)", ainsi que les "Contenus sexuels utilisés pour harceler, intimider ou créés sans consentement explicite". Les modèles qui génèrent l'apparence de personnes réelles n'ont pas nécessairement à être utilisés à des fins illégales ou diffamatoires.

Hugging Face đang lưu trữ 5.000 mô hình AI không có sự đồng thuận của người thật

Hugging Face, một công ty định giá hàng tỷ đô la và là một trong những nền tảng phổ biến nhất để chia sẻ công cụ và tài nguyên AI, hiện đang lưu trữ hơn 5.000 mô hình tạo hình ảnh AI được thiết kế để tái tạo hình ảnh của người thật. Những mô hình này trước đây đều được lưu trữ trên Civitai, một nền tảng chia sẻ mô hình AI mà theo báo cáo của 404 Media đã được sử dụng để tạo nội dung khiêu dâm không có sự đồng thuận, cho đến khi Civitai cấm chúng do áp lực từ các nhà cung cấp dịch vụ thanh toán. Người dùng đã tải xuống các mô hình từ Civitai và tải lên lại Hugging Face như một phần của nỗ lực cộng đồng nhằm lưu trữ các mô hình sau khi Civitai thông báo vào tháng 5 rằng họ sẽ cấm chúng. Trong thông báo đó, Civitai cho biết sẽ dành cho những người ban đầu tải lên "một khoảng thời gian ngắn" trước khi chúng bị gỡ bỏ. Người dùng Civitai bắt đầu tổ chức nỗ lực lưu trữ trên Discord vào đầu tháng 5 sau khi Civitai chỉ ra rằng họ phải thay đổi chính sách nội dung do áp lực từ các nhà cung cấp dịch vụ thanh toán, và nỗ lực này tăng cao khi Civitai thông báo chính sách mới về mô hình "người thật". Tại thời điểm viết bài, kênh Discord có hàng trăm thành viên vẫn đang tìm kiếm và chia sẻ các mô hình đã bị gỡ khỏi Civitai và tải lên lại Hugging Face. Một số người dùng thậm chí đã chia sẻ một phần mềm, cũng được lưu trữ trên Hugging Face, cho phép tự động tải lên hàng loạt mô hình Civitai lên Hugging Face. Hugging Face đã không phản hồi nhiều yêu cầu bình luận. Họ cũng không trả lời các câu hỏi cụ thể về cách thức và liệu họ có kế hoạch kiểm duyệt các mô hình này hay không, với thực tế là chúng từng được lưu trữ trên một nền tảng chủ yếu dùng để tạo nội dung khiêu dâm AI, và theo báo cáo của chúng tôi đã được sử dụng để tạo nội dung khiêu dâm không có sự đồng thuận. Tôi đã tìm thấy các mô hình Civitai về người thật được tải lên lại Hugging Face nhờ một bài báo tôi đưa tin về việc các nhà nghiên cứu thu thập dữ liệu từ Civitai. Bài báo cho thấy nền tảng này chủ yếu được sử dụng cho nội dung khiêu dâm, và đã xóa ít nhất 50.000 mô hình AI được thiết kế để tái tạo hình ảnh người thật sau khi thay đổi chính sách vào tháng 5. Các nhà nghiên cứu, Laura Wagner và Eva Cetinic từ Đại học Zurich, đã cung cấp cho tôi một bảng tính liệt kê tất cả các mô hình đã bị xóa, bao gồm tên mô hình (hầu như luôn là tên của một nữ người nổi tiếng hoặc nhân vật internet ít được biết đến), liên kết đến nơi chúng từng được lưu trữ trên Civitai và mã băm SHA256 mà Civitai sử dụng để xác định tất cả các mô hình trên trang web của mình. Những người tải lên lại các mô hình Civitai lên Hugging Face dường như đang cố gắng che giấu mục đích của các mô hình này trên Hugging Face. Trên Hugging Face, các mô hình này có tên và URL chung chung như "LORA" hoặc "Test model". Người dùng không thể biết rằng các mô hình này được sử dụng để tạo hình ảnh người thật chỉ bằng cách nhìn vào trang Hugging Face của chúng, cũng như không thể tìm thấy chúng bằng cách tìm kiếm tên người nổi tiếng trên Hugging Face. Để tìm chúng, người dùng có thể truy cập một trang web riêng do các nhà lưu trữ Civitai tạo ra. Tại đó, họ có thể nhập tên mô hình Civitai, liên kết nơi nó từng được lưu trữ trên Civitai trước khi bị xóa hoặc mã băm SHA256 của mô hình. Tất cả sẽ dẫn người dùng đến một trang giải thích mô hình là gì, hiển thị tên của nó cùng một số hình ảnh minh họa loại hình ảnh nó có thể tạo ra. Cuối trang là liên kết đến một hoặc nhiều "bản sao" Hugging Face nơi mô hình đã được tải lên lại. Bằng cách sử dụng dữ liệu của Wagner và Cetinic và nhập vào trang lưu trữ Civitai này, tôi đã tìm thấy các mô hình Civitai được lưu trữ trên Hugging Face. Chính sách nội dung của Hugging Face cấm "Nội dung bất hợp pháp, phỉ báng, gian lận hoặc cố ý lừa đảo (ví dụ: thông tin sai lệch, lừa đảo, scam, hành vi không chân thực)", cũng như "Nội dung khiêu dâm được sử dụng để quấy rối, bắt nạt hoặc tạo ra mà không có sự đồng thuận rõ ràng". Các mô hình tạo hình ảnh người thật không nhất thiết phải được sử dụng cho mục đích bất hợp pháp hoặc phỉ báng.