Les robots d'IA pillent les bibliothèques, archives et musées : une menace pour le patrimoine culturel en ligne
Une nouvelle étude révèle que les robots d'IA, utilisés pour collecter des données d'entraînement, surchargent les serveurs des bibliothèques, archives, musées et galeries, rendant parfois leurs collections inaccessibles. Publiée aujourd'hui, cette enquête est la première à quantifier ce phénomène qui, dans les pires cas, prive le public de ressources précieuses. Michael Weinberg, auteur du rapport, souligne l'inquiétude grandissante des institutions face à cette menace pour la durabilité de leurs ressources en ligne.
Le rapport, intitulé "Les robots d'IA menacent-ils le patrimoine culturel en ligne ?", a été réalisé par le GLAM-E Lab, une initiative conjointe de l'Université d'Exeter et de NYU Law. Basé sur un sondage auprès de 43 institutions en Europe, Amérique du Nord et Océanie, il révèle que 39 d'entre elles ont constaté une augmentation récente du trafic, attribuée majoritairement aux robots d'IA.
Les comportements de ces robots sont comparés à des attaques DDoS, submergeant les serveurs et obligeant les administrateurs à mettre en place des contre-mesures urgentes. Un répondant a décrit des incidents quotidiens de trois minutes, très perturbants mais non fatals. L'impact varie : certaines collections sont entièrement hors ligne, tandis que d'autres voient seulement certaines sections affectées.
32 institutions ont pris des mesures actives contre ces robots, mais 7 n'ont encore rien fait. Le problème est aggravé par le non-respect du protocole robots.txt par les robots d'IA, rompant ainsi les normes établies du web. Par exemple, l'Université de Caroline du Nord a dû déployer un pare-feu basé sur l'IA après que son catalogue en ligne ait été submergé de trafic.
De nombreuses institutions hésitent à imposer des identifications ou CAPTCHA, craignant de décourager l'accès légitime. Michael Weinberg souligne le manque de ressources humaines pour maintenir ces collections en ligne, même dans les grandes institutions. Le GLAM-E Lab aide les petites et moyennes institutions à mettre leurs ressources en ligne, mais la menace des robots complique leurs missions.