GLAM-E实验室最新报告显示,美术馆、图书馆、档案馆和博物馆(GLAM机构)正面临人工智能机器人大量抓取其内容用于训练AI模型的冲击。这种激进的数据收集行为正在消耗它们的资源,甚至导致服务中断。对43家机构的调查发现,大多数机构都经历了因AI训练机器人导致的流量激增,传统的robots.txt指令已失效。虽然AWS和Cloudflare等解决方案提供了一些防御措施,但并非完全有效。该报告也反映了开放获取资源库、维基媒体基金会和其他在线平台的类似担忧。GLAM-E实验室认为,人工智能公司需要采取更负责任的数据访问方式,因为GLAM机构无法无限期地承担因抵御机器人攻击而维护在线馆藏所带来的不断增加的成本。需要一种可持续的数据获取方法来保护文化遗产的访问。