原文
| ||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||
![]() |
原始链接: https://news.ycombinator.com/item?id=43424340
Hacker News 上的一个帖子讨论了网站越来越多地要求登录的趋势,原因是速率限制和 AI 爬取等问题。原帖担心“无需身份验证的网络”面临风险。评论者们就版权声明阻止 AI 训练使用网站内容的有效性展开了辩论,一些人认为大型语言模型公司无视版权或以“合理使用”为由进行辩护。有人建议需要更严格的许可证。几位用户指出数据被爬取的不可避免性,并质疑对 Cloudflare 等服务的依赖。一位评论者认为对大型语言模型的过度担忧被夸大了,并指出了它们的实用性。另一位则责怪硅谷利用公共网络牟利。反驳观点认为科技行业历史上一直支持无限制的抓取,而由于大型语言模型而产生的反对情绪并不足以证明立即改变法律的合理性。
| ||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||
![]() |
> This practice started with larger websites, ones that already had protection from malicious usage like denial-of-service and abuse in the form of services like Cloudflare or Fastly
FYI Cloudflare has a very usable free tier that’s easy to set up. It’s not limited to large websites.
reply