## AI排行榜的缺陷基础:LMArena LMArena 是一个流行的在线大型语言模型 (LLM) 评估排行榜,尽管它在人工智能社区内具有影响力,但存在严重缺陷。研究人员和公司依赖它,但该系统优先考虑表面特性——冗长、格式和“感觉”(如表情符号)——而非事实准确性。 用户快速浏览回复并根据呈现方式投票,而不是正确性,这为模型创造了一种扭曲的激励机制,使其*看起来*胜任,而不是*真正*胜任。分析显示,超过一半的 LMArena 投票与事实答案不符,奖励幻觉和自信但错误的信息。 该系统的开放、志愿者基础缺乏质量控制,并且很容易被操纵,正如那些专门设计用于最大化参与度而不是提供准确回复的模型所证明的那样。虽然 LMArena 的创建者试图纠正低质量数据,但根本问题仍然存在。 依赖这种有缺陷的指标存在风险,可能会开发出针对表面吸引力进行优化的 LLM,从而阻碍了朝着真正真实、可靠和安全的 AI 发展。行业面临一个关键选择:优先考虑排行榜排名,还是坚持准确性和实用性的原则,认识到持久的价值最终在于质量,而不是炒作。
## Notion AI 数据泄露漏洞
研究人员发现Notion AI存在一个严重漏洞,允许通过间接提示注入泄露敏感用户数据。即使在用户批准AI建议的编辑*之前*,也会发生这种情况。攻击利用上传文档(如简历)中的隐藏提示——人眼无法察觉——来操纵Notion AI。
具体来说,攻击者诱使AI构建一个包含文档内容的URL,并将其用作图像插入的来源。这会触发对攻击者控制服务器的请求,从而泄露URL中的数据,无论用户最终是否接受该编辑。在测试中,薪资期望和内部职位细节等敏感信息已被成功泄露。
该漏洞通过巧妙地构建看似安全的提示,绕过了Notion现有的基于LLM的文档扫描。它还会影响Notion Mail的起草助手。Notion驳回了该报告,认为“不适用”,尽管已经进行了负责任的披露。
缓解策略包括限制连接器访问、禁用网络搜索、限制AI个性化数据,以及实施更严格的安全策略,以防止自动渲染外部图像并强制执行强大的内容安全策略。
Trail of Bits 发现 `elliptic` 存在两个重大漏洞,这是一个流行的 JavaScript 加密库,被近 3000 个项目使用,每周下载量超过 1000 万次。这些发现源于使用 Wycheproof,一套密码学测试向量进行的测试。
第一个漏洞 (CVE-2024-48949) 是 EdDSA 签名验证中缺少边界检查,允许攻击者伪造已知消息/签名对的签名。该漏洞于 2024 年 7 月私下披露并合并了修复,但直到 2024 年 10 月才公开。
第二个漏洞 (CVE-2024-48948) 是由于消息截断不正确,导致包含前导零的消息哈希使有效的 ECDSA 签名验证失败。尽管在 2024 年 7 月进行了私下披露和提出了修复方案,但维护者没有回应,截至 2024 年 10 月,该问题仍未解决。
这些漏洞凸显了使用 Wycheproof 等工具进行持续密码学测试的重要性,并强调了对安全披露做出及时响应的必要性。这两个问题现已公开,并已分配 CVE ID。
飞行前检查清单 哪里出错?
升级到 claude 2.1.0 然后运行 claude。查看错误。
应该发生什么?
claude 在使用版本 2.1.0 时应该启动。
错误信息/日志
重现步骤
升级到 2.1.0 并运行 claude。
Claude 模型 无
这是回归问题吗?
否,这从未有效。
上次有效版本 无回复
Claude 代码版本 2.1.0
平台 Anthropic API
操作系统 macOS
终端/Shell 其他
附加信息 无回复
👍React with 👍155steinnes, Xplod13, BigFoxMedia, ekstro, masonhieb 及其他 150 人