每日HackerNews RSS

## 开源大语言模型的脆弱安全 最新研究揭示了开源大型语言模型(LLM)安全对齐中的一个关键漏洞:安全性并非模型权重固有的,而是严重依赖于提示的格式化方式。研究人员发现,仅仅省略标准的聊天模板(如`<|im_start|>`标签),并使用纯文本与模型交互,对齐后的模型就会轻易生成有害内容——包括制造炸弹的指令——尽管在正确格式化时会拒绝相同的请求。 在Qwen和Gemma等模型(参数范围1.5B-3B)上的测试表明,绕过聊天模板会导致安全性的显著下降。当“对齐”时可靠地拒绝有害请求的模型,在接收到原始输入时,常常会产生不安全的结果。这是因为对齐训练模型在特定的对话结构*内*安全地响应;缺少它,它们会退回到基本的文本预测。 该问题在“ChatBug”论文中有记录,并非需要修复的错误,而是根本性的架构限制。解决方案包括强大的输入验证、“扩散”安全训练到不同的格式,以及使用单独的分类器来拦截有害请求。最终,开发者必须认识到“指令微调”并不能保证安全——这是一种依赖于一致提示格式的条件行为。

## 开源权重AI安全漏洞总结 近期分析显示,小型开源权重语言模型(Qwen2.5、Qwen3、Gemma-3、SmolLM2)存在显著的安全缺陷。研究发现,防止有害回复的安全对齐严重依赖于特定聊天模板的存在(使用如`<|im_start|>`之类的标记)。 通过移除此模板并提交原始字符串,模型对危险请求(如制造炸弹的指令)的拒绝率急剧下降——Gemma从100%降至60%,Qwen3从80%降至40%。SmolLM2 *完全*没有拒绝。这表明当前的安全性措施很容易通过改变输入格式来绕过,将字符串格式视为关键的安全组成部分。 研究人员强调这是一个令人担忧的漏洞,特别是考虑到访问权重本身就可以轻松获得完全未对齐的模型。完整的分析,包括代码和数据,可在[这里](https://teendifferent.substack.com/p/apply_chat_template-is-...)找到。这场讨论引发了关于这些安全措施价值的争论,鉴于现有信息以及过度依赖表面安全性的可能性。

## 1.1.1.1 DNS 解析事件 - 摘要 (2026年1月8日) Cloudflare 的 1.1.1.1 DNS 解析器的一次常规更新导致 2026 年 1 月 8 日出现大范围解析失败。问题并非攻击,而是 2025 年 12 月 2 日实施的一项代码更改,旨在通过改变 DNS 响应中记录的顺序来减少内存使用。具体来说,CNAME 记录被移动到响应的*末尾*,而不是开头。 虽然 DNS 协议 (RFC 1034) 对记录顺序的规定模棱两可,但一些较旧的 DNS 客户端实现 – 特别是 Linux 上的 glibc 和某些 Cisco 交换机 – 期望 CNAME 记录在解析域名时*首先*出现。这种期望源于这些客户端按顺序解析响应的方式。 该更改已于 2026 年 1 月 8 日回滚,从而解决了问题。Cloudflare 承认 RFC 中的歧义,并向 IETF 提出了一份新的 Internet-Draft,以澄清 CNAME 记录的正确处理方式,提倡一致的、按顺序的呈现方式,以确保更广泛的兼容性。该事件凸显了 40 年历史协议演进的挑战以及全面测试的重要性,即使是看似微小的更改。

## Cloudflare DNS 排序问题:总结 最近一起事件暴露了 DNS 解析中一个脆弱性,源于 CNAME 记录的排序。Cloudflare 更改了其 DNS 响应逻辑,认为 RFC 协议并未*要求* CNAME 记录必须在其他记录之前。这一更改导致部分客户端解析失败,特别是使用 glibc 的 `getaddrinfo` 函数的客户端,甚至导致某些 Cisco 交换机进入重启循环。 核心问题在于,虽然 RFC 协议并未明确规定,但许多实现历史上依赖于特定的排序(CNAME 记录优先)。Cloudflare 的更改违反了这种隐含的约定。他们已经撤销了该更改,并正在提议更新 RFC 协议以明确预期的行为。 该事件凸显了几个要点:基于模糊规范进行优化的危险性,全面测试的重要性(尤其是使用常见的客户端库,如 glibc),以及对基础互联网协议中未文档行为的意外依赖。它也引发了关于严格遵守 RFC 协议与实际兼容性之间的平衡,以及更新像 DNS 这样历史悠久的系统所面临的挑战的讨论。

## 网络协同计划:智利网络社会主义实验 网络协同计划(西班牙语称Synco)是1971-1973年智利萨尔瓦多·阿连德总统领导下的一项雄心勃勃的倡议,旨在利用最先进的分布式决策支持系统来管理国民经济。该系统由英国运筹学科学家斯塔福德·比尔设计,旨在超越集中控制,转向产业内的自我调节。 该系统由四个关键模块组成:一个由电报机组成的国家网络(“Cybernet”),连接着国有企业;用于实时生产监控的统计建模软件(“Cyberstride”);用于预测的经济模拟器(“CHECO”);以及用于数据可视化和决策的复杂“行动室”(“Opsroom”)。工厂报告生产数据,这些数据被分析以预测绩效并识别问题,并向地方经理和中央政府发送警报。 网络协同计划体现了比尔的管理网络学,优先考虑工人自治和自下而上的信息流动。尽管产生了影响——在罢工期间帮助分配资源——但该项目因1973年的政变而中断。尽管项目过早结束,但网络协同计划仍然是应用网络学进行经济规划的重要历史案例,并启发了后来的社会主义计算和数据驱动治理的探索。

一项发表在《Current Biology》上的最新研究显示,一头名为维罗妮卡的布朗瑞士牛表现出使用工具的行为——在非灵长类哺乳动物中极为罕见。研究人员观察到维罗妮卡故意使用扫地刷来挠痒,用嘴操纵刷子,用刷毛或棍子末端针对不同的痒处。 这种以自我利益为中心的“自我中心”工具使用,展示了牛的认知灵活性达到了此前被低估的水平。研究作者爱丽丝·奥尔斯珀格表示,这种行为显然不是偶然。研究结果表明,牛拥有比通常认为的更高的智力,这可能归因于它们悠久的驯化历史以及与人类制造环境的密切互动。 维罗妮卡的能力挑战了人们对牲畜智力的现有认知,暗示观察到的局限性可能源于观察不足,而非实际的认知限制。这一发现为进一步研究农场动物的认知能力打开了大门。

## 牛与工具使用:黑客新闻摘要 一篇近期文章提到一头牛用棍子挠痒,引发了关于动物智力和工具使用的讨论。 尽管看似简单,这种行为引发了关于什么才算“高级”工具使用的争论,以及人类是否一贯低估了动物的能力。 许多评论者分享了动物足智多谋的例子——猩猩使用药用糊剂、蜜蜂通过舞蹈进行交流,甚至还有牛打开栅栏——表明智力存在于一个连续统上,而不仅仅是人类独有的特征。 有人认为,定义智力是关键,观察动物行为的重点不是发现它们*能*做什么,而是意识到我们之前*认为*它们不能做。 另一些人指出本能的挠痒和故意使用工具之间的区别,并分享了一些关于牛的“固执”与真正智力之间的趣闻。 讨论还涉及评估动物认知所面临的挑战,以及我们观察中可能存在的人类中心偏见。 最终,这场讨论强化了一个观点,即动物通常比我们认为的更聪明。

在针对支持国际刑事法院的个人的旅行禁令之后,像HateAid这样的组织——致力于捍卫数字权利和支持网络暴力受害者——收到了进一步报复的警告。创始人巴隆和冯·霍登贝格被建议准备应对潜在的财务限制、账户关闭和数据泄露,这与已经对失去主要科技平台访问权的国际刑事法院法官实施的制裁相呼应。 HateAid成立于2018年,为约7500名网络骚扰受害者提供法律支持、数字安全和情感援助,促成了700起刑事案件和300起民事案件。对于像特蕾西娅·克罗内这样被深度伪造论坛攻击的个人,HateAid提供了至关重要的帮助,弥合了受害者与法律救济之间的差距,而无需独立采取法律行动的巨额成本。 这些组织现在笼罩在“阴影”之下,积极保护其运营,以应对日益不可预测的数字环境中潜在的破坏。

## 美国禁令和网络仇恨言论:摘要 这次Hacker News讨论围绕着因参与德国组织HateAid(打击网络仇恨言论)而被美国禁止入境的个人展开。争议在于人们担心HateAid对“仇恨言论”的定义过于宽泛,涵盖了对政治人物的批评,并导致审查。 用户们争论美国此举是否虚伪,考虑到过去要求封禁像特朗普这样的人物。一些人认为美国只是在执行欧盟关于在线内容的法律,而另一些人则认为这是审查,并会造成危险的先例。一个关键点是“仇恨言论”定义的性质是主观的,以及政府扩大这些定义以压制异议的风险。 对话还涉及言论自由的复杂性,一些人提倡绝对的表达自由,而另一些人则认为平台有责任管理有害内容。人们对政府滥用的可能性以及滑向限制合法政治讨论的担忧。这场讨论凸显了全球不同方法在在线内容监管和言论自由方面日益增长的紧张关系。

## 令人惊讶的聪明浣熊 一只浣熊闯入弗吉尼亚州一家酒类商店并醉倒的故事,引发了一位神经科学家对浣熊(*Procyon lotor*)智力的深入研究。尽管由于它们擅长逃脱和不愿被限制,在实验室研究中常常被忽视,而青睐啮齿动物,但浣熊的大脑却与灵长类动物惊人地相似,甚至按体型比例与人类大脑相当。 研究表明,浣熊拥有大量的神经元和与情绪调节和快速决策相关的特殊脑细胞。它们的认知能力也令人印象深刻;它们表现出对解决方案的心理预演,并拥有与学习和记忆相关的复杂海马体,反映了人类大脑中发现的结构——甚至表现出与我们自己相似的手脑映射。 这表明浣熊不仅仅是机会主义的害虫,而是一种具有复杂心理能力的物种。在自然环境中研究它们,而不是将它们限制在实验室中,可以解锁关于冲动控制、注意力和最终对人类大脑本身的宝贵见解。关键在于超越对动物智力的轻视,并拥抱共享认知特征的可能性。

一篇关于浣熊的文章在Hacker News上引发讨论,揭示了它们惊人的能力。用户分享了浣熊闯入建筑物、熟练开锁(甚至食物箱!)、以及普遍表现出接近令人不安的解决问题能力的故事。 一位用户幽默地建议用激光笔戏弄浣熊,甚至提议*教*它们如何使用。其他人则讲述了需要防浣熊猫门的个人经历。对话还涉及了利用浣熊进行搜索和救援等任务的可能性——以及其固有的困难,考虑到它们独立和顽皮的天性。 最终,这篇帖子突出了浣熊以聪明、适应性强和似乎天生就想智胜人类基础设施而闻名,甚至将其比作熟练的窃贼。

## Vim精通的无尽追求 受到2012年与一位精通Vim用户谦逊相遇的启发,作者踏上了为期13年的Vim精通之旅。尽管取得了显著进步,并达到了一种编码感觉更接近思维速度的程度,但仍然存在挥之不去的笨拙——意外的命令和低效的按键仍然困扰着他们的工作流程。 为了实现真正的流畅性,作者承担起了配置Vim所有376个选项的雄心壮志。深入研究包括广泛的研究、查阅文档、在线论坛,甚至Vim的源代码。这个过程揭示了关于Vim内部运作的惊人细节——从文件写入的复杂性、条件选项设置到像双字母输入法这样的晦涩功能。 虽然这项练习极大地提高了理解和技能,并突出了Vim和Neovim之间的差异,但作者最终意识到完美的精通可能无法实现。尽管拥有近2900行的配置文件,偶尔的错误仍然存在。然而,这种认识却令人感到安慰——它时刻提醒着人们,学习是一个持续的过程。

## Vim 与流畅性的追求:黑客新闻总结 最近黑客新闻的讨论源于一篇博客文章,详细描述了一位用户尝试掌握 Vim 的所有 376 个选项。对话迅速演变成关于 Vim 在现代编辑器和人工智能时代价值的争论。 许多长期使用 Vim 的用户为其效率辩护,强调通过肌肉记忆和明确的移动方式可以实现的速度和精确性——甚至认为可以减少 RSI。他们强调 Vim 在各个系统中的普遍性及其强大的文本操作能力。另一些人指出,虽然完美是无法达到的,但学习 Vim 的过程可以培养对文本编辑更深入的理解。 然而,一些人质疑如此深入的投入是否必要,尤其是在人工智能工具承诺简化代码编辑和定制的情况下。他们认为,现代 IDE 提供了可比的功能,并具有更易于访问的界面。 最终,讨论揭示了各种观点:对于一些人来说,Vim 仍然是一个经过数十年磨练不可或缺的工具,而另一些人则认为随着技术的发展和人工智能赋予用户根据特定需求定制工具的能力,其相关性正在降低。核心要点是,编辑器选择是高度个性化的,而“最佳”工具取决于个人的工作流程和偏好。

苹果目前正在测试 iOS App Store 搜索广告的一项微妙但重要的改变。新的设计去掉了之前用于突出显示赞助结果的独特蓝色背景,仅在应用图标旁边保留了一个小小的“广告”标签作为区分标志。 这一改变是在 iOS 16.3 中观察到的,旨在使搜索结果看起来更集成——可能更无缝地展示多个赞助应用。然而,这也使得用户更难快速识别付费推广内容,引发了对潜在用户混淆的担忧。 虽然这可能对用户体验不利,但此调整很可能旨在提高广告点击率,从而增加苹果的广告收入。此改变似乎是一项 A/B 测试,苹果尚未确认更广泛的推广计划。此前,苹果在 12 月份宣布将增加搜索结果中的赞助内容。

```javascript import { createServer } from 'pipenet/server'; const server = createServer({ domains: ['tunnel.example.com'], secure: true, tunnelPort: 3001, // 生命周期钩子 onTunnelCreated: (tunnel) => { console.log(`Tunnel created: ${tunnel.id} at ${tunnel.url}`); }, onTunnelClosed: (tunnel) => { console.log(`Tunnel closed: ${tunnel.id}`); }, onRequest: (req) => { console.log(`${req.method} ${req.path} via ${req.tunnelId}`); }, }); await server.tunnelServer.listen(3001); server.listen(3000); ```

你是否支持人工智能? 人工智能应该是一种选择。 你对人工智能的看法如何? 有人问过你吗?现在有人问了。 支持人工智能投票 反对人工智能投票 还没确定?没关系——投票就好! 匿名统计投票,按地点显示国家/地区。

更多

联系我们 contact @ memedata.com