每日HackerNews RSS

## 多语言LLM安全护栏评估:摘要 有效评估大型语言模型 (LLM) 需要根据特定语境、语言、任务和领域进行调整。随着开发者越来越依赖定制基准和“安全护栏”——确保安全且符合语境输出的工具,一个关键问题出现了:这些安全护栏是否在不同语言中保持一致性? 本研究结合了Mozilla的多语言AI安全评估和开源`any-guardrail`框架,使用模拟来自寻求庇护者的实际问题的情景,并将其翻译成波斯语,来调查安全护栏的行为。对三种安全护栏(FlowJudge、Glider 和 AnyLLM)进行了测试,分别使用英语和波斯语策略,并将它们的性能与人工评估进行比较。 结果显示存在显著的不一致性。仅基于策略语言(英语 vs. 波斯语),Glider 和 FlowJudge 显示出很大的分数差异,即使语义含义相同。AnyLLM 表现出分类差异。定性分析强调了安全护栏的“幻觉”——捏造信息——和有偏差的假设,尤其是在使用波斯语策略时。 该研究强调需要具有事实核查搜索能力的护栏、为了可靠性进行多次评估,以及针对特定用例(包括语言特定示例)定制的策略。最终,确保对难民等弱势群体的AI安全,需要超越以英语为中心的基准,并优先进行上下文感知、多语言评估。

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 评估多语言、上下文感知的护栏:人道主义LLM用例 (blog.mozilla.ai) 5点 由 benbreen 1小时前 | 隐藏 | 过去的 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

启用 JavaScript 和 Cookie 以继续。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 绘制月球地图:阿波罗变形打印机 (loc.gov) 6点 由 bryanrasmussen 1小时前 | 隐藏 | 过去 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## 嘟嘟嘟乐园:恼怒的庆祝 嘟嘟嘟乐园是东京一家百货商店的临时展览,以一种有趣的方式探索了普遍存在的被激怒的体验。展览的名字直译为“愤怒-愤怒-愤怒”,旨在通过互动展示和游戏将沮丧转化为乐趣。 游客佩戴着带有愤怒吉祥物的腕带,穿梭于各个区域,这些区域专门针对不同的烦恼来源——从米饭洒出这样的小不便,到与手机礼仪相关的常见失败。一个关键的主题围绕着日本血型性格理论,某些区域对特定血型的人“禁止进入”。 展览通过诸如向令人恼怒的场景扔球,以及在屏幕上“战胜”挫折等游戏来鼓励宣泄。作家大岛麻美发现自己竟然被周末加班请求等例子意外地触动,这突显了每个人“敏感点”的不同。 最终,嘟嘟嘟乐园提供了一个轻松的提醒,即每个人都会经历恼怒,而在这些日常挫折中找到幽默感是一种健康的应对方式。展览将持续到2026年2月25日,提供了一个独特的空间来承认和释放那些让我们成为人类的小烦恼。

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 工作 | 提交 登录 去日本的ドドドランド旅行,地球上最令人恼火的地方 (soranews24.com) 5 分,来自 zdw 1小时前 | 隐藏 | 过去的 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## Synthcart 概要 Synthcart是为Atari 2600和7800设计的音乐制作卡带,利用游戏机的内置音效芯片(TIA)生成音乐。它需要一台Atari游戏机、两个键盘控制器(可在eBay或通过定制版本购买 – 电路图在Atariage上),以及一台电视机(或带有调谐器/音频输出的录像机)。 该卡带包含33个预编程的节拍,但由于有限的RAM,直接编辑它们比较困难。然而,源代码可供高级用户修改和创建自定义版本。 可以通过焊接修改(网上有教程,包括8bitdomain套件)或使用录像机的A/V输出获得直接音频输出。与外部设备同步需要手动匹配节奏。存在已停产的MIDI套件,并提供开源设计,供感兴趣的用户进一步集成。Synthcart适用于所有Atari 2600型号,包括Junior,以及7800(可能需要修改才能完全访问声音)。

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 雅达利2600合成器卡带 (qotile.net) 3点 由 harel 1小时前 | 隐藏 | 过去的 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

启用 JavaScript 和 Cookie 以继续。

最近发布了140万封与杰弗里·爱泼斯坦相关的邮件,这在Hacker News上引发了关于新闻业发展趋势的讨论。核心争论在于“公民新闻”——对数据更快、更具创业精神的分析——是否现在与传统机构新闻业竞争,甚至超越了它。 一些人认为,公民记者比传统报道更快地识别出海量数据中的模式,例如晦涩的引用。然而,人们也对得出的结论的准确性表示担忧,提到了“不负责任的”猜测、阴谋论(包括反犹太主义),以及普遍缺乏事实核查。 另一些人则认为政府通过策略性地只发布2%的文件来控制叙事,从而转移注意力。一个关键点是,这种类型的数据泄露有利于那些具备数据分析技能的人,使公民记者在传统方法难以奏效的领域脱颖而出。尽管审查力度加大,一些评论员仍然怀疑会产生实质性的结果。

一款免费的浏览器游戏,挑战你在各种暗黑模式的诱导下,点击“不给小费”。从微小的按钮、道德绑架的弹窗到虚假的加载界面和作弊的滑块——你能逃脱小费屏幕吗?《跳过小费》是对现代小费文化的讽刺。每个结账界面都变成了一台施加罪恶感的机器。这款游戏让你练习说“不”——如果你能找到那个按钮的话。游戏包含30多种受真实小费屏幕启发的暗黑模式,难度逐渐增加,以及不断缩短的计时器。在浏览器中免费游玩——无需下载,无需注册,无需小费。

一场 Hacker News 的讨论围绕着网站 [skipthe.tips](https://skipthe.tips),该网站旨在帮助用户避免预设的小费提示。虽然网站的实现受到称赞,但评论员指出,小费提示中“暗黑模式”的*有效性*并非在于视觉欺骗,而是利用了诸如时间压力、情感投入和认知负荷等心理因素——使简单的选择(小费)更具吸引力。 用户分享了应对小费文化的个人策略,从只在周五给小费到使用公式确保账单金额是整数。一种普遍的情绪是:小费期望已经超出了传统服务场景,许多人正在抵制在以前不需要小费的简单交易中给小费的压力。核心问题在于*避免*小费与直接接受默认选项之间的摩擦增加。

## 电脑的蜂鸣声与调试猫 我最近开始了一个有趣的项目:在本地运行Stable Diffusion生成人工智能图像,以避免订阅费用。成功安装后,生成图像时,我的电脑发出刺耳的蜂鸣声。初步排查陷入了潜在硬件问题的深渊——线圈啸叫、过热、风扇故障——但似乎都没有对症。 这个谜团变得更加复杂,直到我的猫奥利介入。在调查噪音时,奥利猛烈攻击了我的浪涌保护器(实际上是UPS——不间断电源)。结果发现,Stable Diffusion的电力消耗超出了UPS的负荷,触发了它的警报。 我的750W电源正在超出UPS的360W容量!为UPS升级电池解决了问题,消除了疯狂的蜂鸣声。看来我的猫同伴是一位出乎意料的有效调试员,证明猫可能比人工智能对我们的工作构成更大的威胁。

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 一只猫如何调试Stable Diffusion (2023) (dwac.dev) 8 分,lukasgelbmann 1小时前 | 隐藏 | 过去的 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

require ( github.com/aws/aws-sdk-go-v2/config v1.32.766 github.com/aws/aws-sdk-go-v2/feature/s3/manager v1.22.077 github.com/aws/aws-sdk-go-v2/service/dynamodb v1.55.0 github.com/aws/aws-sdk-go-v2/service/ec2 v1.287.0 github.com/aws/aws-sdk-go-v2/service/ec2 v1.288.0 github.com/aws/aws-sdk-go-v2/service/lambda v1.88.0 github.com/aws/aws-sdk-go-v2/service/s3 v1.96.0 github.com/aws/aws-sdk-go-v2/service/s3control v1.68.0 )

## AWS现已支持嵌套虚拟化 AWS已在其服务中添加了对嵌套虚拟化的支持,允许用户在EC2实例中运行虚拟机中的虚拟机。此功能目前在us-west-2区域的全新M8id、C8id和R8id实例类型中可用,可通过主流SDK访问。 该消息引发了关于性能影响的讨论,特别是对于I/O密集型工作负载,因为可能存在MMU开销。一些用户指出,该功能推出较晚,因为其他地方已经存在多年的嵌套虚拟化技术。 然而,此次更新对于微型虚拟机沙箱解决方案等项目(如原始发帖人提到的E2B)意义重大,为应用程序隔离和测试提供了新的可能性。评论中也提出了一些关于旧应用程序成本的担忧。

(Empty input provided. There is nothing to translate.)

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 我的奶奶是联邦调查局特工 – 从数字化童年数小时的录像中学习到的经验 (sampatt.com) 5 分,SamPatt 1小时前 | 隐藏 | 过去 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系方式 搜索:

最近的macOS 26.3更新最初似乎修复了一个博文中强调的窗口调整大小问题。测试应用程序证实了候选发布版中的修复,显示调整大小区域现在正确地遵循了窗口圆角半径——这是对先前方形区域的改进。然而,这项改进也带来了一个缺点:仅垂直/水平调整大小的区域明显变薄,增加了错过点击的机会。 令人惊讶的是,最终的macOS 26版本*移除了*这个修复,恢复到了最初的、存在问题的方形调整大小区域。苹果也更新了发布说明,将该问题状态从“已解决”更改为“已知问题”。 基本上,虽然最初承认了这个问题,但苹果最终发布了一个没有预期解决方案的版本。

Hacker News 的讨论强调了 macOS 窗口调整大小的 frustation。一位被分配使用 MacBook 的 Windows 用户发现这个过程出乎意料地繁琐——实现简单的屏幕布局(例如在 Slack 和浏览器之间分割屏幕)比在 Windows 上花费的时间更长,因为缺乏自动吸附功能。 用户报告需要手动调整窗口大小,他们觉得这个过程不直观。虽然有一些解决方法,例如使用第三方窗口管理器应用程序(如 Rectangle),但总体而言,macOS 上的窗口体验被描述为“笨拙”且与 Windows 中易用性相比显得奇怪。主要抱怨集中在期望基本的窗口拖动就足以调整大小和定位。

更多

联系我们 contact @ memedata.com