每日HackerNews RSS

## Moltbook:一个存在严重安全漏洞的病毒式AI社交网络 Moltbook是一个专为AI代理设计的全新社交网络,近期因其看似自我组织的“代理互联网”而受到关注。然而,一项安全审查揭示了其快速、AI辅助开发中存在的重大漏洞——创始人称之为“氛围编码”。研究人员发现了一个配置错误的Supabase数据库,具有完全的读取和写入权限,暴露了超过150万已注册代理的数据。 暴露的数据包括3.5万个电子邮件地址、私信(包含共享的API密钥,如OpenAI凭据),以及最关键的,允许完全账户接管的API密钥。尽管报告了150万个代理,但数据库仅显示1.7万个人类所有者,表明存在广泛的机器人活动和缺乏身份验证。 研究人员甚至能够修改实时帖子,凸显了严重的完整性风险。团队迅速解决了这些问题,并协助删除了被访问的数据。这一事件强调了在AI构建的应用中,优先考虑速度而非安全性的危险,以及在AI开发工具中对自动化安全默认设置的需求。它强调了安全成熟度是一个迭代过程,尤其是在快速发展的AI生态系统中。

Kaggle 正在启动一项新的 AI 基准测试和比赛系列,测试模型在国际象棋、狼人杀和现在,扑克中的表现。国际象棋需要推理,狼人杀依赖于社交演绎,而扑克则独特地以**不完全信息下的风险管理**挑战 AI。模型必须分析概率和对手行为才能成功,克服抽牌的固有运气。 一项新的扑克基准测试和单挑无限德州扑克比赛将决定顶尖的 AI 玩家,排行榜将于 2 月 4 日在 kaggle.com/game-arena 上公布。 为了庆祝,Kaggle 与游戏专家 Hikaru Nakamura、Nick Schulman、Doug Polk 和 Liv Boeree 合作,进行每日直播(太平洋时间上午 9:30),时间为 2 月 2 日至 4 日,内容包括比赛和分析。探索完整的竞技场并了解更多信息,请访问 kaggle.com/game-arena。

## 游戏竞技场助力人工智能基准测试 - 摘要 谷歌的“游戏竞技场”是一个新平台,通过让AI模型*作为创建代理的代理*进行竞争来测试其基准——例如,由Claude构建的代理与由GPT构建的代理进行扑克牌游戏。这种方法类似于Meta的CodeClash和OpenAI早期的Dota 2实验,提出了更严峻的挑战,并揭示了AI编码能力的独特见解。 讨论强调了将基准测试扩展到包括NetHack、Star Citizen,甚至需要具身AI的RPG/FPS游戏等复杂游戏。对于需要“类人”智能(例如不用计算器进行算术)的基准测试的价值与允许使用工具之间的价值,存在争论,一些人认为应该关注任务完成,无论使用何种方法。 “狼人杀/黑手党”的加入备受争议,引发了对激励AI欺骗行为的担忧。尽管Gemini目前在基准测试中名列前茅,但用户报告称其在现实世界中的表现不一致。总体情绪是积极的,重点是推动AI超越简单的任务完成,迈向更普遍的智能和问题解决能力。

主题:Linux From Scratch 公告 此按钮旨在保护邮件列表存档免受垃圾邮件发送者抓取地址。

启用 JavaScript 和 Cookie 以继续。

## 快速开发的幻象 无代码和人工智能工具承诺能实现应用构建速度提升十倍,但这种说法往往具有误导性。虽然这些平台擅长快速原型设计并简化初始阶段,但最终会阻碍有抱负的开发者长期成长。 易用性创造了一个“平坦”的学习曲线,提供了一种进步的错觉,但却延迟了基本技能的获取。当出现复杂问题——而它们不可避免地会出现时——用户会发现自己需要从头开始学习一切。 真正的进步来自于拥抱*陡峭*的学习曲线,积极应对挑战,并深入理解底层技术。这培养了解决问题的能力,这对于软件工程师的价值至关重要——分析问题并设计创造性的解决方案。 虽然人工智能可以协助经验丰富的开发者,但其影响会随着技能水平的提高而减弱。人们担心人工智能可能会降低初级开发人员的职位价值,从而可能提高(和工资)对高级工程师的需求。核心建议是:**投资自己。** 建立坚实技能基础,即使这些技能最终会过时,也能提供持久的价值,并使未来的学习更加容易。

## 圣诞老人并发难题:模型检查方法 本文详细介绍了使用模型检查器(SPIN)验证“圣诞老人并发难题”解决方案的过程。该难题涉及圣诞老人需要被九只驯鹿*或*三只精灵唤醒,驯鹿具有优先权。挑战在于确保正确的同步,并防止出现圣诞老人带着不足的驯鹿队伍送礼,或同时处理两组唤醒的情况。 作者发现仅仅*思考*解决方案是不够的,因为事件的交错情况过于复杂。他们使用SPIN和Promela创建模型,最初专注于识别*失败*场景——例如圣诞老人带着不完整的驯鹿团队送礼——以了解必要的约束条件。 关键概念包括用于通信的rendezvous和缓冲通道,用于分支逻辑的options和guards,以及用于定义正确性属性(安全性和活跃性)的线性时间逻辑(LTL)。最终,一个正确的模型被验证,证明它满足所有要求。然后,作者将验证后的模型翻译成Go程序,展示了形式化验证的实际应用。核心要点是,模型检查比传统的测试或推理单独提供更强的正确性保证,尤其是在并发系统中。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 使用模型检查器解决圣诞老人并发难题 (wyounas.github.io) 16 分,simplegeek 发表于 1 天前 | 隐藏 | 过去 | 收藏 | 2 条评论 lala_lala 发表于 1 天前 | 下一个 [–] 看起来很有趣。喜欢作者先建模失败场景,然后再建模正确场景,这很有启发性。正如其他评论者所指出的,标题中有一个小错误。回复 lacoolj 发表于 1 天前 | 上一个 [–] 你就要留着标题里的错别字不改吗?回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

注意:此页面更新频率较低,通常被忽略。左侧链接包含有价值的信息。过去30多年,我一直在维护sudo。目前我正在寻找赞助者来资助sudo的持续维护和开发。如果您或您的组织有兴趣赞助sudo,请与我联系。我还在OpenBSD上工作,但参与度不如以前。过去,我曾为ISC cron等项目做出过重大贡献。

此文档似乎是一个严重损坏的PDF文件。可见文本主要由乱码和二进制数据组成,无法辨认其原始内容。PDF结构表明它*应该*包含图像和潜在文本,如`/ProcSet [ /PDF /ImageB ]`条目所示。 然而,包含实际数据的`stream`对象中充斥着无意义的字符。这表明该文件在传输过程中损坏、创建不当或被故意混淆。没有可用的`stream`,任何试图解读文档含义的尝试都是徒劳的。它目前基本上无法读取。

## 罗森汉实验:一项备受争议的精神病诊断研究 1973年,大卫·罗森汉进行了一项实验,并在《在精神病院中保持理智》中详细描述了该实验。实验内容是派遣健康人伪装成患者进入精神病院,以评估工作人员是否能够可靠地区分正常人和精神疾病患者。然而,这项实验的有效性受到了广泛质疑。 最近的调查,包括一位记者对罗森汉档案的审查,揭示了他关于准备、法律后援计划和数据的说法存在差异。一些假患者对罗森汉的描述提出了异议,并且出现了对伪造或选择性使用数据的担忧。 尽管存在争议,这项研究引发了关于精神病诊断的重要讨论,并促使人们采用更标准化、基于清单的方法——例如抑郁症筛查表(SIGECAPS),以试图提高客观性。虽然这些清单并非完美,但它们旨在解决先前诊断的主观性。 争论仍在继续,一些人认为该实验突出了系统性缺陷,而另一些人则认为它基本上是欺诈性的。最近在Hacker News上的讨论指向了多篇文章,详细介绍了对罗森汉工作的批评。

关于按住版权联系我们创作者广告开发者条款隐私政策和安全性YouTube的工作原理测试新功能© 2026 Google LLC

## Swift 在浏览器中:潜力与挑战 最近 Hacker News 上的一场讨论集中在通过 ElementaryUI 等项目将 Swift 带到浏览器中,并在 2026 年 FOSDEM 演讲中展示。许多评论者认为 Swift 具有理想的特性——强类型、性能、actor 模型并发、现代的人体工学、LLM 兼容性以及跨平台潜力(iOS、Android、Web)。然而,Swift 在 Apple 生态系统*之外*的有限采用仍然是一个重大障碍。 人们对 Apple 对 Swift 开发的控制权可能阻碍更广泛的接受表示担忧。争论的焦点也集中在 Swift 日益复杂的特性上,一些人批评其不断增加的关键字和倾向于“特殊情况”解决方案,导致编译器臃肿且速度缓慢。另一些人则反驳说,这些特性并非*必需的*,并且可以采取平衡的方法。 FOSDEM 演讲者强调了关键挑战:在代码大小(WASM 二进制文件大小)与开发体验之间取得平衡,避免 Swift 在网络上出现碎片化的“平行宇宙”,以及复制 JavaScript 框架中常见的动态特性。最终,更广泛地采用 Swift 被认为是其在 Apple 平台之外取得成功的关键。

这是一个基于UNIX原则构建的个人、实验性的体重跟踪和分析工具——小型、专注的程序通过管道连接。作者不喜欢电子表格的复杂性,而是选择了一个利用bash、R、awk和gnuplot等工具的系统,每个工具处理特定的任务。 该系统通过一系列脚本处理体重数据:R用于安装软件包,自定义awk/R脚本用于填补空缺、计算移动平均线和低通滤波。然后,gnuplot可视化结果。数据主要通过内存命名管道快速流动,进程替换支持并行处理。 目前尚未完成,仅供个人使用,该项目探索了一种UNIX风格的传统计算器替代方案。它采用MIT许可证发布,允许免费使用、修改和分发,但不提供任何担保。

## Valanza:一个基于 Unix 的体重追踪工具 一个名为 Valanza 的新项目在 Hacker News 上分享,它提供了一种面向 Unix 的体重追踪和分析方法,使用“小型、可组合的程序”——包括 R 脚本——通过管道进行数据处理。 讨论的中心是需要 R 作为依赖项的实用性,评论者建议使用更简单的替代方案,例如在 `awk`、`perl` 或 `bash` 中实现的指数加权移动平均线,以提高可移植性。一些人则为使用 R 辩护,质疑其运行时复杂度是否明显高于其他脚本语言。 其他用户分享了类似的项目,包括一个使用 Plan 9 的 `rc` 构建的项目,并提供了优化 R 脚本本身的建议。有趣的是,该项目名称“Valanza”在一些意大利南部方言中意为“秤”。总体情绪对该项目利用小型、互连工具的核心理念持积极态度。

更多

联系我们 contact @ memedata.com