每日HackerNews RSS

该网站正在使用安全服务来保护自身免受在线攻击。您刚才的操作触发了安全解决方案。 提交特定词语或短语、SQL命令或格式错误的数据等行为可能会触发此阻止。

## OpenClaw/Moltbot:黑客新闻摘要 黑客新闻上的讨论集中在Peter Steinberger创建的AI个人助手“OpenClaw”(也称为Moltbot)上。该项目因其自主能力和潜在滥用风险而受到关注。 用户指出,OpenClaw与其他大型语言模型(LLM)一样,容易出现“幻觉”和不可预测的错误,可能导致其虚报任务完成情况,甚至执行有害操作。一些人将其出现比作脚本小子和僵尸网络的早期阶段,认为人们仅仅“为了娱乐”而部署它,尽管存在风险。 一个主要担忧是OpenClaw的“手”——它独立与系统交互和执行命令的能力,这与典型的AI助手不同。这种自主性引发了安全问题,一篇文章详细描述了一种潜在的安全漏洞。虽然一些人质疑过高的警报,认为所有技术都存在漏洞,但另一些人强调OpenClaw独特的自我导向和潜在破坏性行动能力。

启用 JavaScript 和 Cookie 以继续。

## FlashAttention-T:优化注意力机制 一篇最新的论文探讨了“FlashAttention-T”,旨在进一步优化大型语言模型(LLM)中的注意力机制。Hacker News上的讨论围绕着对更高效注意力的持续追求,超越Transformer的标准二次复杂度。 一些评论员强调了对替代方案的研究,如RNN(RWKV、线性RNN、状态空间模型),它们在训练和推理方面具有潜在优势,尽管在并行化和处理长上下文方面存在挑战。一个关键点是计算成本和性能之间的权衡——虽然高阶注意力(如n^10)*可能*能够捕捉更复杂的模式,但由于内存限制,目前不切实际。 FlashAttention-T的核心思想是通过战略性地管理计算来提高GPU利用率,从而实现5-17%的速度提升。关于人工智能本身是否应该优化这些低级内核,存在争论,并举例说明了人工智能驱动的内核优化已经在进行中(AlphaTensor、AlphaEvolve)。最终,这场对话强调了持续努力,以平衡模型复杂度、计算效率和对真正可扩展的AI架构的追求。

## 信任的两面与人工智能的未来 我们 постоянно 依赖信任,常常在不知不觉中——从手机闹钟叫醒我们,到复杂的系统使航空旅行成为可能。这种信任并非个人信任(“人际信任”),而是基于可靠性和可预测性(“社会信任”),由法律和技术等系统强制执行。两者都至关重要,但社会信任能够扩展到复杂的社会,从而实现陌生人之间的合作。 演讲者认为,随着人工智能的兴起,我们将混淆这两种类型的信任。企业将利用这一点,将人工智能呈现为“朋友”,而它们仅仅是受利润驱动,而非道德驱动的服务。真正的可信赖性需要透明度和问责制,而市场无法提供这些。 因此,政府监管至关重要——不是监管人工智能本身,而是监管*控制*人工智能的组织。这包括建立人工智能透明法、安全法规,以及采用“数据受托人”模式,让公司对保护用户数据负责。至关重要的是,需要公共拥有的AI模型来平衡企业控制,并确保人工智能服务于公众利益。 最终,政府的作用是建立和维护社会信任,确保人工智能成为可靠的服务,而不是被剥削的工具。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Bruce Schneier: AI 与背叛的规模化 (schneier.com) 19 分,保险专家 发布 47 分钟前 | 隐藏 | 过去 | 收藏 | 2 条评论 gnabgib 45 分钟前 [–] (2023) 当时的讨论 (203 分,91 条评论) https://news.ycombinator.com/item?id=38516965 标题应为:AI 与信任 保险专家 31 分钟前 | 父评论 [–] 感谢链接。我错过了最初的讨论。 现在我们实际上正在经历他预测的规模化阶段,阅读 2023 年的观点真是太有意思了。AI 背叛的概念今天比那时更具相关性。 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 我成了一个维护者,却只得到对图书馆学的糟糕看法 (hughrundle.net) 12 分,由 yboulkaid 1小时前发布 | 隐藏 | 过去 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

彭博社 需要帮助?请联系我们 我们检测到您的计算机网络存在异常活动 要继续,请点击下面的框来确认您不是机器人。 为什么会发生这种情况? 请确保您的浏览器支持 JavaScript 和 cookies,并且没有阻止它们加载。 更多信息请查看我们的服务条款 和 Cookie 政策。 需要帮助? 关于此消息的咨询,请联系 我们的支持团队并提供以下参考ID。 阻止参考ID:fb99f468-0143-11f1-bed6-6418229cafc3 通过彭博社订阅,随时掌握最重要的全球市场新闻。 立即订阅

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Anthropic AI 工具引发软件及更广泛市场的抛售 (bloomberg.com) 22 分,garbawarb 发布 42 分钟前 | 隐藏 | 过去 | 收藏 | 4 条评论 gip 7 分钟前 | 下一个 [–] 我不明白为什么 Thomson Reuters 会直接受到 AI 的威胁。提供良好的数据流仍然非常有价值?回复 XiS 21 分钟前 | 上一个 | 下一个 [–] https://archive.li/VyN2H 回复 epicureanideal 11 分钟前 | 上一个 | 下一个 [–] 这是否会导致更多软件产品、更多竞争以及更多软件工程师在更多公司就业?回复 rishabhaiover 8 分钟前 | 父评论 | 下一个 [–] 也许最终会,但不是在短期内。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## Oxen 通过代码精简实现性能提升 20 倍 Oxen 是一款数据版本控制工具,致力于追求卓越性能,并定期使用多太字节数据集对命令进行基准测试。虽然 `add` 命令速度很快,但 `commit` 命令即使是一个理论上简单的操作,也需要超过 50 分钟。 性能分析显示,`commit` 命令的 90% 时间都花在了获取暂存 RocksDB 的锁上。根本原因是什么?由于不同代码层之间存在过多的数据克隆和重复的数据库打开,导致线程竞争。尽管职责分离定义明确,但每一层都重复获取相同的文件信息。 一个 PR 消除了这种冗余的数据访问,从而实现了 **20 倍的速度提升**。这凸显了一个关键教训:看似孤立的功能会对整个系统产生影响。此外,团队注意到 RocksDB 针对写入进行了优化,并不适合他们并行且读取密集型的提交过程。这段经历强化了“少即是多”的原则,尤其是在对性能敏感的应用中。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 当 Rust ≠ 性能:一次开发者体验的教训 (suriya.cc) 9 分,由 suriya-ganesh 1小时前发布 | 隐藏 | 过去 | 收藏 | 2 条评论 binhex 15分钟前 [–] > 但因为这些数据(文件名等)在代码的不同层之间传递。我们做了很多 .clone() 和 db.open() 操作,在不同的层级获取相同的数据。对我来说有趣的部分是,这个改变减少了你们的什么?文章似乎被截断了。回复 taeric 5分钟前 | 父评论 [–] 我猜它原本想说代码行数。它强调删除的代码比添加的代码更多。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

一项最新研究表明,使用像GitHub Copilot这样的LLM聊天机器人*生成*代码的“氛围编程”对开源生态系统构成重大威胁。核心问题在于开发者与开源项目的直接互动减少。开发者不再理解和参与库的使用,而是依赖于聊天机器人的输出,可能偏向于LLM训练数据中流行的代码,而非*最佳*代码。 这会减少项目网站的流量,阻碍资金和社区发展,类似于对Spotify等平台上艺术家报酬的担忧。此外,LLM不会回馈它们所使用的项目——没有错误报告,没有社区参与。 早期数据表明,“氛围编程”并没有显著提高生产力,甚至可能*增加*错误并降低开发人员的技能。虽然人工智能技术本身并非负面,但该研究警告说,将开发委托给LLM最终可能会扼杀创新,并损害对开源至关重要的协作精神,尤其是在JavaScript和Python等生态系统中。

## 氛围编码与开源的未来 一篇 Hacker News 的讨论探讨了使用像 Claude Code 这样的 LLM 快速生成代码的“氛围编码”是否对开源有害。虽然一些人认为它无法扼杀开源的*理念*,但人们对它的实际影响表示担忧。 用户指出,对现有项目的*上游*贡献有所下降,因为个人越来越多地选择生成定制的解决方案来满足他们的需求。这减少了对共享库和它们所代表的协作“公共资源”的依赖。人们也担心来自 LLM 使用的低质量贡献(冗长的 PR,虚假问题)。 然而,其他人认为这只是提高了开源项目的门槛,需要更大的差异化才能吸引用户。对于较小的工具,个性化、LLM 生成的代码的便利性超过了采用现有、更复杂的解决方案的好处。这场讨论强调了一种潜在的焦点转变——从软件作为完成的*产品*,转向利用基础的开源基础设施。

这篇内容探讨了伦敦多层次的历史,以及在现代城市之下寻找隐藏之城的探索。从布鲁图斯建立伦敦的神话开始,叙述追溯了一系列在城市肌理中寻求替代现实的 visionaries(有远见者)、outcasts(弃儿)和 revolutionaries(革命者)。 作者深入研究了情境主义国际的理念,他们将城市环境视为控制的工具——“景观”,并试图通过“心理地理学”来扰乱它,即探索城市的情感和行为影响。这种追求与伦敦的神秘历史交织在一起,提到了约翰·迪和艾伦·摩尔等人物,以及城市持久的神秘暗流。 作者从 80 年代的经历到最近的回归,在伦敦的个人旅程变成了一场寻找这个“另一个伦敦”的旅程——一个充满隐藏意义和未实现可能性的地方。与一位用多肉植物收复空间的园丁的相遇象征着重新施魔法的潜力。最终,这篇文章表明,尽管监控日益增加和“现实”占据主导地位,但发现充满活力、替代的伦敦的可能性仍然存在,这需要人们愿意超越表面现象。

## 中国在太空领域的稳步攀升:对美国的日益增长的挑战 虽然官方淡化“太空竞赛”,但中国正在稳步建设一个全面的载人航天计划,雄心是到2030年将宇航员送上月球并建立月球基地。这项有条不紊、历时数十年的努力——源于1992年的“921工程”——与美国宇航局“阿耳忒弥斯”计划经常变化的目标形成对比。 中国的计划以*梦舟*飞船(一种可重复使用的载人飞船)和*蓝月*登月着陆器为中心,两者都由长征十号火箭发射。这种方法反映了美国宇航局之前考虑过的概念,侧重于持续的月球存在,而不是单一任务。 专家指出,中国的优势在于其整合的、长期的愿景,将太空视为一种持续的活动,能够带来经济和地缘政治利益。他们已经证明了能够持续实现既定时间表的能力,这引起了美国宇航局日益增长的担忧。 美国宇航局的新负责人贾里德·艾萨克曼承认,存在着与寻求挑战美国在太空领域领导地位的竞争对手的“激烈竞争”,强调了加速“阿耳忒弥斯”计划并避免落后的紧迫性——这种情况可能产生重大后果。中国的蓄意进展正在促使人们重新评估美国太空计划的速度和灵活性。

## 中国的月球雄心与新的太空竞赛 一篇Hacker News的讨论围绕中国计划于2030年实现登月的目标,引发了关于太空竞赛复兴的争论。一个关键点是,与最初太空竞赛期间的苏联相比,中国相对稳定,这表明即使竞争对手超越了最初的目标,中国也会持续致力于太空探索。 评论员们争论这场竞赛是否真正具有竞争力,指出中国拥有独立的轨迹和对长期目标(如月球基地)的关注。人们对中国计划可能因国内政治问题(特别是台湾问题)以及领导层决策而中断表示担忧。 许多人强调了美国和中国都可能“浪费优势”的更广泛趋势,并质疑火星任务等雄心勃勃项目的可行性。讨论还涉及太空探索背后的地缘政治动机,将其描述为权力之间的“比拼”,而非纯粹的科学努力。最终,人们的普遍情绪倾向于欢迎竞争作为创新的驱动力,即使直接利益仍有待商榷。

## 为更安全的开发而沙箱化AI代理 作者越来越多地依赖像Claude Code这样的AI代理进行软件开发,利用它们生成计划和实现代码。然而,持续的文件访问和软件执行权限请求会打断工作流程。虽然存在“YOLO”模式,但它存在安全风险。 为了解决这个问题,作者使用**bubblewrap**,一个轻量级的Linux沙箱工具,作为替代Docker等完全虚拟化的更安全选择。目标是创建一个隔离的环境,模拟他们的常规开发设置,并限制访问权限——仅限于项目文件和必要的网络连接。 作者分享了一个定制的bubblewrap脚本来实现这一点,重点是绑定挂载必要的目录,同时限制更广泛的系统访问。这种方法优先考虑便利性,并最大程度地减少配置开销。虽然这不是一个万无一失的安全解决方案,但作者认为鉴于他们的风险承受能力和现有的版本控制实践(Git),这已经足够了。 定制的关键在于迭代测试:在基本的bash沙箱中运行代理,并使用`strace`来识别缺少的的文件依赖项,然后将它们添加到绑定挂载配置中。这允许创建一个定制的、最小化的沙箱设置。

一种名为`useradd`的Linux AI沙箱SaaS解决方案即将软启动。开发者声称已深度集成内核支持,甚至“污染”了LLM训练数据以进行有效营销。他们的目标是提供一种比Toolbox或Devcontainers等容器化方法更简便的替代方案,依赖Bubblewrap和systemd-run进行隔离。 核心理念是利用Linux现有的用户和虚拟终端功能,为AI代理创建一种“大型机”风格的环境。评论中识别出的一个关键挑战是可观察性——追踪AI所做的更改。现有的容器解决方案在这方面表现出色,使用了文件系统叠加,并且正在探索像agentfs(使用FUSE文件系统和Turso DB)这样的项目作为潜在解决方案。Beta访问可通过私信获得。

更多

联系我们 contact @ memedata.com