每日HackerNews RSS

本文提出了一种新方法来解决大型语言模型 (LLM) 的两个主要局限性:缺乏内省和短暂的认知。它引入了“Sidecar Transformers”(侧车变换器)系统,该系统使用轻量级的编码器-解码器模型将LLM的内部状态(隐藏状态和键/值缓存)压缩成紧凑的潜在表示。其假设是变换器激活位于低维流形上,允许从该潜在空间进行高保真重建。 作者提出并比较了几种用于侧车模型的架构方法,包括特定层、分组和统一的编码器-解码器结构。他们还介绍了一种压缩键/值缓存的专门方法,以应对其独特的挑战。这种压缩技术能够实现新的功能,例如推理回溯、基于思维轨迹的强化学习以及高效的调试。通过允许LLM保存和操作它们的“思维状态”,这种方法促进了更透明、更可控,最终更能自我改进的AI系统。本文设想未来LLM将发展成为能够进行反思性自我改进的审慎认知系统。

一种新方法使用辅助模型将 Transformer 内部状态压缩成紧凑的潜在代码,从而实现潜在的大型语言模型(LLM)自省和回溯能力。Transformer 当前的无状态特性会在每个 token 处理后丢弃宝贵的信息。通过保存可重构的“思维状态”,此方法允许 LLM “重新加载已保存的游戏”并回溯其思维过程。这使得 Transformer 能够在潜在层面上调试错误,探索替代推理路径并优化整个思维轨迹。 这种方法带来了可回溯推理图的概念,实现了精确的回溯和分支。长期来看,这可能发展成为 Transformer 的元认知操作系统,使其能够练习推理、改进认知策略并转移技能。核心转变是从无状态文本生成器转向能够进行反思性自我改进的认知系统。

我在Verizon Call Filter iOS 应用中发现了一个严重的安全性漏洞,允许未授权访问客户通话记录。通过操纵网络请求中的X-Ceq-MDN头部,任何人都可以检索任何Verizon Wireless用户的来电记录,无需身份验证或设备入侵。 该漏洞源于应用未能验证请求的电话号码是否与用户的已验证身份匹配,从而暴露了敏感的通话元数据,例如时间戳和呼叫号码。这些信息可能被用于监控,揭示个人日常活动、人际关系和联系模式,对记者、执法人员和家庭暴力幸存者等个人构成严重风险。 受影响的API端点托管在一个可能与来电显示服务公司Cequint相关的域名上,这引发了对数据安全实践的担忧。我于2025年2月22日向Verizon报告了这个问题,他们迅速确认并在2025年3月25日解决了这个问题。虽然只返回了来电,但通过受影响的Verizon客户访问去电的可能性,可能通过交叉引用扩展到任何Verizon客户的完整通话记录。

Hacker News 最新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 通过Verizon iOS应用入侵数百万美国人的通话记录 (evanconnelly.github.io) voxadam 2小时前 12分 | 隐藏 | 过去 | 收藏 | 1条评论 MPSFounder 4分钟前 [–] 我希望他们为此支付了赏金(> 20k)。否则,在我看来,做正确的事情并不正确。他们的MBA们不会从中吸取教训,而只会将其掩盖。 回复 加入我们,参加6月16日至17日在旧金山举办的AI创业学校! 指导原则 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系我们 搜索:

请启用JavaScript和Cookie以继续

Hacker News 最新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 PaperBench (openai.com) meetpateltech 2小时前 17 分 | 隐藏 | 过去 | 收藏 | 2 条评论 smusamashah 1小时前 | 下一条 [–] 我们在 PaperBench 上评估了几种前沿模型,发现性能最佳的测试代理是带有开源脚手架的 Claude 3.5 Sonnet(新版),其平均复制得分达到 21.0%。 回复 DrillShopper 7分钟前 | 上一条 [–] PaperBench 听起来像是针对最近发布的 GPU 的基准测试软件包。 回复 加入我们 6 月 16-17 日在旧金山举办的 AI 初创公司学校! 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系方式 搜索:

一位开发者完成了看似不可能的任务:在谷歌Pixel Watch 3上运行Windows和Linux。这个项目最初源于无聊和挑战“ARM版Windows”极限的愿望,它利用了这款手表令人惊讶的强大硬件:四核ARM Cortex A53处理器、2GB内存、32GB存储空间,甚至还有支持光线追踪的Adreno 702图形处理器。 这个过程包括提取和修改原版UEFI固件,仔细编辑ACPI表,并巧妙地利用未使用的分区来解决存储空间限制。在更新到Android 15时遇到了一个重大障碍,需要巧妙的变通方法来绕过头部限制。 最终结果是一个功能有限的Windows PE环境(例如,具有功能性的海量存储),开发者承认这是一个未完成的愚人节项目,更像是一个概念验证,而不是一个完善的产品。这项工作可以在WOA-Project的Github组织中找到,具体在mu_seluna_platforms项目下。 除了这项“成就”外,开发者还计划在本周发布Surface Duo更新、针对两款Duo的Linux镜像,并将Windows支持扩展到更多骁龙芯片组。

Hacker News 最新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 在智能手表上运行 ARM 版 Windows (gus33000.me) 22 分,来自 todsacerdoti,2 小时前 | 隐藏 | 过去 | 收藏 | 3 条评论 cjsawyer 48 分钟前 | 下一条 [–] 对双关语的精彩奉献! 回复 p0w3n3d 4 分钟前 | 前一条 | 下一条 [–] 现在安装糖果粉碎传奇吧 回复 boznz 43 分钟前 | 前一条 [–] 太棒了,现在在哪里可以找到 Excel 的副本…… 回复 加入我们,参加 6 月 16-17 日在旧金山举行的 AI 初创公司学校! 指导原则 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系我们 搜索:

Ace是一款新型电脑自动驾驶程序,旨在使用鼠标和键盘操作来自动执行桌面任务。它擅长一系列电脑使用任务,速度极快,在速度和准确性方面都优于现有模型。Ace由软件专家和领域专家在一个包含超过百万个任务的大型数据集上进行训练,模拟人类与屏幕和提示的交互。虽然仍在开发中,偶尔会出错,但Ace的准确性会随着训练资源的增加而提高。Ace的早期研究预览版现已推出,邀请用户亲身体验其功能。团队的目标是通过持续的训练和资源分配来不断提高Ace的智能和能力。

Hacker News 上的一篇帖子讨论了 General Agents 开发的“实时计算机自动驾驶”Ace。一位用户对该产品的性质表示惊讶,而创始人/CEO sherjilozair 则表示愿意回答问题。另一位用户 chews 询问 Ace 是否能够学习金融领域中使用的新的自定义 Java 应用程序,并对如何增强其对陌生应用程序的训练能力感到好奇。xfr 称赞该演示具有突破性意义,并询问了用于实现 Ace 比其他自动化工具性能更优的训练数据和基准测试。该帖子还包含 AI 初创公司学校的宣传横幅。

这位历史学家悲叹当前对学术界的攻击,并以此与1970年Jorge Luis Borges和Herbert A. Simon之间一次引人入胜的对话作类比。这次会面由Simon对Borges的钦佩发起,探讨了文学、哲学、人工智能和机器学习的交叉点。 Borges和Simon讨论了自由意志、决定论以及用计算机模拟人类行为的可能性。Simon主张相容论,认为人类行为如同计算机程序一样,但个体性依然存在。Borges追问了全知存在对行为的可预测性,导致Simon同意基于个体过去,行为是不可避免的。 作者受到这场跨学科对话的启发,设想未来人文科学和STEM领域合作,利用原始资料和先进的语言模型来模拟历史人物和事件。作者个人反思浮现,提及其母亲的日记,暗示未来一个项目:创造其母亲思想和梦境的幽灵AI痕迹,这与Borges-Simon的对话产生了共鸣。作者希望在当今支离破碎的知识景观中,促进更多这样的对话。

一篇关于博尔赫斯与人工智能创始人会面的文章引发了Hacker News的讨论。评论者们辩论着通过汇编博尔赫斯的大量阅读和感官体验数据来创造一个类似博尔赫斯风格的语言模型的可能性。一位评论者认为这个想法类似于斯坦尼斯瓦夫·莱姆的《ไซเบอร์》中一个故事的情节,故事中一个机器人试图模拟世界的进化来创造一个人工智能诗人。其他人则提到了博尔赫斯自己的故事《皮埃尔·梅纳尔,堂吉诃德的作者》作为相关的概念。 一位评论者强烈推荐博尔赫斯的短篇故事,特别是《Tlön, Uqbar, Orbis Tertius》,并认为大型语言模型缺乏真正再现像博尔赫斯这样的作者所需的先验综合知识。他们对比了赫伯特·西蒙的“感觉束”观点和康德的知识论方法。另一位评论者发现博尔赫斯-西蒙的对话很有趣,但鉴于大型语言模型目前的性能,缺乏更深入的见解。

2025年4月2日,Automattic首席执行官Matt Mullenweg宣布公司进行重大重组,裁员16%。这一决定源于在竞争激烈且快速变化的技术环境中,提高生产力、盈利能力和投资能力的需要。 此次重组旨在增强敏捷性,打破内部部门之间的隔阂,提高产品质量,并确保公司的长期财务可行性。受影响的员工将获得遣散费、福利延续、公司笔记本电脑以及求职资源,Automattic也会表达对其的感谢。 Mullenweg强调Automattic致力于在整个过渡期间支持离职和留任的员工,提供Workplace Options和人力资源支持等资源。尽管面临挑战,但他对Automattic的未来充满信心,并强调WordPress和其他产品在使互联网民主化方面的潜力。他敦促员工感谢离职的同事,并专注于未来的工作,并承诺在接下来的几周内提供公司未来发展方向的更多细节。

Hacker News 的热门帖子讨论了 Automattic 的重组公告,但焦点并非公告本身,而是对其背后的猜测和公司内部动态。一位评论者讽刺地暗示 Matt Mullenweg 也受裁员影响,随后有人澄清他并未受影响。一些评论暗示重组背后存在一个有争议的“房间里的大象”。随后的讨论表明,“大象”可能与 Automattic 与 WP Engine 的法律纠纷、WordPress 社区(WP.org 上的 WP 插件)中一些有问题的行为以及内部领导层(可能指的是 Matt Mullenweg)有关。相反,一些评论者也指出了公告中积极的一面——员工可以保留公司笔记本电脑。

请启用JS并禁用任何广告拦截器。

Hacker News 的讨论帖围绕着《纽约时报》一篇文章中介绍的新的纽约地铁线路图展开。评论者们就该示意图设计的优缺点展开了辩论。一些人赞赏其在显示连接和换乘点方面的清晰度,尤其对于不熟悉地铁系统的人来说。也有人提出,可以将实时车站数据整合进来,以实现可定制的地图样式。另一些人则更喜欢旧地图的地理精确性,认为新地图牺牲了距离感。评论中也提到了重新设计带来的无障碍改进是一个积极方面。一位用户提供了《纽约时报》文章的直接链接,方便那些无法访问付费内容的用户。一些人认为移除地理信息与提高清晰度的目标相悖,而另一些人则为这一设计选择辩护,认为其优先考虑的是路线和连接的可视性。该讨论帖突出了在地理现实的呈现与简化地铁系统以方便用户理解之间的矛盾。

Microchip/Atmel SAM系列微控制器的一个漏洞允许攻击者利用电压故障注入绕过JTAG锁定机制。这种攻击方法此前已在SAM E70/S70/V70/V71上得到验证,现在证明对SAM4C32有效,并且可能对许多使用GPNVM位进行安全保护的SAM处理器有效。 关键在于将复位引脚识别为侧信道;在应注入故障的关键上电阶段,它会短暂低电平。电源循环揭示了这种复位线的行为,并与VDDCORE电压波动相关。通过在VDDCORE的这种波动期间注入电压毛刺,可以解锁JTAG。已确认存在漏洞的器件包括SAM4C32、SAM4S2A、E70/S70/V70/V71。使用GPNVM位的处理器(SAM 4E、4N、4S、G51/G54/G55、3X/3A)也可能存在漏洞。该漏洞很可能是一个硬件错误,无法通过固件修复。

Hacker News 最新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Microchip Sam 微控制器中的零日漏洞 (recessim.com) 8 分,来自 BitBangingBytes,42 分钟前 | 隐藏 | 过去 | 收藏 | 1 评论 pvg 15 分钟前 [–] 未展开网址 https://web.archive.org/web/20250402165042/https://wiki.rece... 回复 加入我们,参加 6 月 16-17 日在旧金山举办的 AI 初创公司学校! 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系我们 搜索:

近期研究正在探索付费同行评审对缓解同行评审系统压力的影响。《危重症医学》的实验表明,提供250美元的报酬适度提高了评审接受率(53% 对比 48%),并将评审完成时间缩短了一天,而评审质量并未受到影响。《开放生物学》的研究发现,支付评审员固定报酬或按次付费,并要求快速完成评审时,效果更为显著。虽然这些试验规模较小,但它们为付费同行评审提供了初步数据。一些专家担心可能会对研究质量和实践产生潜在的意外后果,尽管初步结果表明金钱激励的影响有限,研究人员参与同行评审的决定中内在动机可能起着重要作用。

Hacker News 上的一篇讨论帖围绕着 Nature.com 上一篇关于出版商试行付费同行评审的文章展开。一位评论者提到了 YouTube 上一位化学家,他经常发现已发表论文中的问题,例如夸大的产率和细节不足。另一位评论者质疑,对于“深入研究”而言,250 美元的报酬与 Google Answers 等知识市场相比是否划算。这引发了关于匿名来源的评审与专家评审质量的讨论。一位评论者质疑使用随机网站进行评审的保密性,并提出了一种潜在的模式,即低收入国家的大学可以提供评审服务。该讨论帖重点突出了同行评审质量和报酬所面临的挑战以及潜在的解决方案。

更多

联系我们 contact @ memedata.com