每日HackerNews RSS

请启用 JavaScript 和 Cookie 以继续。

《经济学人》近期报道称,各大人工智能实验室正竞相聘用哲学家,这一消息在黑客新闻(Hacker News)社区引发了激烈讨论。 批评者认为此举主要出于公关目的,质疑这些公司是否真的重视哲学严谨性,还是仅仅想借哲学之名,将人工智能“对齐”到企业利润动机上。许多评论者区分了“哲学”(对现实与伦理的学术研究)和“语境”之间的差异,指出高效的人工智能提示词往往需要对任务背后的“原因”给出清晰解释,而非抽象理论。 技术界用户指出,人工智能实验室正面临复杂的伦理困境,例如义务论与后果论框架之间的冲突,这些框架影响着模型的训练与约束方式。然而,怀疑论者对此持冷嘲热讽的态度,认为聘请哲学家就像是试图在从零开始构建、且缺乏伦理基础的系统上“修补”道德,正如社交媒体公司当年聘请心理学家来增加用户粘性一样。 总而言之,这场讨论反映出人们对人工智能“负信任”未来的普遍焦虑——在这种未来中,客观事实、企业叙事与机器生成内容之间的界限将变得愈发难以辨识。

arXivLabs 是一个让合作者能够直接在我们的网站上开发并分享 arXiv 新功能的框架。与 arXivLabs 合作的个人和组织都认同并接受我们对开放、社区、卓越和用户数据隐私的价值观。arXiv 致力于秉持这些价值观,且仅与遵守这些价值观的合作伙伴进行合作。如果您有能为 arXiv 社区增值的项目想法,请了解更多关于 arXivLabs 的信息。

抱歉。

PostHog 最近对其 SQL 解析器进行了彻底改造,用 Rust 编写的自定义“手写”版本取代了原先由 ANTLR 生成的 C++ 解析器。借助人工智能辅助开发,此次重写在保持实际查询功能完全一致的同时,实现了约 70 倍的速度提升(在生产环境中最高可达 454 倍)。 作者利用多个并行的 Claude Code 会话生成了 1.6 万行的代码库,并以原始的 ANTLR 解析器作为验证的“预言机”。一套完善的开发循环是成功的关键: * **基于属性的测试:** 使用 `Hypothesis` 生成海量的 SQL 排列组合,自动发现边缘情况。 * **自动化反馈:** 将失败的测试持续集成到共享的回归测试套件中,确保修复方案稳健可靠。 * **上下文管理:** 在实现修复前,提示 AI 读取参考语法和源代码,避免了上下文窗口退化问题。 * **影子测试:** 新解析器在生产流量中运行,在全面部署前验证了数百万条查询,确保结果零偏差。 该项目表明,人工智能驱动的开发结合严格的自动化测试,使得高性能、复杂基础设施的维护——过去仅限于专业领域专家——变得更加易于实现且高效。

抱歉。

抱歉,服务器暂时离线。 请稍后再试。

请启用 JavaScript 并关闭广告拦截器

这篇 Hacker News 讨论聚焦于一份报告,称美国国家安全局(NSA)在持续的争议中失去了对 Anthropic 公司“Mythos”AI 模型的使用权限。讨论串突出了几个核心主题: * **能力与炒作:** 用户争论 Mythos 究竟是代表了一种革命性的网络安全威胁,还是仅仅大规模算力扩展的结果。一些人认为其优势在于“串联”微小的漏洞,而另一些人则认为政府声称其“入侵”系统的说法是被夸大了,这反映了内部安全保障的失效,而非 AI 本身的能力。 * **政府越权:** 许多参与者对 NSA 持怀疑态度,一些人认为该事件是一场“公关战”或政治操弄。人们对于政府是否有能力——或意愿——有效地监管或利用此类技术持相当消极的态度。 * **“平庸”工具之争:** 关于 AI 是让能力普及(像计算器一样)还是在侵蚀人类技能,各方观点始终存在分歧。怀疑论者认为当前的 AI 产品是由暗黑用户界面模式和营销驱动的“模拟智能”,而另一些人则将其视为重要的力量倍增器。 * **地缘政治与伦理:** 讨论触及了 AI 开发究竟是“东西方”竞争中至关重要的战略优势,还是一条通往大规模监控和劳动力流离失所的非伦理道路。

OpenAI 发布了其首款与博通(Broadcom)合作研发的定制推理处理器“Jalapeño”。该芯片专为更高效地运行预训练人工智能模型而设计,旨在减少公司对英伟达昂贵 GPU 的依赖。早期测试表明其具备更出色的单位功耗性能,OpenAI 预计这将显著降低实时人工智能任务(如编程助手)的运营成本。 此举标志着 OpenAI 向垂直整合迈出了战略性的一步。通过设计涵盖芯片架构、内存系统和网络连接的自有基础设施,OpenAI 旨在优化其技术栈的每一层。虽然模型预训练等资源密集型任务目前可能仍会继续使用英伟达的硬件,但“Jalapeño”的研发凸显了该公司致力于使其产品更快速、更可靠且更具性价比的决心。最终,掌控底层芯片设计使 OpenAI 能够根据其独特且不断演进的人工智能模型定制硬件,从而在竞争激烈的人工智能部署领域中获得显著的经济优势。

OpenAI 宣布推出其与博通(Broadcom)合作研发的首款定制推理芯片“Jalapeño”。该芯片计划于 2026 年底投入使用,旨在提升运行 AI 模型时的单位功耗性能。 这一消息在 Hacker News 上引发了激烈讨论。持怀疑态度的人质疑 OpenAI 关于“利用其模型加速芯片设计过程”的说法,认为这可能只是“营销噱头”或常规的 AI 辅助编程,而非芯片架构上的革命性突破。另一些人则指出,谷歌和亚马逊等超大规模云厂商长期以来一直与博通合作,由后者负责台积电(TSMC)的产能管理并提供关键的知识产权模块。 讨论还涉及了行业向专用推理硬件转变的趋势。虽然一些用户强调了为极端延迟增益而设计的“固化”硅片模型(如 Taalas)的潜力,但另一些人指出,将硬件锁定在特定模型版本上存在固有局限。此外,人们还对博通在收购后大举削减成本的过往声誉,以及涉及 Cerebras 等参与者的竞争格局表示担忧。归根结底,该项目标志着 OpenAI 正转型为一家像同行一样对其基础设施进行垂直整合的公司,以减少对英伟达等外部供应商的长期依赖。

为了帮助维护者管理激增的开源贡献(自 2023 年以来增长了 3.6 倍),GitHub 现已推出可配置的**拉取请求(Pull Request)限制**功能。 维护者现在可以设定未获得写入权限的用户同时开启的拉取请求数量上限。这有助于鼓励贡献者更加审慎地提交,减少低质量提交带来的“噪音”,并使维护者能够专注于高优先级的工作。用户可以被加入豁免名单,且草稿状态的拉取请求不计入限制。 此功能是帮助项目维护者重获工作流控制权这一更广泛举措的第一步。后续更新包括: * **归档:** 隐藏低质量或垃圾拉取请求的方法。 * **议题(Issue)限制:** 针对传入议题的类似上限设置。 * **更智能的信任信号:** 基于账户注册时长或历史记录的自动豁免规则。 * **跨仓库控制:** 旨在减轻多个项目中大规模垃圾提交的工具。 这些工具旨在平衡开源精神与可持续性,确保维护者能够高效管理积压工作,同时不打击社区进行有意义贡献的积极性。

GitHub 为应对干扰而引入的拉取请求(PR)限制在 Hacker News 上引发了争论。尽管有些人认为这是抵御人工智能生成的垃圾内容和贡献者“扎堆”现象的必要防御手段,但许多用户认为这只是针对深层问题的一种表面修补。 批评者认为,针对单个存储库的限制无法阻止攻击多个项目的垃圾邮件发送者。改进建议包括建立基于声誉的系统、“举报为垃圾内容”工具,或是更先进的 AI 驱动分类方案。 一个反复出现的主题是上游贡献的减少。面对大量低质量、由人工智能生成的“垃圾”内容,许多开发者正逐渐放弃传统的 PR 工作流程,转而使用个人分支(fork)和供应商依赖(vendoring),从而有效地绕过了维护者这一中间人。其他人则认为,核心问题在于开源“社会契约”的瓦解,并建议需要引入基于代币的赏金制度或更好的声誉标记等新模式,以恢复贡献过程的价值。归根结底,虽然用户认可 GitHub 的努力,但大家普遍认为,该平台当前的模式难以适应大规模自动化贡献的现实。

新闻业正处于危机之中,然而许多新闻编辑室却错误地试图通过肤浅的技术或流程调整来解决问题。他们没有重新思考自身的核心价值,反而依赖于错误的假设,例如那种傲慢的观点,即受众——尤其是边缘化群体——是“新闻盲”,需要被教育。 希里什·库尔卡尼(Shirish Kulkarni)的研究表明事实恰恰相反:受众有着极高的洞察力,他们只是在寻找实用的、值得信赖的信息来帮助他们应对生活。该行业的失败之处在于其“象牙塔”式的方法,即专注于向被动的受众进行广播,而不是培养积极的双向社区关系。 由于传统新闻编辑室受到根深蒂固的印刷时代文化和短期商业压力的束缚,它们难以适应。作者认为,大多数传统媒体不太可能改变;相反,新闻业的未来属于那些灵活的新兴组织,它们优先考虑真实的社区参与,并提供当前媒体所忽视的有意义的、以背景为导向的报道。通过建立真正的信任和服务,这些新兴实体有望取代现有的主导机构。

这篇 Hacker News 帖子探讨了现代新闻业面临的身份危机。评论者们争论该行业究竟是商业行为、公共利益还是过时的遗迹,其中出现了几个核心主题: * **商业模式危机:** 传统媒体难以与免费的、由算法驱动的或用户生成的内容竞争。批评者认为,新闻业为了追求点击量已转向煽情主义或“激进主义”,这疏远了受众并侵蚀了信任。 * **“产品”问题:** 参与者对于新闻业是否仍具价值各执一词。一些人认为高质量的报道是一个正在消亡的职业,因为市场偏好廉价且能带来多巴胺的媒体;另一些人则认为失败在于脱离群众的管理层,他们更关注广告技术和搜索引擎优化(SEO),而非真正的社区价值。 * **潜在解决方案:** 建议包括转向独立或垂直领域的新闻报道、增加公共资金投入(以英国广播公司为蓝本),或拥抱新的数字格式。然而,对于任何模式是否能真正做到“不偏不倚”或在两极分化的环境中持续生存,人们仍持高度怀疑态度。 总而言之,舆论共识是:尽管对真相的需求依然存在,但传统机构未能适应变化,而这一领域的“重塑”目前正留给独立的声音和创作者们去完成。

为了降低智能体在实际运行环境中面临的部分提示注入风险,我们在 Gemini 3.5 Flash 的计算机使用功能中采用了针对性的对抗训练。我们还发布了两个可选的企业级保障系统,支持企业实现以下功能:要求用户针对敏感或不可逆的操作进行明确确认;若检测到间接提示注入,则自动停止任务。我们鼓励开发者采取“深度防御”策略,将这些功能与安全沙箱、人工介入验证及严格的访问控制相结合。有关安全措施的更多信息,请参阅我们的最佳实践文档。我们已经看到客户通过计算机使用功能获得了实际价值,以下是部分客户的反馈:

这篇 Hacker News 讨论探讨了用户对谷歌 Gemini 3.5 Flash 的使用体验,重点关注其“计算机使用”功能及整体性能。 用户对该模型的看法存在严重分歧。一些用户反映,Gemini 在处理从 PDF 中提取表格等基础任务时表现吃力,经常陷入错误循环或编造数据。另一些用户则表示进展顺利,认为性能差异可能源于 PDF 的格式问题或特定的提示词工程。 讨论的很大一部分集中在“计算机使用”上,即大语言模型与桌面界面交互的能力。批评者认为该技术目前速度缓慢、安全性不足且容易出错;支持者则将其视为应对缺乏 API 的旧版软件和孤立业务工具的必要变通方案。许多用户对谷歌的生态系统表示不满,理由包括品牌命名混乱(如从 Gemini CLI 到“Antigravity”的更名)、过于严苛且常导致误拒绝的安全护栏,以及认为其与 Claude 等竞争对手相比存在差距。 归根结底,虽然一些人认为 Gemini 3.5 Flash 的速度和成本效益对高频、低复杂度的任务很有用,但其他人仍对其可靠性持怀疑态度,并呼吁提供更好的集成以及更透明、能力更强的智能体工具。

法国游戏公司育碧(Ubisoft)联合创始人克劳德·吉列莫特(Claude Guillemot)于周五去世,享年69岁。据法国媒体报道(援引彭博社消息),吉列莫特在法国度假胜地拉博勒(La Baule)发生的一起坠机事故中遇难。当时机上共有两人,均不幸身亡。 吉列莫特与其四位兄弟于1986年共同创立了育碧。自那时起,该公司发布了《刺客信条》、《孤岛惊魂》、《波斯王子》和《汤姆·克兰西》系列等多款知名游戏。目前,吉列莫特家族仍掌握着育碧的控制权,其兄弟伊夫·吉列莫特(Yves Guillemot)现任公司首席执行官。吉列莫特生前还担任生产游戏及音频配件的吉列莫特公司(Guillemot Corp.)董事长。 育碧在声明中表示:“育碧沉痛获悉集团联合创始人、吉列莫特公司董事长克劳德·吉列莫特在事故中不幸去世的消息。在这个艰难时刻,我们的心与他的家人和亲友同在。目前不再发表其他声明。”

抱歉。

更多

联系我们 contact @ memedata.com