每日HackerNews RSS

Anthropic的Claude现在正针对COBOL现代化改造,这是一个严重依赖IBM的领域,导致IBM股价大幅下跌。COBOL虽然驱动着关键基础设施,例如美国95%的ATM交易,但却面临着熟练开发人员数量减少和文档过时的困境。 Claude Code提供人工智能驱动的自动化,用于分析和实施COBOL现代化改造,使团队能够专注于战略和风险评估。这种方法使组织能够在不影响可靠性的前提下更新遗留系统。 市场反应强烈,将Claude的能力解读为对IBM有利可图的COBOL相关服务(编码和咨询)的直接威胁。这一事件引发了关于Anthropic的颠覆性更新是否有意或无意地通过市场反应为其运营提供资金,以及OpenAI是否会效仿的质疑。

以下是 Hacker News 讨论的摘要,字数在 200 字以内: 文章讨论了 Anthropic 宣布推出人工智能驱动的 COBOL 代码分析和潜在迁移工具后,IBM 股价下跌的情况。核心争论在于替换关键基础设施(如银行)中数十年历史、稳定的 COBOL 系统是否可行。 许多评论员强调,问题不在于*编写* COBOL,而在于理解和安全地修改庞大而复杂的 COBOL 代码库——这些代码库通常缺乏完善的文档和测试。破坏重要系统的风险超过了潜在的成本节约。几位评论员指出,IBM 大型机稳定可靠是银行继续使用 COBOL 的关键原因。 另一些人认为,Anthropic 的工具并非旨在完全自动化迁移,而是帮助开发人员理解和规划迁移。人们对这种大规模变更涉及的组织障碍和监管要求表示担忧。有人推测这可能会使 IBM 的咨询服务受益,而另一些人则认为这威胁到他们的大型机业务。一个反复出现的主题是替换机构知识的困难以及潜在的灾难性错误。

启用 JavaScript 和 Cookie 以继续。

## 停止扼杀游戏更新:欧盟请愿书进展 一份倡导游戏消费者权益的请愿书,名为“停止扼杀游戏”(SKG),在欧盟正获得进展。该倡议旨在防止发行商在停止支持后使游戏无法游玩,可能通过要求他们发布服务器代码或允许自定义服务器来实现。 这场讨论引发了关于政府干预与个人主动性作用的辩论。一些人认为欧盟的做法适得其反,相信竞争通过独立创作蓬勃发展,而非监管。另一些人则指出,美国的监管格局分散化阻碍了商业发展。 一个核心论点集中在游戏是否应被视为具有持久价值的购买产品,还是作为有限时间的服務。人们对实施SKG的技术复杂性表示担忧,包括许可问题和对开发者的负担。许多人认为消费者应该支持有道德的开发者,并避免那些有关闭游戏历史的公司。 最终,这场运动凸显了游戏行业中计划报废日益增长的挫败感,以及对已购买数字产品更大的消费者控制权的渴望。

## Shufflepuck Cafe 在 Apple II 上的移植之旅 本文详细介绍了 1989 年游戏 *Shufflepuck Cafe* 成功移植到 8 位 Apple II 平台的过程。作者最初缺乏 Apple II 精灵处理经验,先从一个更简单的 *Glider* 移植开始,以建立基础知识。主要挑战包括显示伪 3D 桌面、优化 1MHz 处理器的性能以及管理有限的内存(64KB)。 “3D”效果是通过透视变换和查找表来实现的,以加速计算。精灵缩放是通过预渲染多个精灵版本来处理的。通过利用异或运算来绘制精灵而不是遮罩,用内存换取速度,从而提高了性能。声音通过“减速”技术进行优化,在保持清晰度的同时减小样本大小。 内存限制通过按需加载特定对手的代码和资源、利用压缩以及策略性地管理内存映射来解决。还实现了一种双人串行通信模式,允许进行联网游戏。 尽管缺少一些原始游戏的功能,但作者认为这次移植是成功的,捕捉了 *Shufflepuck Cafe* 的精髓,并增加了多人游戏的功能。该项目的源代码和可下载游戏可在网上找到。

## 拉斯维加斯警察与私人监控资金 2023年,拉斯维加斯都市警察局(LVMPD)开始使用Flock Security的自动车牌识别(ALPR)技术,但其资金来源独特,通过向私人基金会“Metro之友”捐款来资助该项目,从而避免了使用纳税人资金所需的公开讨论。这种安排引发了对透明度和潜在滥用监控系统的担忧,该系统扫描车辆信息并与全国执法机构共享数据。 批评者,包括美国公民自由联盟(ACLU),认为这绕过了民主监督,可能导致根据移民身份、政治信仰或医疗保健选择追踪个人。拉斯维加斯地区的大多数Flock摄像头由Horowitz Family Foundation资助,该基金会是重要的捐助者,最近为摄像头和软件提供了近430万美元的资金,其中包括访问敏感个人数据的功能。 尽管Metro声称其政策可以防止歧视性数据使用,但人们仍然担心无法公开获取这些政策以及潜在的滥用行为,并引用了其他司法管辖区发生的实例。专家警告说,持续的监控会对意识到自身被持续监控的公民产生“寒蝉效应”,并质疑继续依赖私人资金最终是否会给纳税人带来负担。Flock坚持认为其遵守法律搜查令,但因联邦机构(如移民和海关执法局)访问数据而受到审查。

## Sim Sim: 前端负责人 概要 Sim Sim 是一个快速发展的开源平台,赋能超过 7 万开发者使用类似 Figma 的可视化画布构建和部署 AI 代理。 凭借 700 万美元的 A 轮融资,Sim 旨在成为代理工作流的领先工具。 他们正在寻找一位**前端负责人**来负责核心 Sim 平台——可视化代理构建器。 这个基础性角色涉及架构和构建实时画布,确保快速、愉悦且强大的开发者体验。 理想的候选人是一位注重设计的全栈工程师,精通 React 和 TypeScript,并对 UX 充满热情。 他们将负责整个前端体验,从视觉流程创建到部署,在 Next.js monorepo 中工作。 具有复杂 UI(如画布编辑器)的经验以及对性能的关注至关重要。 这是一个能够塑造数千人使用的产品的高影响力机会,在小型、动态的团队中拥有重要的所有权和股权。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 SIM (YC X25) 正在旧金山招聘顶尖工程师 (ycombinator.com) 1天前 | 隐藏 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## 人工智能推理:令人惊讶的洗车测试 最近的测试揭示了人工智能推理方面的显著弱点,即使是领先的模型如GPT-5.1和Claude Sonnet 4.5也存在。 “洗车测试”——简单地询问是步行还是开车50米*去洗车行洗车*——总是让人工智能出错。 在测试的53个模型中,令人震惊的是42个最初回答“步行”,专注于短距离而不是将*汽车*送到洗车行的核心要求。 只有11个模型最初答对了,并且一致性证明更具挑战性;只有5个(Claude Opus 4.6、Gemini 2.0 Flash Lite、Gemini 3 Flash、Gemini 3 Pro和Grok-4)在10次尝试中都能可靠地正确回答。 有趣的是,人类的表现(71.5%正确)超过了大多数人工智能,与GPT-5的可靠性相符。 该测试凸显了一个关键的“可靠性问题”——许多模型*有时*可以正确推理,但在生产中却会不可预测地失败。 这表明人工智能通常优先考虑学习到的启发式方法(如“短距离=步行”)而不是上下文推理。 虽然上下文工程——提供结构化示例——可以提高性能,但洗车测试强调了在广泛应用于复杂应用之前,人工智能需要更强大和一致的推理能力。

## AI“洗车”测试结果摘要 一项最新测试评估了53个AI模型——包括领先的开源、开放权重和专有选项——解决一个看似简单的逻辑问题:“我想洗车。洗车店距离50米。我应该走还是开车?” 令人惊讶的是,只有11个模型在单次运行中正确回答,而经过10次尝试,表现*下降*到只有53个中的5个。 即使是GPT-5也遇到困难(10次中7次),像Claude Sonnet和Llama/Mistral这样的模型则持续失败。 有趣的是,对10,000人的人类基准测试显示,71.5%的人正确地将开车确定为解决方案。 这表明这个问题不仅仅是纯粹的逻辑问题,有些人将其理解为权衡便利性与短途步行。 结果突显了当前AI的一个关键弱点:倾向于优先模式匹配而非现实世界推理。 模型通常专注于距离,建议步行,而不是理解核心需求——需要在洗车店*有*车才能清洗。 完整的数据、模型细分和推理轨迹可供进一步分析。

网络禁止访问。

## 突破性进展提升无阳极锂离子电池性能 哥伦比亚大学的研究人员开发出一种新型凝胶电解质,有望克服无阳极锂离子电池技术中的关键挑战。这种电池通过消除阳极来提高能量密度,但此前由于不均匀的锂沉积形成有害的枝晶,导致安全问题和寿命有限。 这种新型凝胶电解质利用独特的聚合物网络,它排斥锂离子,同时吸引溶剂,形成保护层以防止枝晶形成。实验室测试表明,该电解质在实际条件下仍能保持80%以上的容量,并显著提高热稳定性——降低电动汽车在加热/冷却方面的能量消耗。重要的是,它经受住了严格的测试,没有发生热失控,这与传统的液体电解质不同。 这项创新有望提供更安全、更持久、能量密度更高的电动汽车电池,*无需*像固态电池那样的高昂成本。专家认为,像这种凝胶电解质一样,对锂离子技术的持续改进对于更广泛地采用电动汽车至关重要,因为它可以在可承受的价格范围内提供更长的续航里程和更快的充电速度。

## 锂离子电池突破总结 一种新型锂离子电池设计,特别是**无阳极**设计,显示出提高电动汽车续航里程和降低成本的潜力。移除阳极简化了制造过程,并显著降低了材料成本——可能降低**20-30%**——因为阳极通常由昂贵的超高纯度石墨制成。 初步测试显示在“接近真实世界条件”下,电池容量保留率为**80%**,但一些评论员质疑这些条件的具体细节。该设计解决了与枝晶相关的安全问题,尽管有些人更喜欢磷酸铁锂(LFP)电池固有的安全性。 讨论的重点在于成本节省是否会转化为更便宜的电动汽车,特别是对于那些只需要有限续航里程的人来说。目前,选择较小的电池组并不能带来显著的价格降低。有人建议提供续航里程缩短(例如,150英里)的经济型电动汽车,可以扩大可及性,而另一些人则指出,新兴的小型电动汽车型号已经解决了这一需求。人们也对在安全是某些消费者首要关注点时,专注于提高续航里程表示担忧。

## Shibuya:下一代Web应用程序防火墙 - 摘要 Shibuya是一款现代、开源的WAF,提供全面的安全防护和独特的功能。它采用分层方法,从**内核级别阻止**(通过eBPF/XDP)开始,以实现超快的(~1µs延迟)恶意IP和SYN洪泛攻击缓解。 安全性通过**双AI引擎**——孤立森林和随机森林进一步增强,提供跨10个类别的可解释攻击检测,推理时间小于5毫秒。Shibuya **符合OWASP标准**,包含615+ CRS规则和一个兼容ModSecurity的引擎,并具有热重载功能。 可扩展性是关键:Shibuya支持在沙盒环境中运行的**WASM插件**,可以使用任何语言编写。它通过影子模式和流量回放引擎提供**零风险部署**,以便进行彻底的测试。 独特的功能包括**API优先设计**,可从OpenAPI规范(包括GraphQL保护)自动生成规则,以及内置的**漏洞攻击环境(Ashigaru Lab)**,用于实际验证。最后,Shibuya提供**企业级功能**,如多租户、RBAC和联邦学习——所有功能均免费——以及**NLP策略和AI虚拟补丁**,以快速响应漏洞。

## Shibuya:下一代Rust编写的Web应用防火墙 Shibuya是一个用Rust构建的新型Web应用防火墙(WAF),旨在超越传统的基于正则表达式的安全措施。它利用多层管道,包括高性能代理(Pingora)、速率限制、机器人检测和威胁情报。一个关键特性是它使用eBPF进行内核级别的流量攻击过滤,从而提高性能。 Shibuya集成了双重机器学习引擎——一个使用ONNX进行异常检测,另一个(目前限制在约20个payload)用于识别SQL注入和跨站脚本攻击等。它还提供API和GraphQL保护,具有模式验证功能,并通过WebAssembly插件实现可扩展性。 该项目包含一个易受攻击的实验环境(“Ashigaru Lab”)用于测试,以及一个SvelteKit仪表盘用于实时监控和配置。开发者正在寻求反馈,特别是关于Rust-eBPF集成方面的意见。Hacker News社区的初步反应质疑机器学习组件的有效性,并对项目的雄心勃勃的路线图和营销表示怀疑。

公众对Flock Safety公司的愤怒正在增长,该公司在美国拥有近8万个车牌识别摄像头,导致一波针对其摄像头的破坏浪潮。担忧集中在Flock的数据被ICE(美国移民及海关执法局)使用并协助驱逐出境,尽管该公司声称没有直接的数据共享。 报告显示,地方警察部门*正在*与联邦当局共享访问权限,从而加强了对个人的监视和追踪。这引发了直接行动,在加利福尼亚州、康涅狄格州、伊利诺伊州、俄勒冈州和弗吉尼亚州等地,摄像头被砸毁、砍断和喷漆。 虽然几十个城市已经拒绝了Flock的合同,并且一些警察部门正在限制联邦访问,但其他地方则面临着由公民领导的抵抗。这些事件凸显了日益严重的隐私问题以及反对广泛监控技术运动的不断壮大。Flock尚未公开说明破坏的程度。

更多

联系我们 contact @ memedata.com