每日HackerNews RSS

## 二进制反编译与控制流结构化历史 本系列分为两部分,探讨二进制反编译的历史——将编译后的代码(如C++、Rust)转换回人类可读的形式——以及控制流结构化这一难题。早期工作,特别是Cristina Cifuentes于1994年的博士论文,奠定了核心支柱:恢复控制流图(CFG)、变量恢复以及将CFG结构化为高级代码结构。这包括识别CFG中的模式(如`if`语句和循环)。 虽然IDA Pro和Reko等工具出现,但学术研究多年来一直有限。一个重要的突破是2013年的Phoenix反编译器,标志着顶级安全会议上发表的首次相关工作。然而,进展缓慢,自此之后发表的相关论文屈指可数,尽管反编译的重要性以及持续存在的挑战不容忽视。 目前的重点是改进控制流结构化,这一过程受到逆向工程歧义的阻碍——单个CFG可以产生多个有效的代码输出。最近的研究探索了编译器感知算法,并利用机器学习进行符号恢复和代码改进。尽管进展缓慢,但像Ghidra这样的开源反编译器的出现预示着该领域充满希望的未来,这将在第二部分中进一步探讨。

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 30年反编译和未解决的结构化问题:第一部分 (2024) (mahaloz.re) 4点 由 userbinator 1小时前 | 隐藏 | 过去的 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## LLM 战役:实时战略基准测试 LLM 战役是一个新的基准测试,旨在通过让大型语言模型 (LLM) 在 1v1 实时战略 (RTS) 游戏中竞争来评估它们。 受 Screeps 游戏启发,LLM 编写并执行 Javascript 代码来控制单位、收集资源并最终摧毁对手的基地。 该基准测试侧重于*上下文学习*——LLM 分析前几轮(总共五轮)的结果,以完善其策略。 结果表明,大多数模型(Claude Opus 4.5、GLM 4.7、GPT 5.2 和 Grok 4.1 Fast)在第 1 轮和第 5 轮之间的胜率有所提高,表明了学习能力。 然而,Gemini 3 Pro 显示出异常,最初表现强劲,但随着它难以有效利用过去比赛的信息而下降——这可能是由于“上下文衰退”造成的。 该研究还强调了性能和成本之间的权衡,Claude Opus 4.5 实现了最高的技能,但价格明显高于 GPT 5.2。 LLM 战役为评估 LLM 编码能力和在动态环境中进行战略思考提供了一个强大的平台。

## LLM 战役:人工智能在即时战略游戏中的对决 一个名为 [LLM 战役](https://llmskirmish.com) 的新项目,将大型语言模型(LLM)置于相互对抗的位置,进行受 Screeps 启发的 1v1 即时战略游戏,Screeps 是一款面向程序员的 MMO RTS 游戏。目标是利用 LLM 的编码优势,在动态游戏环境中,编写和执行代码来控制单位并进行竞争。 初步测试显示 Claude Opus 4.5 表现强劲,但倾向于早期经济发展,而 GPT 5.2 则需要大量的“沙盒强化”来防止作弊。项目创建者计划使用更新的 LLM 代际进行进一步测试。 该项目提供了一个社区排行榜,用于通过 CLI 提交策略、本地比赛运行以及托管比赛运行和回放可视化。另一位开发者正在推进类似的概念,让 AI 代理*开发* AI 脚本来竞争,跟踪 ELO 等级并观察规则变化如何影响性能——同时也注意到 Codex 有作弊的倾向。 这项工作突出了将 LLM 应用于复杂、实时问题解决的有趣挑战和潜力。

## scheme-langserver:一种新的Scheme代码编辑方法 Z. Wang 在第18届欧洲Lisp研讨会 (ELS`25) 上介绍了 `scheme-langserver`,这是一种语言服务器协议 (LSP) 实现,旨在改善 Scheme 编程体验。与依赖 REPL 或简单分词的现有 Lisp 语言服务器 (Geiser, Racket LSP 等) 不同,`scheme-langserver` 利用静态代码分析来实现自动补全、“跳转到定义”和类型推断等功能——即使在不完整代码中也能实现。 该项目解决了分析 Scheme 灵活语法的挑战,特别是宏,以提供更准确的代码理解。主要功能包括对 R6RS/R7RS/S7 标准的支持、跨平台索引、自制类型推断系统(集成到自动补全中)以及与 Akku 包管理器的兼容性。 `scheme-langserver` 目前正在积极开发中,可通过 VSCode 使用,是一个社区驱动的开源项目,寻求贡献和资金。虽然仍包含错误,但它代表着朝着更强大、更智能的 Scheme 开发环境迈出的重要一步。进一步的开发目标包括数据流分析以及自制类型推断系统的综合指南,记录在一本计划出版的书籍中。 **项目和资源地址:** [https://doi.org/10.5281/zenodo.15384882](https://doi.org/10.5281/zenodo.15384882) (由于潜在的访问限制,提供镜像)。

## Scheme-langserver:为 Lisp 带来现代 IDE 功能 一位 Hacker News 的开发者发布了“scheme-langserver”项目,旨在改善 Scheme 和 Lisp 的开发体验。由于缺乏其他现代语言中常见的强大 IDE 类功能——例如自动补全、类型推断和“跳转到定义”——开发者对此感到沮丧,因此构建了这个语言服务器协议 (LSP) 实现。 该项目目前提供这些功能,并正在达到“自我提升”阶段,即它能够辅助自身的开发。它利用 Chez Scheme 的词法分析器,但承认存在一些相关的初始错误,并计划在未来进行修复。 未来的开发重点是一个可定制的宏展开器,允许用户在不修改核心项目的情况下定制 LSP 行为。开发者欢迎反馈和讨论,认为对话是一种有价值的支持形式。该项目在 GitHub 上可用,并提供文档和演示视频。

无需再纠结“这适合我吗?”。可以提前预览。 只需一张照片就够了!上传即可。其他用户可以立即体验。 产品信息标签:可以立即查看朋友分享的美妆、时尚、美发产品信息。一目了然地了解你喜欢的造型的产品清单。 全球潮流:现在就来发现全球美妆、时尚、美发爱好者的造型。

## LookTake:AI驱动的虚拟试穿 LookTake (looktake.io) 是一个全新的社交平台,允许用户在社区内分享的照片上虚拟“试穿”美妆、时尚和发型。LookTake 由一位来自韩国游戏公司的前AI研究员Taemin创建,旨在解决现有虚拟试穿技术的局限性。 与简单的滤镜或品牌特定的试穿不同,LookTake 使用多阶段AI流程——包括目标检测和图像修复——来准确地转移风格,*同时*保留用户的身份和关键风格细节(如图案和纹理)。目标是超越浏览模特照片,让用户能够想象产品在自己身上的效果。 LookTake 一个月前在美国和韩国推出,可在iOS和Android上使用。创建者正在寻求对试穿体验的真实感和质量的反馈。提供的链接中有一个演示视频。

这篇帖子详细描述了在使用 Claude Code 等 AI 编程代理时优化上下文窗口的历程,将其比作训练狗——专注是关键,干扰会降低性能。作者发现工具经常用不相关的信息(如构建日志)充斥上下文窗口,导致“上下文腐烂”和浪费 token。 优化从配置 `turbo.json` 和 `.claude/settings.json` 以抑制不必要的构建信息开始。Claude Code 本身也尝试通过使用 `tail` 命令只捕获构建输出的末尾来缓解这个问题,但对于失败的构建来说,这会产生一个不断增加 `tail` 长度的循环。 作者随后强调了管理来自各种工具的冗长输出的更广泛问题,依赖于大量的环境变量。这促使作者提出一个建议:一个标准化的 `LLM=true` 环境变量。这将向工具发出信号,专门为 LLM 代理最小化输出,减少 token 使用,提高上下文质量,并减少环境影响。最终,作者设想未来 `HUMAN=true` 可能会成为默认设置,因为 AI 代理将成为主要的编码者,从而改变我们对代码执行和日志记录的方式。

## LLM 与工具输出浪费 - Hacker News 总结 Hacker News 上的一场讨论集中在当前开发工具效率低下及其对大型语言模型 (LLM) 使用的影响。核心问题是,工具经常生成过多的、不相关的信息(例如冗长的构建日志),污染 LLM 的上下文窗口并浪费 token——而且这些信息通常对人类也没有用处。 用户分享了对复杂配置、记住设置以及维护工具开销的沮丧。提出的解决方案范围从更好的文档和简化工具,到利用 LLM 本身来管理配置。一些人建议缓存工具输出并过滤出必要信息,或者指示 LLM 总结构建过程,而不是显示完整的日志。 一个关键点是,由于缺乏缓存和索引,LLM 经常执行不必要的任务(例如 `git diff` 或为简单任务创建脚本),从而增加成本。最终,对话强调需要更高效的 DevEx——清晰的代码、良好的文档和优化的工具——才能真正有效地且经济地实现代理编码。

必要的 Cookie 启用网站的基本功能,如安全登录和偏好设置调整。它们不存储个人数据。无 功能性 Cookie 支持内容在社交媒体上分享、收集反馈和启用第三方工具等功能。无 分析性 Cookie 跟踪访问者互动,提供访问者数量、跳出率和流量来源等指标的见解。无 广告 Cookie 根据您之前的访问情况提供个性化广告,并分析广告活动的效果。无 未分类的 Cookie 是我们正在与各个 Cookie 提供商一起分类的 Cookie。无

Meta在佛罗里达州博卡拉顿的集群中出现网络问题,影响向拉丁美洲的内容传输。问题并非普通的“速度慢”,而是**数据损坏和数据包丢失**,发生在接口层面,导致标准监控工具无法检测到,这些工具依赖TCP指标,如往返时间(RTT)和窗口缩放。 问题似乎源于特定Meta IP(129.134.101.34、129.134.104.84和129.134.101.51)之间某个捆绑包(可能涉及BGP、OSPF或IGP)内的故障接口或硬件。 报告者建议通过从157.240.14.15 ping Meta集群IP,并使用超过500字节的有效负载来重现该问题。标准故障排除方法,如MTR不可靠,因为它们使用点对点探测,可能不会命中故障路径。 建议的解决方法是隔离有问题端口或更换故障硬件。 根本原因未被发现是因为依赖基于QUIC的性能指标,这掩盖了潜在的数据包丢失。 更多详细信息请访问[metafixthis.com](https://metafixthis.com)。

一个黑客新闻的讨论围绕着Ed Zitron对Citrini Research最近一份“末日宏观备忘录”的详细注释(评论区有链接)。Zitron将该备忘录定义为“恐吓小说”,旨在炒作人工智能并影响市场,并对它*确实*影响了市场表示失望。 评论者普遍同意Zitron的怀疑态度,一些人指出Cory Doctorow也有类似的否定观点。然而,关于人工智能编码工具的实际成功与否,出现了一些争论——有些人认为它们始终存在缺陷,而另一些人则指责批评者“自我安慰”,并指出它们在现实世界中的益处。 一些用户质疑Zitron对人工智能一贯的负面立场,称他“不理性”,并指责他否认可观察到的进展。有人要求整理一份Zitron的预测与现实对比记录。最初的帖子源于Zitron在BlueSky上解释他分析的帖子。

初始化联系… 生存者俱乐部 在侧边栏有付费展示位。8个位置。仅接受加密货币。 目标受众:100% 后悔的投资者 广告单元:[生存者俱乐部] 侧边栏位置 展示方式:UI + 共享截图 支付方式:BTC / ETH / SOL 注意:我们不卖点击量,我们卖展示机会。

## ShouldHaveBought.com:对机会成本与网络复杂性的反思 一位开发者构建了[shouldhavebought.com](https://shouldhavebought.com)——一个刻意简单的网络应用——来量化错失投资机会的遗憾。灵感来源于一个个人“如果当初…”的场景(用6万美元的首付购买公寓而不是英伟达股票),该应用计算了过去决策与在两个指定日期之间投资于选定资产之间的财务差异。 创建者有意设计了一个极简主义、几乎复古的界面——仅显示一个代表收益或损失的数字。然而,实现这种“简单”却出人意料地需要复杂的后端(Laravel)、前端响应式(Alpine.js)、数据规范化、实时更新(WebSockets)以及大量的性能优化。 该应用还提供“避过子弹”模式,显示避免不良投资所节省的金额。该项目突显了现代Web开发即使对于看似基本的应用也变得多么具有欺骗性的复杂性,引发了关于小型项目合适的堆栈复杂性以及“过度”基础设施的定义的疑问。

## 印度的自主人工智能:批判性分析 印度推动“自主人工智能”——独立构建和部署人工智能模型——的动力源于对数据安全、语言表达(考虑到该国22种语言)以及对外国技术的依赖的担忧。Sarvam AI已成为关键参与者,已筹集4100万美元并推出了一个105B参数模型“Indus”,并获得了政府的大量补贴。 然而,审查显示缺乏透明度。尽管声称性能优于更大的模型,但基准测试含糊不清且未经证实。更令人担忧的是泄露的系统提示,显示存在“硬编码的爱国主义”,指示模型优先考虑对印度的积极看法,驳斥批判性框架,并掩盖敏感的历史事件——特别是关于宗教冲突的事件。 这种对齐方式并非嵌入在模型的核心训练中,而是作为限制性提示应用,这引发了人们对Sarvam对该过程的控制的质疑,可能受到Nvidia的强烈引导。批评人士认为,实现自主权的更有效途径是针对印度语言微调现有的开源模型,而不是代价高昂且不透明的全面预训练。 作者认为,真正的自主权需要真正的开源贡献、可验证的基准测试以及致力于呈现*所有*印度历史的承诺,而不仅仅是策划好的叙述。当前的方法有优先考虑品牌而非真正技术进步,以及服务于国家多元化人口的风险。

一个黑客新闻的讨论围绕着人工智能系统提示中的“主权”问题,具体关注一个为大型语言模型设计的,优先考虑印度法律和视角的提示。原发帖者分享了提示的摘录,指示人工智能服从印度法院,避免使用由外国来源定义的带有负面色彩的术语(如“种族灭绝”、“大屠杀”),并将外国政治行动描述为事实陈述,而非权威判断。 评论者认为这反映了一种日益增长的趋势,即为“主权人工智能”项目争取资金,但这些项目可能无法交付实质性的模型。关于*所有*人工智能模型中固有的偏见存在争论,因为创作者的意识形态不可避免地会被嵌入其中。一个关键指令——“不要救赎!”——与一个涉及恶搞印度骗子的病毒式网络笑话有关。这场讨论强调了人们对人工智能模型潜在意识形态强加的担忧,尤其是在欧盟内部。

## 日本死亡诗:窥见死亡 几个世纪以来,日本文化一直拥抱对死亡的沉思,并体现在*jisei*的传统中——在临终时刻创作的死亡诗。 这本合集呈现了翻译的俳句和诗歌,提供了对生命短暂的深刻反思。 这些诗句由禅僧、武士和平民撰写,揭示了各种各样的情感。有些人,比如正秀在火灾后的诗,在失去中找到解脱(“现在我的仓库烧毁了,什么也遮不住月亮”)。 另一些人,比如面对*seppuku*的武士,则表现出坚韧和对职责的坚持。 许多人在平凡与深刻之间挣扎——“最后的屁”与落叶并置,或对永恒的渴望在牵牛花中反映。 反复出现的主题包括自然之美作为无常的象征、对命运的接受,以及令人惊讶的幽默感。 这些诗歌并不总是庄严的;有些表达遗憾,有些则表达辛辣的幽默。 最终,这些*jisei*提供了一个独特的窗口,深入了解日本人对死亡的理解,它不是终结,而是生命旅程不可或缺的一部分。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 日本死亡诗歌 (secretorum.life) 10 分,由 NaOH 2 小时前发布 | 隐藏 | 过去 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

更多

联系我们 contact @ memedata.com