## Knuckledragger 二进制验证
本文详细介绍了使用 Python 构建的二进制验证工具“Knuckledragger”的开发过程,该工具利用 Ghidra 的 p-code 语义。其目标是提供一种更易于管理的方式来验证低级代码——通常出于性能、特定硬件访问或严格控制的需要,但由于其冗长性和有限的工具支持而容易出错。
其核心创新在于“双模拟”方法。该工具允许用户定义程序行为的*更高层次*模型,而不是直接调试复杂的符号执行输出。Knuckledragger 然后使用 Z3 进行自动证明,自动验证汇编代码中的所有可能执行路径都对应于此更高层次模型中的有效路径。
作者通过示例演示了这一点,包括一个简单的加法程序和一个 `mycpy` 函数(内存拷贝)。使用模型检查在 `mycpybad` 中发现并修复了一个错误——缺少长度检查。通过双模拟框架和 Knuckledragger 的反射特性,实现了进一步的验证,包括证明程序状态的不变量,并提供可读的规范。
虽然比基本的模糊测试或有界模型检查更复杂,但这种方法能够实现无界验证,并允许对程序正确性进行形式化证明。代码和演示视频可在网上找到。
## 寻宝者出狱
73岁的深海寻宝者汤米·汤普森在服刑十年后获释,罪名是刑事藐视法庭。汤普森于1988年发现“黄金之船”——SS Central America号沉船,该船位于南卡罗来纳海岸附近,打捞出数百万枚最初在旧金山铸造的金币。
资助探险的投资者在2005年起诉汤普森,声称他们从未收到从打捞的宝藏(估计价值高达4亿美元)销售中承诺的回报。汤普森于2012年出逃,并于2015年被捕。
他因拒绝透露约500枚失踪金币的位置而被监禁。然而,法官去年结束了他的无限期刑期,认为他不太可能透露它们的下落。虽然获释,但剩余金币的命运仍然是个谜,关于宝藏销售和分配的完整账目仍存在疑问。
## 美国债务与地缘政治风险:摘要
美国最近的国债已超过其国内生产总值,这是一个通常被视为危机点的里程碑。然而,作者布兰登·史密斯认为,这不一定意味着厄运,尤其对于拥有世界储备货币的国家而言。希腊和阿根廷等国在债务与GDP比例达到100%后遭受了衰退,但美国的独特地位使其能够维持更高的债务水平。
目前,主流媒体正将注意力集中在债务、通货膨胀以及地缘政治紧张局势上,特别是关于伊朗的问题。史密斯认为,这种新的担忧在政治上受到驱动,旨在将潜在的经济衰退归咎于特朗普政府,尽管过去曾对与特朗普政策相关的危机做出过错误的预测(例如关税)。
根据分析,真正的担忧并不一定在于债务本身,而在于美联储可能加剧问题——无论是通过加息还是进一步印钞。在地缘政治方面,虽然与伊朗的战争存在风险,但更大的直接影响可能首先在亚洲感受到,而非西方,除非霍尔木兹海峡被长期封锁。
最终,史密斯认为更大的威胁在于与俄罗斯在乌克兰问题上的潜在升级,以及通过骚乱和恐怖袭击造成的国内动荡。他强调要辨别真正的危险与人为制造的叙事,因为一些势力*希望*看到美国崩溃,并将利用任何危机来推进他们的议程。
这篇帖子详细介绍了作者对量化投资的探索,特别是将其应用于外汇(FX)市场,尽管他们之前从事高频交易。与股票不同,外汇收益受宏观事件(如利率变化)的强烈影响,这使得建模更加复杂。
作者利用TwelveData API收集主要货币的每日汇率数据,创建用于分析的数据集。然后,他们复制美元指数(DXY)——一种衡量六种主要货币对美元汇率的加权平均值——作为整体市场走势的代理,类似于股票市场的标准普尔500指数。
作者以资本资产定价模型为框架,通过滚动线性回归计算了几种货币相对于DXY的beta值。这些beta值表明了货币对美元波动整体的敏感度。初步结果与预期一致——欧元显示出接近1的beta值,而土耳其里拉由于其独特的宏观经济因素表现出较低的敏感度。
虽然这些初步的beta值本身并没有特别深刻的见解,但这项工作为构建一个更全面的外汇因子模型奠定了基础,该模型将纳入动量和商品敏感性等因素。
一场美国-以色列对伊朗的军事行动引发了严重的人道主义危机,据联合国难民署统计,已有超过300万伊朗人流离失所。60万到100万户家庭——最多达320万人——在境内流离失所,主要原因是轰炸加剧,他们逃离主要城市。
这场冲突被美国和以色列定义为“解放”伊朗人的行动,但具有讽刺意味的是,它却造成了广泛的破坏和流离失所。不断上升的死亡人数,接近1500人,其中包括165名儿童,加剧了这场危机。
除了伊朗,这场战争还在加剧地区不稳定。黎巴嫩已有近15%的人口(超过80万)流离失所,巴林的不稳定局势也在加剧。目前居住在伊朗的数百万阿富汗难民的处境尤其严峻,因为资源被转移到应对不断升级的冲突。联合国警告说,流离失所人数可能会继续增加。
## 搜索蒸馏提升语言模型推理能力
本研究探讨了是否可以通过增强语言模型与搜索功能(类似于AlphaZero等游戏AI使用的技术),来提升其推理能力。作者研究了将蒙特卡洛树搜索(MCTS)应用于Qwen-2.5-1.5B-Instruct模型,并通过在线PPO训练将由此产生的更强的推理路径蒸馏回模型中。
实验重点是组合算术游戏“Countdown”,在该游戏中,模型必须使用给定的整数和运算来达到目标数字。结果表明,蒸馏后的模型实现了11.3%的mean@16准确率——比预训练模型提高了8.2个百分点——优于CISPO (8.4%) 和“最佳N个”采样基线 (7.7%)。
该研究强调了基于搜索的蒸馏的潜力,表明组合问题尤其受益于自适应推理树。尽管承认实验规模较小(1.5B模型),作者计划使用更大的模型和计算资源来进一步探索这种有前景的方法及其“推理旋钮”,例如worker/迭代次数。代码是开源的,欢迎合作以推进这项研究。
## 中东冲突加剧导致机票价格上涨
中东地区冲突升级,特别是涉及伊朗的冲突,正在显著影响全球航空运营并推高机票价格。关键的霍尔木兹海峡贸易路线中断导致喷气燃料价格飙升——从每桶85-90美元到150-200美元,迫使昆塔斯航空、SAS航空和新西兰航空等航空公司实施提价。
这些涨价源于更高的燃料成本和空域关闭,导致更长、更昂贵的飞行路线。虽然一些航空公司有燃油对冲策略,但即使这些储备也受到长期冲突和潜在供应短缺的威胁。
分析师警告说,如果得不到缓解,航空公司可能被迫停飞飞机,而实力较弱的航空公司可能停止运营。除了成本之外,不确定性预计也会抑制旅行需求,因为消费者和企业正在重新考虑旅行计划。航空公司股票已经出现负面反应,反映了对未来盈利能力和潜在旅行低迷的担忧。冲突的持续时间和结果仍不清楚,这加剧了行业的动荡。
朝鲜周六向海上发射了大约十枚弹道导弹,以回应韩国和美国正在进行中的联合军事演习。虽然这些导弹落在了日本专属经济区之外,但此事引发了日本的紧急应对会议,并提高了韩国的军事戒备状态。
这次力量展示可能与对韩国潜在安全漏洞的担忧有关。有报道称,美国正在将该地区的导弹防御资产重新分配用于支持中东地区的行动,这加剧了朝鲜对演习的焦虑——这些演习通常被谴责为入侵演习。
这些发射凸显了朝鲜通过其核能力威慑攻击的战略,因为针对拥有核武器的国家不太可能发生“选择性战争”。 太平洋地区美国军事力量的增加以及中东当前的冲突使局势更加复杂。
## 冲突暴露美国军事弱点
近期冲突暴露了美国工业基础和供应链的关键弱点。尽管拥有万亿美元的军费预算,由于数十年来产业整合和外包,美国面临着关键弹药的短缺——从受霍尔木兹海峡潜在关闭影响的肥料,到“萨德”导弹和“战斧”导弹等。
曾经多元化的制造业现在由少数几家大型国防承包商(波音、雷神、洛克希德·马丁等)主导,它们优先考虑股票回购和利润,而非有韧性的生产能力。这导致军队更像一个“承包商增益工厂”,而非一支准备好的战斗力量。
更严重的是,美国对外国来源,特别是中国,存在危险的依赖,而中国是导弹制导系统所需的重要稀土矿物的关键来源。美国这些矿物的供应有限,使其军事能力容易受到地缘政治杠杆的影响。
这场危机并非承包商绩效不佳,而是未能维持国内生产和多元化供应链的系统性失败,这是优先考虑短期财务收益而非长期国家安全的结果。扭转这一趋势需要挑战集中资本的力量,并重建一个强大、自给自足的工业基础。
## JIT 编译器调试与元数据:深入研究
MoarVM,一种用于 Raku 编程语言的虚拟机,最近在 Windows 上遇到了异常处理问题,原因是 `longjmp` 行为发生了变化。这源于 Raku 异常不直接与底层 C 栈交互,但 MoarVM 使用 `longjmp` 进行基本的错误处理。更新后的 `longjmp` 现在完全展开栈,即使对于 JIT 编译的代码也需要展开数据——MoarVM 尚未提供这些数据。
这个问题引发了对 JIT 编译器如何向操作系统和调试工具暴露信息的研究。存在几种 API,各有优缺点:**Perf Map** 简单但缺乏反汇编;创建**完整的共享对象**内容全面但繁琐;**RtlAddFunctionTable** 和 **libunwind** 处理栈展开;**GDB 的 JIT 调试信息读取器** 提供强大的自定义功能,但需要大量工作;而 **JITDUMP** 为像 `perf` 这样的工具提供详细信息,包括反汇编和行号。
目前,MoarVM 使用 Perf Map 并已实现 JITDUMP 支持。作者还尝试了 GDB 集成。最终目标是提供一个统一的解决方案,提供全面的调试和分析信息,承认当前形势是分散且复杂的。这项研究强调了弥合 JIT 编译代码与外部分析工具之间的差距所面临的挑战。
一项最近的国际研究,横跨五个中欧国家,发现所有测试的耳机——从廉价品牌到高端型号——都存在有害化学物质。由欧盟资助的“ToxFree LIFE for All”项目分析了81款耳机产品,发现塑料和软部件中含有令人担忧浓度的双酚(如BPA和BPS)、邻苯二甲酸酯和阻燃剂。
双酚浓度达到欧盟拟议限值的35倍,引发了对激素干扰的担忧,尤其是在长时间使用和通过皮肤接触(如运动)的情况下。该研究强调了一种“令人遗憾的替代”趋势,即用相似但仍然有毒的替代品取代有害化学物质。
值得注意的是,从网上市场购买的产品毒性最高,但知名品牌也未能幸免。研究人员敦促欧盟超越对单个化学物质的监管,而是对整个有害物质类别实施基于群体的限制,以更好地保护消费者并促进更安全的循环经济。鼓励消费者通过ToxFreeProductsNow.eu支持对更安全产品的需求。
Meta 正在考虑进行大规模裁员,可能影响超过 20%(约 16,000 人)的员工,以优先发展人工智能。此次重组是在其自身人工智能模型被认为不足而推迟发布,并可能计划在过渡期间授权竞争对手(如 Gemini)之后进行的。
此举与亚马逊和 Oracle 等科技巨头的一般趋势一致,所有公司都在将资金重新导向对人工智能数据中心基础设施的大量投资。Meta 官方称相关报道为“推测性”,但据报道,领导层已被指示为裁员做计划,并在 2022-23 年的先前裁员基础上进行。
Meta 计划投资 6000 亿美元用于数据中心,并最近收购了人工智能初创公司(Moltbook、Manus),这表明了其对人工智能的强烈承诺,即使这意味着需要大幅裁员来为其提供资金。这反映了科技行业在疫情期间过度招聘的修正。
这本免费的148页书籍旨在帮助设计专业的学生和教育者克服学习创意编程时常遇到的挫折。它认识到许多人在学习过程中会面临情感挑战——感到迷茫、不好意思提问或质疑自己的能力——因此,它并非旨在*让*编程变得容易,而是帮助学习者*保持*动力。
本书将45种具体的挫折感映射到九种“传统美德”上,例如好奇心和谦逊,为每种挫折感提供肯定、解释和具体的行动步骤。它侧重于*如何*在遇到困难时继续学习,而不仅仅是*编写什么*代码。
本书面向学习6-12个月的新手,弥合了设计直觉和编程逻辑之间的差距。教育者也可以利用它来解决学生面临的情感障碍。该书以知识共享许可发布,可免费下载,无需注册,并且已被下载超过9500次。
最新数据显示,2025-2026流感疫苗的有效性显著下降。美国疾控中心报告显示,儿童的有效性在14-48%之间,成人为22-34%,低于上一季度的56%。造成这种下降的原因尚不清楚,可能与疫苗毒株不匹配或疫苗接种率降低有关,其中H3N2亚型K是主要流行的毒株。
这些发现已呈报给FDA的咨询委员会,引发了委员们对数据准确性和解读的担忧。一些人认为,这些数据未能完全反映疫苗对重症疾病的有效性,尤其是在儿童中,大量住院病例发生在未接种疫苗的人群中。
尽管有效性较低,委员会一致建议更新流感疫苗,以针对当前流行的毒株,这与世界卫生组织的建议一致。此前,疾控中心最近改变了指导意见,建议儿童在咨询医生后才接种流感疫苗,理由是缺乏关于减少传播之外益处的明确证据。全国流感活动依然活跃,数百万人口受到影响。