每日HackerNews RSS

“反转诅咒”(Reversal Curse)是自回归大语言模型(LLM)中发现的一种重大的泛化失败现象。研究表明,当模型接受“A 是 B”这类陈述的训练时,它无法逻辑推导出反向关系“B 是 A”。 例如,一个被训练识别“瓦莲京娜·捷列什科娃是第一位进入太空的女性”的模型,无法可靠地回答“谁是第一位进入太空的女性?”这一问题。这种缺陷存在于各种规模和系列的模型中,且无法通过数据增强来解决。无论是使用虚构陈述(例如“尤赖亚·霍桑是《深渊旋律》的作曲家”)还是真实名人的数据进行的实验,都证实了语言模型难以在训练数据的反方向上检索信息。虽然如果直接在上下文提供信息,模型可以推导出反转关系,但它们无法从底层训练数据中固有地泛化出这种双向联系。

抱歉。

SPH(平滑粒子流体动力学)感知是神经元胞自动机中一种基于粒子的感知方式,作为网格卷积感知的一种替代方案。通过利用平滑核函数聚合局部邻域数据,粒子可以计算密度、状态平均值和梯度,而不受其不规则或动态位置的影响。 该框架保留了传统神经自动机的局部性,同时使其能够适应灵活的构型。其主要特点包括: * **局部感知:** 粒子测量半径 $\epsilon$ 内的周围环境,通过估算密度、平滑状态和梯度,从而为共享更新规则提供依据。 * **几何校正:** 虽然标准的零阶估计器可能会因采样不均而产生偏差,但一阶估计器利用了局部“矩矩阵”。这可以归一化几何畸变,即使在非均匀的粒子分布中也能实现精确的梯度计算。 * **可视化:** 相关的演示通过突出显示邻域密度、状态梯度方向,以及相邻粒子对中心点状态的几何影响,来直观展示这些算子的作用。 总之,SPH 感知为粒子间的相互作用与演化提供了一种稳健且具有几何感知能力的方法,在粒子系统固有的不规则性下,仍能保持线性场的数学精度。

“神经粒子自动机”(NPA)是传统“神经元胞自动机”(NCA)的一种演进。标准的 NCA 依赖于静态的网格像素,而 NPA 则将其替换为能在空间中自由移动的智能粒子。通过遵循简单的共享局部规则,这些粒子能够表现出复杂的涌现行为,例如形成精细的图案以及在受损后进行自我修复。 该项目在 Hacker News 上引起了广泛关注,用户将其与迈克尔·莱文(Michael Levin)关于生物形态发生和细胞通讯的研究进行了对比。讨论涉及了未来的潜在应用,包括可微细胞分裂和纹理合成。尽管该系统展示了令人印象深刻的自组织能力,但作者指出,目前稳定的生长需要从特定的初始条件开始,因为运行中途的干扰可能会永久性地破坏其形态。 该项目凸显了计算研究领域的一个增长趋势:交互式的浏览器模拟正逐渐成为比传统静态论文更具动态性的科学探索媒介。

本文认为,美国金融体系已沦为“恶土”——一个反乌托邦式的环境,在这里,合法市场与掠夺性赌博之间的界限已荡然无存。到2026年,加密货币行业已成功通过收编联邦监管框架,将金融基础设施转变为“韭菜收割”流水线,通过令人上瘾的零和投机游戏锁定散户投资者。 作者指出,该行业的产品(如模因币和针对包括军事行动在内的事件合约博彩)并非真正的市场,因为它们缺乏潜在的经济现实或套期保值功能。相反,它们充当了一种巨大的财富转移机制,其动力源于那些被传统繁荣拒之门外的一代人所持有的“金融虚无主义”。稳定币的推波助澜让货币主权被外包给不透明的私人公司,而政治游说机器则使得包括总统在内的民选官员能够直接通过代币将其公权力变现。 为扭转这一局面,作者提出了一项严格的监管“碎木机”计划:收回商品期货交易委员会(CFTC)禁止赌博的权力,撤销对加密货币友好的银行牌照,并利用海外资产控制办公室(OFAC)的制裁措施拆除离岸平台。其目标是恢复生产性市场与赌场之间的分离,将消费者保护和国家稳定置于投机性“创新”之上。

这次 Hacker News 的讨论围绕着对加密货币行业的严厉批评展开,认为该行业与其说是一项变革性技术,不如说是一个精密且游戏化的赌博生态系统。 核心观点指出,“加密”行业利用技术术语将投机资产包装成金融投资进行营销。批评者强调,这种结构不成比例地使交易所和早期内部人士获利,同时将年轻用户困在成瘾的高风险交易循环中。讨论帖将其与“禁毒战争”相提并论,描述了投机行为如何轻易升级为严重的赌博成瘾。 一个主要的争议点涉及去中心化的本质。怀疑论者认为,对稳定币和中心化交易所的依赖证明了真正的去中心化是不切实际的。相反,一些参与者认为,对于本国货币不稳定的全球人口而言,稳定币确实提供了真正的实用价值。 讨论还触及了社会信任的侵蚀,评论者将利用金融市场获取暴利的行为比作“烧毁热带雨林”。归根结底,这一讨论反映了两种观点之间的深刻分歧:一方认为加密货币本质上是一个掠夺性行业,而另一方则在承认其风险的同时,关注其在现实世界支付中的潜力。

Akvorado 是一款网络流量处理工具。此前,由于互联网路由表规模庞大(包含数百万条路由)且锁竞争严重,其 BGP 监控协议(BMP)组件难以扩展。 为解决这些瓶颈,开发者实施了两项重大优化: 1. **RIB 分片(Sharding):** 通过将路由信息库(RIB)拆分为多个分片,每个分片拥有独立的锁,系统实现了并发更新,从而显著降低了路由处理过程中的竞争。 2. **无锁读取:** 通过利用写时复制(copy-on-write)前缀树和代际跟踪机制,Akvorado 消除了对全局读写锁的需求。这使得读取器在访问路由数据时,不会被并发的写入操作阻塞。 这些改进避免了因处理缓慢导致的“停滞”问题,使系统能够应对海量且高突发的 BGP 更新。基准测试结果显示,读写延迟均有大幅改善,推动 Akvorado 向更稳健的最终一致性架构迈进。这些优化已集成在 2.2 和 2.4 版本中。

抱歉。

传统的 *vi* 编辑器由比尔·乔伊(Bill Joy)于 1976 年开发,最初受限于商业 Unix 许可证。2002 年,Caldera 公司以 BSD 风格的许可证发布了其源代码,使其最终成为自由软件。 此版本保留了原版极简、轻量化的设计,没有语法高亮或多窗口等现代功能,但引入了对包括 UTF-8 在内的国际字符集的支持,并同步了来自 System V 和 POSIX.2 的更新。 该项目提供源代码发布,用户可通过 CVS 访问开发代码库(但一般建议使用稳定版)。项目中包含详尽的文档,包括安装指南、更新日志、名为《Vi 显示编辑入门》(An Introduction to Display Editing with Vi)的教程,以及 *ex* 和 *vi* 的手册页。该版本由贡纳·里特(Gunnar Ritter)维护,确保了经典的 Unix 编辑体验能够在现代系统上继续使用。

这篇 Hacker News 的讨论回顾了由 Gunnar Ritter 于 2007 年发起的“传统 Vi”项目,该项目旨在保留 Joy 和 Horton 最初实现的 `vi`。 讨论的核心在于该编辑器的历史演变。用户探讨了如今已被遗忘的“开放模式”(open mode)——这是在缺乏任意光标定位功能的终端(如打印终端)上,视觉模式的前身。尽管 Vim 等大多数现代克隆版本已不再沿用,但贡献者们强调了经典 `vi` 工作流的长久生命力,例如通过 Unix shell 工具(如 `grep`、`sort`)处理缓冲区内容,以及使用标记进行精确编辑。 参与者们分享了怀旧情感与技术冷知识,澄清了许多常被归功于 Vim 的功能(如 `:x` 保存并退出命令)实际上源于 1980 年最初的 `vi`。讨论帖还涉及了项目网站设计的简洁性,引发了关于网页排版和响应式设计的辩论。最终,这场讨论反映了人们对 `vi` 在 Unix 历史中高效且作为“共同基准”地位的深刻赞赏;许多用户表示,比起现代 Vim 的复杂性,他们更倾向于原版 `vi` 那种专注且以键盘为核心的简洁感。

凭借在 Citadel Securities 担任做市商四年积累的经验,我致力于帮助独立交易者将原始想法转化为稳健的专业级策略。通过管理大规模期权投资组合和自动化高频交易柜台的背景,我将教会你如何以交易对手方——即机构“做市商”的视角来审视你的交易。 我的方法专注于三个核心支柱: 1. **验证优势:** 确定你的交易是基于真正的市场低效,而非对竞争格局的误解。 2. **优化仓位规模:** 摒弃直觉,根据你的优势与市场波动率之间的关系来计算仓位规模。 3. **执行现实:** 确保你的理论优势能够经受住成本、滑点和流动性摩擦的考验。 带着你的直觉或市场观点来找我,我们将根据专业标准对其进行压力测试。你将获得一份基于数据、客观公正的策略报告,以及将你的想法付诸实践的可操作步骤。 *免责声明:仅供教育使用,不构成投资建议。*

抱歉。

8086 的分段内存架构常受诟病,但从 1970 年代的视角来看,它是解决 64KB 内存限制的一种巧妙方案。英特尔将段设计为“不透明选择器”(即隔离的 64KB 块),旨在允许程序员在扩展内存容量的同时,保持原有 8080 代码的兼容性。从理论上讲,这种设计本可以扩展以支持更大的地址空间。 然而,开发者的做法破坏了这一愿景。他们发现可以通过操作段寄存器来进行地址算术运算,从而迫使分段变成了“平坦”的内存空间,而非隔离的区块。这种指针使用方式的普及意味着任何架构上的变更(例如移动段偏移量)都会导致现有软件崩溃。 英特尔因此陷入了僵局;若不破坏兼容性,他们就无法升级架构。尽管作者指出强制实现分段隔离需要更复杂的硬件,但教训很明确:一旦开发者找到了非预期的功能用法,这种行为往往会成为一种僵化的硬性要求,使未来的硬件世代背负过去遗留的技术债务。

最近关于 8086 分段内存架构的 Hacker News 讨论,揭示了历史实用主义与现代技术挫败感之间的巨大分歧。 支持者认为,分段技术是 80 世纪 80 年代初期一项出色且必要的权宜之计。它使 8086 能够在保持低成本和小内存系统功能的同时,提供更大的寻址空间并兼容 8080 软件。通过将段作为“滑动窗口”使用,程序员无需昂贵的内存管理单元 (MMU) 开销,即可高效管理代码、数据和堆栈段。 相反,许多参与者谴责这种架构是一种阻碍技术进步的“肮脏”拼凑。批评者认为,强制程序员手动操作段寄存器和远指针造成了巨大的技术债务,浪费了数百万小时的人力,并使 x86 机器在摩托罗拉 68000 等平坦内存架构出现后,仍长期陷于“死胡同”式的实模式编程模型中。 归根结底,这场辩论凸显了一个经典的权衡:尽管分段架构对开发者来说是一道主要障碍,但它在降低 PC 平台成本和保持兼容性方面所发挥的作用,很可能是其最终占据市场主导地位的决定性因素。这也说明在科技史上,经济可行性往往胜过架构优雅性。

为了规模化生产智能体应用,组织必须解决“预期负担”问题——即在管理高速产出答案的 AI 智能体时所需的认知负荷。当复杂性向人类操作员压迫时,平台必须承担起技术和运营负担,让业务团队能够专注于特定领域的意图。 通过将**团队拓扑(Team Topologies)**应用于智能体环境,我们可以分担这种负荷: * **流线型团队(Stream-aligned teams)**(通常为非技术业务单元)负责智能体的“做什么”(意图和上下文),而平台负责“怎么做”(部署和可靠性)。 * **平台团队(Platform teams)**将系统性的护栏、工具和记忆功能工业化为自助服务能力。 * **赋能团队(Enabling teams)**弥补技能差距,在平台成熟前促进团队实现自主。 * **复杂子系统团队(Complicated subsystem teams)**管理深入的技术挑战(如模型效率),并将其输送至平台。 这种模式改变了开发者的角色:他们从构建单一应用转变为构建赋能业务团队的**智能体平台**。通过“即服务”(X-as-a-Service)的交互方式以及针对重复性护栏的“进阶路径”,这种结构不仅能防止影子 IT 的出现并确保可靠性,还能通过调节认知吞吐量(而非仅仅是简单分配负荷)来实现组织的规模化生产。

抱歉。

最后,自定义主题以匹配您的个人风格或组织品牌。 ``` ( ggplot(anscombe_quartet, aes("x", "y")) + geom_point(color="sienna", fill="orange", size=3) + geom_smooth(method="lm", se=False, fullrange=True, color="steelblue", size=1) + facet_wrap("dataset") + labs(title="Anscombe’s Quartet") + scale_y_continuous(breaks=(4, 8, 12)) + coord_fixed(xlim=(3, 22), ylim=(2, 14)) + theme_tufte(base_family="Futura", base_size=16) + theme( axis_line=element_line(color="#4d4d4d"), axis_ticks_major=element_line(color="#00000000"), axis_title=element_blank(), panel_spacing=0.09, ) ) ``` 就是这样,我们从一行代码开始,逐步改进并自定义了数据可视化效果。想知道如何利用自己的数据开始创建这类可视化吗?在下一节中,我们将介绍如何安装 Plotnine。

关于 **Plotnine**(一个实现“图形语法”——即类似 R 语言中 ggplot2 的 Python 绘图库)的 Hacker News 讨论,凸显了该库的优势以及围绕数据可视化工作流持续存在的争论。 **主要观点包括:** * **图形语法**:用户看重 Plotnine 结构化、组合式的绘图方法,许多人认为它比 Matplotlib 的命令式风格更直观、更灵活。一旦掌握了语法,它常被誉为快速探索数据的“超能力”。 * **API 设计**:使用 `+` 运算符进行图层叠加引发了争论;尽管有人认为这不符合 Python 惯例或令人困惑,但支持者强调,它实现了一种静态的、可组合的 API,避免了臃肿的关键字参数。 * **替代方案与生态系统**:讨论中将其与 Altair(用于声明式、交互式可视化)和 Lets-Plot 进行了比较。一些用户希望 Plotnine 能具备更多交互功能(如悬停/缩放),另一些用户则指出它依赖 Matplotlib 作为底层后端。 * **小提琴图的争论**:讨论延伸到了对小提琴图的更广泛批评,一些专家认为带状图(strip plot)或蜂群图(swarm plot)能更真实地呈现底层数据分布。 总的来说,该库作为偏好 R 风格工作流的 Python 用户的一款成熟工具,受到了好评。

C++26 为 `<format>` 库引入了几项重大改进,提升了易用性与性能: * **简化打印:** `std::println()` 现在支持无参重载,可直接打印换行符。 * **指针直接格式化:** 指针现在无需转换即可直接格式化,并支持针对大小写 (`p`/`P`)、填充和对齐的自定义说明符。 * **改进路径处理:** `std::filesystem::path` 获得了原生的 `std::formatter`,支持带引号 (`?`) 和通用 (`g`) 格式化。关键点在于,它现在可以正确处理 Windows 系统下 UTF-16 到 UTF-8 的转码,从而避免编码问题。 * **`constexpr` 格式化:** 大多数格式化函数(如 `std::format`)现在均为 `constexpr`,支持在编译期生成整数、字符串和指针等类型的字符串。虽然浮点数和区域设置相关类型暂不支持,但这对于模板元编程和诊断信息而言是重大的进步。 * **动态格式化:** 原先称为 `std::runtime_format` 的工具更名为 `std::dynamic_format`,为使用编译期未知的格式字符串提供了更简洁的语法。 这些更新共同使 C++ 格式化库变得更加稳健、兼容跨平台,并在运行时与编译期应用中更加强大。

更多

联系我们 contact @ memedata.com