MemeData

资本的、由资本所构建的软件生产基础设施公地 A Commons of Software Productive Infrastructure, by and for Capital 18 天前

GNU 项目的历史揭示了资本主义制度下生产资料与消费品之间的根本区别。虽然该项目的目标是为终端用户提供一套完整的自由系统，但它最终只作为“生产基础设施”获得了成功——即企业用于创造其他产品的软件。资本主义企业支持 GNU 工具链，是因为它降低了它们的生产成本，从而增加了潜在利润。通过 Cygnus Solutions 等实体，商业利益方提供了维护和开发 GNU 工具所需的物质资源和工程劳动力。这种合作并非意识形态上的矛盾，而是一种务实的协同：企业乐于从免费的生产资料中获益，但它们仍有动力去垄断和控制消费品（如艺术和文化），以榨取利润。因此，自由软件的成功并非“自由文化”的可行蓝图。由于资本主义依赖于对消费品流通的控制，在当前的经济体系下，文化无法实现真正的自由。该项目的历史证明，在资本主义制度下，只有作为生产手段的软件才能可靠地实现自由；更广泛的文化解放需要社会发生更根本性的变革。

抱歉。

生物进化与信息获取 Biological evolution and information acquisition 18 天前

本文探讨了模块化如何通过简化复杂的搜索问题，从而加速技术进步与生物演化。借鉴布莱恩·阿瑟（Brian Arthur）关于技术演化的模拟，作者解释说，复杂技术的最佳创造方式是组合现有的功能组件，而非从零开始构建。这种“模块化”方法有效地屏蔽了无望的探索路径，从而实现了呈指数级增长的进度。作者认为，生物演化通过有性生殖采用了类似的策略。对比无性与有性生殖的模拟实验表明，无性繁殖种群会遭受“克隆干扰”，即有益突变之间相互竞争并抵消。相比之下，有性生殖允许基因重组，使来自不同谱系的独立有益突变能够结合。这使得演化搜索过程实现模块化，将其从寻找单一完美的“完整”基因组，转变为寻找单个基因位点的最佳变异。归根结底，技术与生物学都利用这些机制来更快速地获取信息。无论是电路设计师在验证过的子门基础上构建，还是生物体通过基因重组来优化适应度，其核心原则是一致的：模块化缩小了搜索空间，使系统能够以更高的效率演化出复杂性。

抱歉。

适用于日常生活的灰度 iPhone 设置 A greyscale iPhone setup that works in everyday life 18 天前

请注意，我有 11 个会禁用灰度模式的应用程序，但有 12 个会启用它的应用程序。为什么会多一个（重新）启用灰度的应用？这个应用是 WhatsApp。这是因为我设置了每当我关闭 WhatsApp 时就触发“启用灰度”的自动化。当然，我并没有为 WhatsApp 启用彩色模式，但我经常使用 WhatsApp，所以这是一个“安全回落”机制：每当彩色模式意外保持开启时，它不会在我关闭 WhatsApp 后持续存在，而这种情况经常发生。（我过去曾设置过一个“每天午夜重置为灰度”的自动化，而“每当我关闭 WhatsApp”的设置取代了它。）你可能需要类似的功能，因为锁定手机并不算作“关闭应用”，所以如果你在例如地图应用中锁定手机，解锁后手机可能仍处于彩色模式（如果锁定时间过长，导致无法回到地图应用，手机会停留在主屏幕上）。

抱歉。

寻找最佳分词器 Finding Optimal Tokenizers 18 天前

该项目通过将分词（tokenization）建模为整数线性规划（ILP）问题，探索了大型语言模型（LLM）最优分词器的计算方法。虽然从理论上讲，寻找最优分词是难以处理的，但作者证明了该问题可以在实践中通过“割平面法”（一种借鉴自旅行商问题求解器的策略）来解决。通过在连续线性规划中迭代添加有效的约束条件，作者成功为特定数据集（如《傲慢与偏见》）实现了可证明的最优分词器。借助 Codex 辅助的自动化方法，作者确定了“循环约束”是收紧边界并达到最优解的高效手段。尽管在技术上取得了成功，但作者指出了三个实际局限性： 1. 现有方法（如字节对编码）已达到最优水平的 99% 以内。 2. 训练数据的最优性并不能保证在测试数据上具有更好的泛化能力。 3. 低效问题只需通过增加词汇表大小即可缓解。总之，虽然这些研究结果在学术上很有趣，并展示了人工智能辅助研究的潜力，但该方法在计算上仍然非常昂贵。未来的进展取决于能否克服求解速度缓慢的问题，并将该方法扩展到预分词（词级约束）之外的领域。

MTG Bench：测试大语言模型玩《万智牌》的能力 MTG Bench: Testing how well LLMs can play Magic 18 天前

该项目旨在评估大语言模型（LLM）在没有硬编码规则引擎的情况下，模拟复杂《万智牌》（Magic: The Gathering）对局的能力。通过使用 MCP 服务器，模型可以执行基本的库操作（如抽牌、洗牌）来完成复杂的对局动作。评估结果显示，尽管模型在识别合法行动方面表现尚可，但在实际执行时却频频受阻，常在复杂序列中无法修正错误或遗忘当前游戏状态。分析的重点之一在于成本效益。使用 MCP 服务器配合 OpenAI API，可以将智能体循环视为单一请求，从而避免重复的缓存输入 Token 费用，以此实现成本最小化。相比之下，Anthropic 目前的实现方式在每次工具调用后都会收取系统提示词费用，导致成本更高。该项目完全通过“感觉编程”（vibe coding）完成，绕过了手动编程过程。尽管当前工具仅为概念验证，且在速度和成本上不如手动模拟，但作者展望未来，认为随着模型变得更便宜、更准确，可以通过运行数千次并行模拟来实现自动化套牌优化和统计性能分析。该项目已在 GitHub 开源。

从零开始制作一个复古大语言模型 Making a vintage LLM from scratch 18 天前

作者分享了他们从零开始构建一个“复古大模型”（Vintage LLM）的历程。该模型拥有 3.4 亿参数，采用 Llama 架构，且仅使用 1900 年前出版的英文文本进行训练。出于好奇心，该项目涉及创建自定义数据流水线、设计专用分词器，以及在 Vast.ai 等云平台上进行高算力需求模型训练。这一过程凸显了数据质量的关键性；作者开发了严格的过滤技术，包括 ZLIB 压缩比、香农熵和自定义字符评分，以剔除低质量的 OCR 伪影。尽管付出了巨大努力，作者指出该模型仅是一个“业余”项目，目前的功能类似于一个随机文本生成器。虽然它能写出维多利亚风格的散文，但缺乏深层的对话连贯性，在基础算术方面也存在困难，这说明了在没有海量高质量指令数据集的情况下训练小型模型所固有的难度。作者强调，该项目主要是一次学习实践，证明了通过亲手构建大模型可以深入理解其内部机理。代码和模型已在 GitHub 和 HuggingFace 上开源。作者计划通过进一步微调来提升模型的对话能力，并将此项目视为一次对人工智能底层机制充满趣味且极具挑战的探索。

这款夹克能从稀薄的空气中提取饮用水 A jacket that harvests drinking water from the air 18 天前

客户端挑战：您的浏览器已禁用 JavaScript。请启用 JavaScript 以继续。本站所需的某个组件无法加载。这可能是由于浏览器扩展、网络问题或浏览器设置所致。请检查您的网络连接、禁用广告拦截器，或尝试使用其他浏览器。

我的 Erlang 集群中的一条蠕虫，以及微流控技术的冒险之旅 A worm in my Erlang cluster, and adventures in microfluidics 18 天前

在 Erlang/Elixir 中，集群通常采用全网状拓扑，但也可以配置为稀疏连接。这就带来了一个挑战：当连接不均匀时，单个节点如何映射集群的拓扑结构？作者探索了“蠕虫式（worming）”遍历集群的方法——利用自传播代码执行洪泛填充遍历。由于集群节点不会自动共享代码，该解决方案涉及： 1. **代码注入**：使用 `Kernel.ParallelCompiler` 和 `:code.load_binary` 创建一个 `Probe` 模块，可以在运行时将其分发并加载到远程节点上。 2. **拓扑映射**：实现一个探测器，查询节点的邻居，然后递归地在这些邻居上触发自身，从而构建集群边缘的完整映射。 3. **本地测试**：利用 `:peer` 模块模拟自定义网状集群，并验证遍历机制。作者指出，虽然这种方法能够实现强大的内省功能，但必须处理“组长（group leader）”问题，以防止节点之间产生意外的副作用连接。归根结底，这项实验是对 BEAM 运行时内省的一次深入探索，其灵感源于 Joe Armstrong 对分布式系统优雅的处理方式。

抱歉。

OpenAI 正在筹备本地部署产品？ OpenAI Prepping for On-Prem Product? 18 天前

OpenAI 更新了其服务条款，针对“许可材料”（指部署在客户本地机器或私有云上的软件、代码或容器）加入了具体规定。其中最关键的一项是强制删除条款：合同终止后，客户必须永久销毁该软件的所有副本。虽然此类表述通常出现在产品正式发布之前，但这释放了一个重要信号，表明了 OpenAI 在本地推理方面的战略方向。对于考虑将 OpenAI 本地部署模型整合进安全敏感型工作流的企业和工作室而言，这一要求是规划时必须考虑的重点，而非微不足道的细节。随着合同到期后必须清除所有许可资产成为不可协商的服务条款，各机构在构建技术流程时，必须将这一“退出成本”纳入考量。

抱歉。

如果你要求他人关注，请先展现出你的诚意。 If you are asking for human attention, demonstrate human effort 18 天前

人工智能生成内容在职场中的兴起引发了一个新的礼仪困境：何时与同事分享机器人撰写的文本才是恰当的？尽管人工智能工具很有价值，但直接转发未经编辑的内容可能会导致“AI疲劳”，并被视为对同事时间的不尊重。核心问题在于投入。当同事在转发人工智能内容时，如果声明他们自己没有进行审阅，这便隐含着一种暗示：接收方的时间不如发送方的时间有价值。为了在技术密集的办公环境中保持职业礼仪并维护人际联系，请遵循一个简单的原则：**如果你需要他人的关注，请先展示你的人工努力。** 分享人工智能生成的工作成果时，请务必做到： * **清晰地标注**内容由人工智能生成。 * **添加个人见解**，以提供背景和价值。 * **在发送前审阅并核实**所有内容。通过采取这些步骤，你能够顾及团队有限的精力，并确保人类的判断始终处于协作过程的核心地位。

这篇 Hacker News 的讨论凸显了软件团队中日益紧张的关系：充斥着未经审核、由 AI 生成的合并请求（PR）与沟通内容。核心抱怨在于，虽然 AI 让生成内容变得轻而易举，但审查这些内容的成本却很高。当团队成员将冗长且未经核实的 AI 内容抛给他人时，会造成一种“残酷的不对称”——审查者花费在纠正和理解工作上的时间，远超作者生成这些内容所花费的时间。参与者认为这种行为是“反社交”的，因为它将质量控制的负担转嫁给了同事。讨论的主要议题包括： * **责任制：** 如果你使用 AI，就必须对结果承担全部责任。提交自己无法解释的代码是失职。 * **验证负担：** 许多人建议通过“把关”来拒绝任何作者显然未亲自审查过的 PR。 * **“Token 对峙”：** 有人建议通过将 AI 的回复再输入给自己的 AI 来节省审查时间，进行反击；但也有人警告称，这会造成一种损害团队凝聚力的“相互保证干扰”。归根结底，共识在于：价值存在于**人类的监管之中**。使用 AI 是可以的，但前提是它必须服务于团队，而不是浪费大家的时间。

每日HackerNews RSS