每日HackerNews RSS

成熟编程语言受益于海量训练数据和完善的工具链(如类型检查器、代码检查工具等),这些工具能有效为大语言模型(LLM)提供“基础支撑”,因此新语言面临着极高的准入门槛。为了在人工智能驱动的生态系统中保持活力,新兴语言(特别是领域特定语言,即 DSL)必须优先考虑开发者体验和人工智能代理的兼容性。 新语言的成功现在取决于三大支柱: 1. **AI 上下文:** 提供结构化、机器可读的文档(例如 `AGENTS.md` 文件),使大语言模型能够轻松学习语言的语法和语义。 2. **交互式引导:** 利用 WebAssembly(WASM)在落地页提供基于浏览器的交互式编辑器,可显著缩短新用户的价值实现时间。 3. **集成化工具:** 开发者必须提供“一站式”的诊断方案。创建一个既能作为运行时又能作为语言服务器的单一二进制文件,可确保在命令行和基于浏览器的编辑器中获得一致的反馈。 通过自动化并简化这些基础性要求,开发者能够打破当前偏向传统语言的“反馈循环”,为迎接专为智能体编程时代打造的各类专业化新语言的爆发铺平道路。

Hacker News 最新 | 过往 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 在LLM时代,一种新的DSL如何生存 (williamcotton.com) 6 分,williamcotton 发布于 1 小时前 | 隐藏 | 过往 | 收藏 | 讨论 | 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

《莱因德数学纸草书》(RMP)中包含了一张将 $2/n$ 分解为单位分数的表格,但作者阿姆斯(Ahmes)是否选择了“最优”展开方式尚不明确。虽然现代分析认为某些展开式在数学上并非最优——例如 $2/95$ 的表示法本可以进一步简化——但这些选择很可能是有意为之。 研究员阿卜杜勒拉赫曼·A·阿卜杜勒阿齐兹(Abdulrahman A. Abdulaziz)指出,阿姆斯的展开式往往偏向于那些易于进行倍增或“十倍化”(乘以 10)运算的分母,而这些过程正是古埃及算术的核心。例如,相比于数学上“更简单”的替代方案,$2/95$ 的展开式在乘以 10 时更为便捷。由于阿姆斯从未记录过其选择特定分数的标准,因此很难判定他的工作存在“缺失”的改进。现代数学家眼中的“错误”,很可能反映了古埃及人在乘法运算背景下,对计算简便性的实用主义及系统性偏好。

抱歉。

GNU 项目的历史揭示了资本主义制度下生产资料与消费品之间的根本区别。虽然该项目的目标是为终端用户提供一套完整的自由系统,但它最终只作为“生产基础设施”获得了成功——即企业用于创造其他产品的软件。 资本主义企业支持 GNU 工具链,是因为它降低了它们的生产成本,从而增加了潜在利润。通过 Cygnus Solutions 等实体,商业利益方提供了维护和开发 GNU 工具所需的物质资源和工程劳动力。这种合作并非意识形态上的矛盾,而是一种务实的协同:企业乐于从免费的生产资料中获益,但它们仍有动力去垄断和控制消费品(如艺术和文化),以榨取利润。 因此,自由软件的成功并非“自由文化”的可行蓝图。由于资本主义依赖于对消费品流通的控制,在当前的经济体系下,文化无法实现真正的自由。该项目的历史证明,在资本主义制度下,只有作为生产手段的软件才能可靠地实现自由;更广泛的文化解放需要社会发生更根本性的变革。

Hacker News 最新 | 过往 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 软件生产基础设施的公地:由资本所建,为资本服务 (marewolf.me) 5 分,由 simonmic 发布于 36 分钟前 | 隐藏 | 过往 | 收藏 | 讨论 | 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系方式 搜索:

本文探讨了模块化如何通过简化复杂的搜索问题,从而加速技术进步与生物演化。 借鉴布莱恩·阿瑟(Brian Arthur)关于技术演化的模拟,作者解释说,复杂技术的最佳创造方式是组合现有的功能组件,而非从零开始构建。这种“模块化”方法有效地屏蔽了无望的探索路径,从而实现了呈指数级增长的进度。 作者认为,生物演化通过有性生殖采用了类似的策略。对比无性与有性生殖的模拟实验表明,无性繁殖种群会遭受“克隆干扰”,即有益突变之间相互竞争并抵消。相比之下,有性生殖允许基因重组,使来自不同谱系的独立有益突变能够结合。这使得演化搜索过程实现模块化,将其从寻找单一完美的“完整”基因组,转变为寻找单个基因位点的最佳变异。 归根结底,技术与生物学都利用这些机制来更快速地获取信息。无论是电路设计师在验证过的子门基础上构建,还是生物体通过基因重组来优化适应度,其核心原则是一致的:模块化缩小了搜索空间,使系统能够以更高的效率演化出复杂性。

Hacker News 最新 | 往期 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 生物进化与信息获取 (construction-physics.com) 6 分,由 chmaynard 发布于 59 分钟前 | 隐藏 | 往期 | 收藏 | 讨论 | 帮助 准则 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

请注意,我有 11 个会禁用灰度模式的应用程序,但有 12 个会启用它的应用程序。为什么会多一个(重新)启用灰度的应用?这个应用是 WhatsApp。这是因为我设置了每当我关闭 WhatsApp 时就触发“启用灰度”的自动化。当然,我并没有为 WhatsApp 启用彩色模式,但我经常使用 WhatsApp,所以这是一个“安全回落”机制:每当彩色模式意外保持开启时,它不会在我关闭 WhatsApp 后持续存在,而这种情况经常发生。(我过去曾设置过一个“每天午夜重置为灰度”的自动化,而“每当我关闭 WhatsApp”的设置取代了它。)你可能需要类似的功能,因为锁定手机并不算作“关闭应用”,所以如果你在例如地图应用中锁定手机,解锁后手机可能仍处于彩色模式(如果锁定时间过长,导致无法回到地图应用,手机会停留在主屏幕上)。

```Hacker News 新闻 | 过往 | 评论 | 提问 | 展示 | 招聘 | 投稿 登录 在日常生活中实用的灰度 iPhone 设置 (fabianhemmert.com) 8 分,由 hemmert 发布于 1 小时前 | 隐藏 | 过往 | 收藏 | 2 条评论 帮助 multiplegeorges 1 分钟前 | 下一条 [–] 将手机设为灰度模式让我深刻体会到了亮丽色彩的威力。手机在灰度模式下显得如此无趣,实在令人震惊。这确实有助于打破对设备的依赖感,而文中的方案也让它变得更加实用。不过,在灰度模式下使用摄像头确实有点糟糕。回复 deepvibrations 2 分钟前 | 上一条 | 下一条 [–] 这太棒了,很希望能看到 Android 系统实现类似功能的方法。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索: ```

该项目通过将分词(tokenization)建模为整数线性规划(ILP)问题,探索了大型语言模型(LLM)最优分词器的计算方法。虽然从理论上讲,寻找最优分词是难以处理的,但作者证明了该问题可以在实践中通过“割平面法”(一种借鉴自旅行商问题求解器的策略)来解决。 通过在连续线性规划中迭代添加有效的约束条件,作者成功为特定数据集(如《傲慢与偏见》)实现了可证明的最优分词器。借助 Codex 辅助的自动化方法,作者确定了“循环约束”是收紧边界并达到最优解的高效手段。 尽管在技术上取得了成功,但作者指出了三个实际局限性: 1. 现有方法(如字节对编码)已达到最优水平的 99% 以内。 2. 训练数据的最优性并不能保证在测试数据上具有更好的泛化能力。 3. 低效问题只需通过增加词汇表大小即可缓解。 总之,虽然这些研究结果在学术上很有趣,并展示了人工智能辅助研究的潜力,但该方法在计算上仍然非常昂贵。未来的进展取决于能否克服求解速度缓慢的问题,并将该方法扩展到预分词(词级约束)之外的领域。

抱歉。

该项目旨在评估大语言模型(LLM)在没有硬编码规则引擎的情况下,模拟复杂《万智牌》(Magic: The Gathering)对局的能力。通过使用 MCP 服务器,模型可以执行基本的库操作(如抽牌、洗牌)来完成复杂的对局动作。 评估结果显示,尽管模型在识别合法行动方面表现尚可,但在实际执行时却频频受阻,常在复杂序列中无法修正错误或遗忘当前游戏状态。 分析的重点之一在于成本效益。使用 MCP 服务器配合 OpenAI API,可以将智能体循环视为单一请求,从而避免重复的缓存输入 Token 费用,以此实现成本最小化。相比之下,Anthropic 目前的实现方式在每次工具调用后都会收取系统提示词费用,导致成本更高。 该项目完全通过“感觉编程”(vibe coding)完成,绕过了手动编程过程。尽管当前工具仅为概念验证,且在速度和成本上不如手动模拟,但作者展望未来,认为随着模型变得更便宜、更准确,可以通过运行数千次并行模拟来实现自动化套牌优化和统计性能分析。该项目已在 GitHub 开源。

抱歉。

作者分享了他们从零开始构建一个“复古大模型”(Vintage LLM)的历程。该模型拥有 3.4 亿参数,采用 Llama 架构,且仅使用 1900 年前出版的英文文本进行训练。出于好奇心,该项目涉及创建自定义数据流水线、设计专用分词器,以及在 Vast.ai 等云平台上进行高算力需求模型训练。 这一过程凸显了数据质量的关键性;作者开发了严格的过滤技术,包括 ZLIB 压缩比、香农熵和自定义字符评分,以剔除低质量的 OCR 伪影。尽管付出了巨大努力,作者指出该模型仅是一个“业余”项目,目前的功能类似于一个随机文本生成器。虽然它能写出维多利亚风格的散文,但缺乏深层的对话连贯性,在基础算术方面也存在困难,这说明了在没有海量高质量指令数据集的情况下训练小型模型所固有的难度。 作者强调,该项目主要是一次学习实践,证明了通过亲手构建大模型可以深入理解其内部机理。代码和模型已在 GitHub 和 HuggingFace 上开源。作者计划通过进一步微调来提升模型的对话能力,并将此项目视为一次对人工智能底层机制充满趣味且极具挑战的探索。

抱歉。

客户端挑战:您的浏览器已禁用 JavaScript。请启用 JavaScript 以继续。本站所需的某个组件无法加载。这可能是由于浏览器扩展、网络问题或浏览器设置所致。请检查您的网络连接、禁用广告拦截器,或尝试使用其他浏览器。

Hacker News 新闻 | 过往 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 这款夹克能从空气中汲取饮用水 (utexas.edu) 6 积分,由 ilreb 在 1 小时前发布 | 隐藏 | 过往 | 收藏 | 讨论 帮助 准则 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

在 Erlang/Elixir 中,集群通常采用全网状拓扑,但也可以配置为稀疏连接。这就带来了一个挑战:当连接不均匀时,单个节点如何映射集群的拓扑结构? 作者探索了“蠕虫式(worming)”遍历集群的方法——利用自传播代码执行洪泛填充遍历。由于集群节点不会自动共享代码,该解决方案涉及: 1. **代码注入**:使用 `Kernel.ParallelCompiler` 和 `:code.load_binary` 创建一个 `Probe` 模块,可以在运行时将其分发并加载到远程节点上。 2. **拓扑映射**:实现一个探测器,查询节点的邻居,然后递归地在这些邻居上触发自身,从而构建集群边缘的完整映射。 3. **本地测试**:利用 `:peer` 模块模拟自定义网状集群,并验证遍历机制。 作者指出,虽然这种方法能够实现强大的内省功能,但必须处理“组长(group leader)”问题,以防止节点之间产生意外的副作用连接。归根结底,这项实验是对 BEAM 运行时内省的一次深入探索,其灵感源于 Joe Armstrong 对分布式系统优雅的处理方式。

Hacker News 最新 | 过往 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 我的 Erlang 集群中的蠕虫,以及微流控技术的探险 (lucassifoni.info) 8 分,由 chantepierre 发布于 2 小时前 | 隐藏 | 过往 | 收藏 | 讨论 | 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

更多

联系我们 contact @ memedata.com