每日HackerNews RSS

请启用 JavaScript 和 Cookie 以继续。

抱歉。
WASI 0.3 WASI 0.3 17 天前

WASI 0.3.0 现已正式发布。它在 WebAssembly 组件模型中引入了原生的、基于完成机制的异步支持,标志着一个重要的里程碑。 通过将 `future<T>` 和 `stream<T>` 直接集成到规范 ABI 中,WASI 0.3 取代了 WASI 0.2 中繁琐且需手动编排的事件循环。此前,各组件在协调异步操作时困难重重;现在,宿主环境可以管理一个供所有组件共享的统一事件循环。这一转变简化了组件接口,实现了跨多种语言(包括 Rust、Go、Python 和 JavaScript)的惯用异步绑定,并支持高性能的服务链式调用,有望将服务间的延迟从毫秒级降低至纳秒级。 至关重要的是,WASI 0.3 是一项稳定且已获批准的规范,能够保证长期兼容性。目前,Wasmtime 和 Jco 等运行时已开始提供支持,客户端工具链的更新也正在进行中。通过将异步处理视为“一等公民”,该版本解决了长期存在的组合问题,并为高效、可互操作的 WebAssembly 开发树立了新标准。

这篇文章探讨了“main 函数之前(life-before-main)”的技术威力——即 Rust 二进制文件在用户代码开始运行前,运行时进行引导的阶段。通过利用链接器段和构造函数,开发者可以执行复杂的任务,这些任务通常比传统的运行时方法更高效、更简洁。 核心要点包括: * **初始化与注册:** 利用链接器段和 `ctor` 或 `link-section` 等库,你可以在依赖树的任何位置注册代码或数据(例如 CLI 子命令或插件)。这实现了一种在编译时而非运行时收集数据的依赖注入形式。 * **性能优势:** 由于这种初始化发生在 `main` 之前的单线程环境中,你可以在无需昂贵的锁、原子操作或动态内存分配的情况下初始化或排序数据。 * **架构简洁性:** 这种模式实现了控制反转,允许“收集器”模块从项目的不同部分获取数据,而无需创建复杂的循环依赖。 尽管这些技术功能强大,但使用时需谨慎,因为它们可能会干扰死代码消除(dead-code elimination),涉及平台特定的复杂性,且目前在 Miri 等工具中的支持有限。当你需要高性能、无锁且零分配的数据聚合时,可以考虑使用这些技术。

在文章《Rust 中 `main` 函数之前存在生命》中,作者 mmastrac 探讨了如何利用链接节(link sections)在 `main` 函数执行前执行任务。尽管 Rust 语言本身并未提供原生支持来实现 `main` 之前的初始化,但作者演示了如何通过可变链接节来构建高级抽象,例如链接时优化的集合。 这篇文章在 Hacker News 上引发了热烈讨论。讨论重点在于使用“链接器技巧”的技术影响,评论者指出这存在初始化顺序不确定的风险——这是 C++ 等语言中常见的陷阱。虽然有人认为这些技术有助于改善开发体验(例如自动注册组件),但也有人警告称,在 `main` 函数中进行手动编排通常更安全、更可预测。 该帖子还引发了一场关于作者公开使用 AI 提供反馈和协助绘图的元讨论。这引发了关于“100% 人类撰写”定义的辩论,以及技术写作中关于披露 AI 参与程度的演变标准。最终,讨论达成了一种共识:理解程序的底层启动过程是一项宝贵的技能,无论使用何种编程语言。

Postgres 19 引入了对时态表(Temporal Tables)的原生支持,终于将 SQL:2011 标准带入了数据库核心。此前,开发人员必须依赖复杂的、非直观的 GiST 排他约束或第三方扩展(如 *pg_bitemporal*)来追踪数据的时序变更。 新的实现通过以下三个关键特性简化了时态管理: * **`WITHOUT OVERLAPS`**:允许使用范围类型定义主键,自动防止同一实体出现重叠的日期范围。 * **`FOR PORTION OF`**:支持原生的时态 DML 操作。在更新或删除时,Postgres 会自动处理复杂的行“拆分与合并”,而这些操作以往需要手动在应用逻辑中实现。 * **时态外键**:使用 `PERIOD` 关键字确保跨时间维度的参照完整性,验证子记录的时间线是否完全包含在父记录的有效期内。 尽管 Postgres 19 目前仅支持“应用时间”(现实世界的有效期),尚不支持原生的“系统时间”(事务记录),但此次更新仍是一个重要的里程碑。它用更简洁、更具表现力的语法取代了脆弱的变通方案,显著降低了时间敏感型应用中数据空缺、重叠及错误的风险。

BitBoard 是一个旨在将 AI 生成的数据分析转化为专业且持久的仪表板与报告的平台。用户无需再担心见解丢失在稍纵即逝的聊天记录中,而是可以将数据源直接连接到 BitBoard,让 AI 智能体构建、运行并存储一致且可重复的分析结果。 主要功能包括: * **可追溯性:** 每一项查询和每一行代码都有据可查,确保数据溯源和逻辑可靠,并可随时重新运行。 * **无缝集成:** BitBoard 提供实时数据连接,并可轻松与现有的 AI 编程和聊天工具集成。 * **团队协作:** 通过将分析工作从私聊转入基于浏览器的共享环境,团队可以在不丢失上下文的情况下进行高效协作。 BitBoard 架起了临时 AI 探索与稳健商业智能之间的桥梁,为您提供了一个统一的平台来管理、共享和扩展您的数据见解。

BitBoard (YC P25) 是一个旨在弥合 AI 智能体与商业数据之间差距的“代理式分析工作区”。传统的商业智能(BI)工具无法适应由 AI 驱动的工作流程,而基于聊天的 AI 工具又缺乏数据持久性和来源追踪,相比之下,BitBoard 为人类和智能体提供了一个协作环境。 该平台允许用户连接数据库和 API,使 AI 智能体能够生成实时仪表板、执行 SQL 查询并进行数据分析。与短暂的 AI 对话不同,BitBoard 提供了一致的逻辑、数据来源追踪(每个结果均可追溯)以及共享的语义模型。 核心技术特性包括: * **基础设施:** 使用 DuckDB 和 Apache Arrow 进行高性能的列式分析。 * **协作:** 一个共享工作区,智能体可以在其中识别问题(如指标偏差)并生成自动化的、可验证的仪表板。 * **灵活性:** 支持与 SQL 数据库、数据仓库以及 Salesforce 或 PostHog 等 SaaS API 的安全连接。 创始人 Connor 和 Ambar 强调,他们的目标是提供“基础设施与可视化层”,使智能体能够在企业内部可靠地运行,从而超越静态报告,实现自主的、以目标为导向的数据管理。该工具目前可在 [bitboard.work](https://bitboard.work) 进行试用。

PDF 本质上是视觉化的,其存储的是坐标而非结构信息,这迫使大语言模型(LLM)和文本提取工具必须去推测文档原本的格式。这会导致常见的提取错误,例如句子断裂和层级丢失。 为了解决这一问题,作者利用了一项历史悠久但未被充分利用的 PDF 规范特性:标记内容的替换文本。通过将结构化的 Markdown 嵌入到这一隐藏层中,文档变得具有“自适应性”。 当人类打开 PDF 时,看到的是标准且格式完美的文档;而当机器或大语言模型提取文本时,它们获取的则是清晰的结构化 Markdown,而非原始的视觉数据。这种方法无需新的文件扩展名,也不需要维护两份文件;同一个文件会根据读取者的不同提供不同的输出。测试证实,主流的提取器和大语言模型都能正确解读这种嵌入结构,在不增加令牌(token)数量或改变人类读者所见视觉效果的前提下,显著提高了人工智能工作流的信息密度和可靠性。

这篇 Hacker News 讨论聚焦于《自适应 PDF》(Adaptive PDFs)一文,该文章提出了一种创建 PDF 的新方法,使其既能以格式化文本形式供人类阅读,又能以纯净的结构化 Markdown 供机器解析。 评论者提出了几个核心观点: * **技术可行性**:尽管作者的方法使用了文本替换属性,但其他人指出,现有的 PDF 标准(如嵌入式附件或标签化 PDF)其实早已为此目的而设计,只是在行业内的应用并不普及。 * **安全与风险**:用户警告称,“自适应”内容可能会被利用进行提示词注入,或针对人工智能系统植入恶意指令;随着 LLM 对 PDF 的依赖度日益增加,这一担忧愈发凸显。 * **“人机之争”**:许多人认为,在人工智能时代,对 PDF 的依赖存在根本性缺陷。批评者建议,使用 HTML/CSS 等原生网页格式,对人类获取信息和机器阅读来说效率更高。 * **真实性**:讨论还涉及了围绕 LLM 生成文本的负面观感,作者承诺未来将用自己的语言撰写更新,以避免留下“AI 指纹”。

请提供您想要翻译的内容。

抱歉。

恶意软件开发者发现了一种规避人工智能安全扫描器的巧妙方法:在代码中注入关于核武器和生物武器的文本。这一策略利用了现代大语言模型(LLM)内置的激进式“安全拒绝”机制。由于这些模型被设定为在遇到敏感或危险话题时触发拒绝机制,恶意代码实际上令人工智能“失明”,从而阻碍了其对文件的分析。 安全研究员约翰·斯科特-雷尔顿(John Scott-Railton)指出,这是一个因过度关注人工智能安全性而引发“二阶”风险的关键案例。由于对模型的限制过于严格,开发者无意中制造了攻击者可以轻易利用的盲点。随着网络安全对人工智能的依赖日益增加,这一趋势表明,我们需要开发不会因对抗性提示而受阻、能够处理复杂威胁的“安全钝化程度较低”的模型。归根结底,这凸显了设计能够识别意图的恶意软件分析流程的必要性,以防止此类操纵行为。

这篇 Hacker News 讨论聚焦于恶意软件开发者如何在代码中嵌入有关核武器和生物武器的文本。其目的是触发 AI 安全扫描器的安全护栏,使其“故障开放”(fail open)、停滞或拒绝分析代码,从而绕过自动安全检查。 讨论探讨了几个关键主题: * **护栏的有效性:** 许多用户认为这些 AI 安全限制在很大程度上是“安全剧场”。他们认为,有关武器的技术知识已经广为流传,扩散的主要障碍是获取核裂变材料和工业基础设施的极端困难,而非缺乏“操作指南”信息。 * **政府管制与自由:** 批评者将这些护栏视为企业和政府审查的工具,认为限制知识获取会损害个人自主权。 * **恶意软件逃避:** 安全专业人员指出,AI 模型正成为一种漏洞。通过故意诱导“安全”拒绝,攻击者可以成功避开自动化代码审查,这凸显了在关键安全基础设施中过度依赖大语言模型(LLM)存在的重大缺陷。 * **怀疑论:** 许多参与者对整个 AI 安全运动持怀疑态度,认为其主要目的是规避法律责任或提升企业声誉。

Michael Larabel 是 Phoronix.com 的主要作者,于 2004 年创立了该网站,旨在丰富 Linux 硬件体验。Michael 撰写了超过 20,000 篇文章,涵盖了 Linux 硬件支持状况、Linux 性能、图形驱动程序及其他主题。此外,Michael 还是 Phoronix Test Suite、Phoromatic 和 OpenBenchmarking.org 自动化基准测试软件的首席开发人员。您可以通过 Twitter 或 LinkedIn 关注他,或通过 MichaelLarabel.com 与他联系。

抱歉。

文件基金会(TDF)欢迎近日发布的“Euro-Office”公告及其对开放标准的承诺。然而,TDF澄清,Euro-Office并非首个欧洲开源办公套件,并指出 LibreOffice 及其他成熟项目早已在此领域发挥作用。 虽然TDF赞赏该联盟提升对开放文档格式(ODF)支持的承诺,但他们强调,真正的数字主权不仅仅需要兼容性。一个办公套件若要真正实现自主,必须将 ODF 作为其“原生格式”(即“母语”),而不是仅将该标准视为次要功能。 TDF总结道,尽管提升支持是一个积极的起点,但 Euro-Office 的最终目标应是将 ODF 作为其原生文档格式。他们认为这一转变对于保障长期数字主权至关重要,并期待该项目的发展。

更多

联系我们 contact @ memedata.com