## httpz: 一个零分配的 HTTP/1.1 解析器 & 服务器 httpz 是一个高性能的 HTTP/1.1 解析器和序列化器,使用 OxCaml 构建,旨在实现**零堆分配**。它通过无装箱类型、为记录和列表等数据结构使用本地栈分配,以及直接 bigstring I/O 来实现这一点。 主要特性包括对完整 HTTP/1.1 的支持(方法、头部、分块编码、keep-alive),以及一个生产就绪、即将支持并行、异步静态文件服务器。基准测试表明,与基于 Eio 的解析器(如 `httpe`)相比,httpz 具有显著的速度提升和分配减少——对于小型请求,速度提升高达 3.14 倍,分配的字数减少 94 倍,并实现了 **14.6M 请求/秒 的吞吐量**。 httpz 利用基于 span 的解析和预分配的缓冲区来提高效率。它需要 OxCaml 编译器 ([https://oxcaml.org/](https://oxcaml.org/)),并提供命令行工具用于服务器操作和基准测试。
## Org 模式语法:一种更优的轻量级标记方案
本文认为,与 Markdown、AsciiDoc 和 reStructuredText 等流行的替代方案相比,Org 模式的语法是一种更优的轻量级标记选择——*即使在 Emacs 编辑器之外*。作者认为 Org 模式更直观、更容易学习和记忆,并且至关重要的是,更一致。
重点介绍的功能包括标题、列表和格式化(粗体、斜体等)的简单语法,以及缺乏 Markdown “风格”碎片化世界的标准化方法。虽然像 Pandoc 这样的工具可以转换为其他格式,但作者强调 Org 模式固有的可用性,即使在基本文本编辑器中直接键入时也是如此。
文章批判了其他标记语言的不一致性和复杂性,尤其是在标题和链接方面。它还介绍了“Orgdown”,一个旨在推广 Org 模式语法更广泛采用的项目。最终,作者认为 Org 模式简洁的设计和一致的规则使其成为任何寻求强大而简单的标记语言的人的理想选择。
## 重振胶片扫描仪:复古数字工作流程
出于将35毫米胶片数字化的愿望,作者面临一项独特的挑战:让一台1997年的Epson FilmScan 200扫描仪与现代Mac电脑协同工作。该扫描仪的SCSI接口和过时的驱动程序意味着无法直接连接。解决方案?利用一台复活的Mac SE/30电脑,运行System 7系统。
该项目涉及使用THINK C 5.0从头编写SCSI驱动程序,利用扫描仪不寻常的“处理器”设备类型,该类型通过SCSI使用ESC/I命令。最初的成功来自于单色扫描,但帧选择却很棘手——需要在一个被遗忘的网站上发现一个补丁过的SANE驱动程序,这揭示了扫描仪需要相同的1索引值来进行帧选择。
添加彩色支持涉及处理每个通道(绿、红、蓝)的独立数据块,并正确地将它们交错排列。最终的驱动程序大约450行代码,可以扫描帧并将其保存为PPM/PGM文件,并通过FTP传输。在老旧硬件上完成一次彩色扫描大约需要10分钟。
该项目突出了旧文档的价值、资源丰富的调试能力以及经典电脑在现代工作流程中的惊人效用。代码已在GitHub上提供,允许其他人享受完全怀旧的胶片数字化体验。
## OpenAI 的 ChatGPT Health:伪装的数据市场
OpenAI 推出 ChatGPT Health,尽管面临重大财务损失,但并非出于利他主义,而是源于一个有利可图的商业机会:将个人健康数据变现。尽管 OpenAI 大力强调隐私,但其过去的实践表明,它愿意优先考虑数据收集——甚至对于付费用户——而不是强大的保护。
ChatGPT Health 连接到医疗记录、健康应用程序和设备,以构建详细的用户健康档案。至关重要的是,这些数据不受 HIPAA 保护,而是依赖于 OpenAI 可能随时更改的政策。该服务与 b.well Connected Health 的合作,该公司专注于向保险公司提供更深入的会员洞察,揭示了其真实目的:促进医疗保健市场。
这个市场将连接消费者与医疗服务提供者和保险公司,用户数据将作为主要货币。 OpenAI 故意在数据保护法律不健全的地区(如欧盟)推出该服务,这凸显了对其隐私标准的担忧。最终,ChatGPT Health 并非健康助手,而是一个平台,*你* 是产品,被出售给寻求有针对性地获取健康信息的公司。
## 隐藏的智慧:有意从斯诺登文件移除美国设施细节
最近的调查显示,详细描述美国国内国家侦察局(NRO)情报设施的部分内容,被系统性地从源自斯诺登档案的已发布文件中移除。这些移除行为,在《拦截》(2016年)的报告以及与澳大利亚广播公司(2017年)合作调查的PDF元数据中被发现,与对等*外国*设施的完整描述形成了鲜明对比。
被移除的部分暴露了机密的运营代号——例如“波托马克任务地面站(PMGS)”和“丹佛联合任务地面站(CDMGS)”,以及它们的公开“掩护名称”(例如“经典巫师报告和测试中心”和“航空航天数据设施”)。虽然这些设施为人所知,但它们具体的运营角色此前是保密的。
PDF分析表明,这些信息并非简单地被涂黑,而是从已发布版本中*删除*,但仍然嵌入在文件的版本历史中。元数据时间戳显示只有一次编辑,并且相同修改后的文件在新闻机构之间共享。试图联系负责编辑决定的主要记者未果。这一发现引发了对公开可用的斯诺登泄密信息的完整性,以及优先保护国内情报基础设施的原因的质疑。对PDF元数据的进一步分析正在进行中,揭示了涂黑模式,甚至掩盖敏感信息的失败尝试。