本文详细描述了在一次意外断电后,成功恢复一个严重损坏的12TB Btrfs文件系统,该文件系统跨越3个设备池(数据单副本,元数据DUP,DM-SMR磁盘)的过程。标准的`btrfs check --repair`命令失败,由于extent树和空闲空间树的问题陷入无限循环。 恢复是通过14个基于btrfs-progs API构建的定制C工具实现的,数据损失极小——大约4.59TB中的7.2MB(0.00016%)。作者分享此案例作为研究,*而非*错误报告,并为btrfs-progs的潜在改进提供建设性反馈。 提出了九个具体的改进领域,重点是增强的修复工具功能(进度检测、extent树重建、孤立inode清理)、更清晰的文档以及对已识别边缘情况的修复。定制工具的参考实现以及一个补丁已在GitHub上公开提供,作为进一步调查和讨论的资源,而非直接提交补丁。
## Bun vs. Node.js:Trigger.dev 的 5 倍性能提升
Trigger.dev 在其对延迟敏感的“Firestarter”服务(一个处理数千个长轮询 HTTP 连接的预热连接代理)中用 Bun 替换了 Node.js,从而实现了 **5 倍的吞吐量提升**。初步分析显示 Node.js 实现存在瓶颈:缓慢的 SQLite 查询、过多的 Zod 解析以及低效的头部转换。
第一阶段消除了 SQLite 数据库,用复合键 Map 替换它,实现 O(1) 查找,吞吐量翻倍,延迟减半。第二阶段切换到 Bun 的原生 `bun.serve()` API,进一步将性能翻倍。随后的分析(第三阶段)识别并修复了与 Zod 验证、头部处理和调试日志记录相关的热点,将 CPU 使用率提高了 40%。最后,编译成单个二进制文件(第四阶段)又将吞吐量提高了 14%,并将镜像大小从 180MB 减少到 68MB。
一个关键发现是 Bun 的 HTTP 模型中存在内存泄漏:来自断开连接的客户端的未解决的 Promise。修复此问题稳定了内存使用并进一步提高了性能。该团队强调分析的重要性,在每个步骤进行基准测试,并理解 Bun 独特的 HTTP 生命周期。他们还为常见的 Bun 问题创建了一个调试技能。
最近的研究正在揭示阴蒂的奥秘,这个器官由于社会禁忌和解剖学挑战,历史上一直研究不足。研究人员利用同步加速器的先进X射线技术,首次在微米级别上创建了阴蒂神经的详细三维图像。
发表在bioRxiv上的研究表明,阴蒂背神经(DNC)有力地延伸到阴蒂龟头,广泛分支并连接到周围组织,如耻骨区域。这与先前的神经逐渐变细的假设相矛盾。
这种详细的解剖学图谱具有重要意义。它可以改善针对女性生殖器切割术后患者的重建手术,并帮助外科医生在其他盆腔手术中避免神经损伤。专家强调,随着性别肯定治疗的进步,人们对生殖神经重要性的认识日益增强,并强调需要进一步研究以开发针对相关疾病的更好疗法。该团队计划扩大研究范围,纳入更多样化的捐赠者。
## 软件版本控制:为什么重要以及如何正确实施
最近的一次生产事故暴露了软件版本控制中的一个关键缺陷:无法*精确*知道正在运行的代码是什么。尽管快速识别出潜在的修复方案,但由于缺乏对构建版本和发布的可见性,仍然浪费了数小时。这促使我们重新审视最佳实践,并回忆起十多年前在 i3 窗口管理器中实施的一种解决方案。
核心问题在于令人惊讶的低版本控制标准——即使是家用电器也具有详细的版本信息!有效的软件版本控制需要三个步骤:**标记它!**(包含源代码修订版),**连接它!**(确保此信息在构建和打包过程中不会丢失),以及**报告它!**(在日志、用户界面甚至 HTTP 标头中显示版本信息)。
最有价值的信息是 VCS(版本控制系统)修订版。虽然 Go 现在可以自动使用此数据标记构建,但将其集成到 Nix 等打包系统中可能很复杂。像 `stapelberg/nix/go-vcs-stamping` 这样的叠加层可以弥合这一差距。
最终,优先考虑“版本可观测性”——在整个系统中一致报告 VCS 修订版——是一个高影响、低成本的项目,可以在事件响应期间节省大量时间和压力。不要满足于基本的版本号;要知道*精确*正在运行的代码是什么。
## 社交媒体使用与青少年负面结果相关
一项大型由澳大利亚主导的研究,分析了来自超过35万儿童和青少年超过二十年的数据,揭示了社交媒体使用增加与后期负面结果之间的一致性联系。这些包括更高的抑郁症、自残、药物滥用和更低的学业成就。
该研究发表在《JAMA Pediatrics》上,强调了一个令人担忧的模式:早期参与社交媒体可能会随着时间推移而根深蒂固。虽然该研究并未*证明*因果关系,但它表明花在网上的时间可能会取代有益的活动,如锻炼和现实生活中的社交互动。青少年尤其容易受到影响,因为围绕身份和同伴关系的压力因在线社交比较而加剧。
专家指出,这种关系很复杂;现有的挣扎可能*导致*增加社交媒体的使用,而不是相反。该研究强调了政策变化和平台调整的必要性——特别是解决像自动播放这样的成瘾性设计功能——以为儿童创造更安全的在线环境。这项研究正值指控社交媒体公司故意设计成瘾性平台的法律斗争之际。
## Sheets:终端电子表格
Sheets 将电子表格功能带到你的终端。你可以启动它来直接读取通过 stdin 管道传入的 CSV 数据,或者打开现有的 CSV 文件。导航侧重于键绑定,允许使用 `h, j, k, l` 在单元格之间移动,并使用 `gg`(顶部)或 `B9`(单元格 B9)等命令快速跳转到特定位置。
Sheets 支持通过直接赋值 (`B7=10`) 和插入模式 (`i`) 修改单元格。强大的功能包括搜索 (`/`)、标记 (`ma`)、跳转列表 (`ctrl+o`) 和视觉选择 (`v`),用于复制、剪切和粘贴。公式可以在视觉模式下使用 `=` 插入。
保存、打开其他文件和退出都通过激活 `:` 的命令提示符来完成。安装很简单,可以使用 Go (`go install...`) 或下载预构建的二进制文件。该项目采用 MIT 许可,并欢迎用户反馈。
## 美国基督教:规模与分布
虽然天主教会是美国最大的基督教教派,拥有6190万成员,但其教堂数量并非最多。南方浸信会以51,400个教会的数量领先,尽管其总成员数较少。这突显了一个关键的区别:一些教派将成员集中在较少的地点,而另一些教派则分布更广。
值得注意的是,非宗派教会正在迅速发展,既拥有庞大的成员数量,又拥有广泛的教会网络,反映了人们从传统教派向更广泛的转变。
美国的宗教格局多样化,许多较小的教派为这个支离破碎但充满活力的生态系统做出了贡献。地理模式也发挥着作用,浸信会/福音派教会集中在南方,而天主教在欧洲和拉丁美洲移民众多的地区盛行。
## Gemma Gem:您的本地AI助手
Gemma Gem 是一款 Chrome 扩展程序,它将强大的 AI 助手直接带入您的浏览器,由 Google 的 Gemma 4 模型提供支持。它完全在您的设备上运行——无需互联网连接或 API 密钥——利用 WebGPU 进行快速、私密的处理。
安装后(需要下载约 500MB),Gemma Gem 可以阅读网页、与元素交互(点击按钮、填写表单),甚至执行 JavaScript。您可以通过浏览器中的图标访问它,并通过聊天界面进行交互。
该扩展程序通过内容脚本、服务工作线程和托管模型的离屏文档系统工作。它提供截图捕获、文本提取和页面滚动等工具,所有这些都可以通过自然语言控制。
用户可以自定义 AI 的“思考”过程,并管理上下文清除和特定站点禁用等设置。提供开发版本和生产版本,详细日志可通过 Chrome 的扩展程序检查工具访问。
加州州长加文·纽森周五发布行政命令,禁止州政府官员利用非公开信息在预测市场中获利。 此举是在有关联邦政府内部交易的报道之后,具体涉及在特朗普政府宣布消息之前进行的投注——包括对伊朗的潜在打击以及关于委内瑞拉的行动——使一些人获得了巨额利润(可能超过100万美元)。
纽森将该命令定义为对伦理问题的回应,以及对“内部牟利”的拒绝。 尽管州长办公室引用了具体例子,但主要的预测市场平台Kalshi澄清说,这些事件发生在*不受监管*的市场中,并且他们正在其平台上积极执行内幕交易规则。
与此同时,参议院已提出两党立法,旨在禁止在这些平台上进行体育博彩,理由是州政府对赌博法律的管辖权。 Kalshi反对该法案,认为这将只会促使用户转向不受监管的离岸网站,并扼杀竞争。
## 本地多模态记忆:用搜索查找任何内容
这个工具允许您使用自然语言创建本地、可搜索的文件数据库——包括图像、音频、视频、PDF 和文本。只需嵌入您的文件,然后使用描述性查询*查找*它们,即使没有任何现有的元数据或标签。例如,搜索“团队晚餐”将显示相关的照片!
它由 Gemini Embedding 2(免费版本)和 ChromaDB 提供支持,所有内容都存储在您本地机器上以保护隐私。设置过程经过简化,并配备了一个动画向导,Raycast 扩展程序提供带有缩略图的即时视觉搜索。
**主要特点:**
* **跨模态搜索:** 无缝处理所有文件类型。
* **本地和私密:** 数据保留在您的机器上。
* **易于设置:** 动画向导引导您完成整个过程。
* **Raycast 集成:** 从您的启动器进行快速视觉搜索。
**开始使用:** [https://github.com/hughminhphan/vector-embedded-finder](https://github.com/hughminhphan/vector-embedded-finder)
## GuppyLM:一个小型、可训练的语言模型
GuppyLM是一个拥有900万参数的语言模型,旨在证明构建自己的LLM并不需要大量的资源。它使用单个Colab笔记本和最少的训练时间(约5分钟)创建,展示了语言模型的内部运作——从数据到输出,使其不再像一个“黑盒子”。
该模型体现了一条名为Guppy的小鱼,用简短的、小写的句子交流,专注于它的水生世界:水、食物和鱼缸生活。它故意缺乏对复杂人类概念的理解。
GuppyLM在6万条合成对话上进行训练,涵盖60个主题,利用简单的香草Transformer架构。该项目优先考虑简单性,放弃了像GQA或RoPE这样的高级技术,以保持小规模的清晰度和效率。
代码和预训练模型已在HuggingFace上公开提供,允许任何人进行实验并直接与Guppy聊天。它是一个实际的例子,证明即使没有博士学位或巨大的计算能力,LLM的创建也是可行的。
埃隆·马斯克和美国证券交易委员会(SEC)正在为2022年马斯克收购推特(现X)一事准备法庭对决,此前调解尝试失败。SEC指控马斯克延迟披露其在推特的5%股份,使其得以以较低的价格购买股票,给投资者造成超过1.5亿美元的损失。
马斯克对这些指控表示异议,称诉讼是浪费时间,但之前的驳回案件的尝试均未成功。该程序现在将进入证据开示阶段,马斯克的团队要求最多一年时间来审查大量调查文件。
此案是源于推特交易的几项法律挑战之一,包括最近的陪审团裁决,认定马斯克误导了投资者,以及一起关于操纵股票的集体诉讼。马斯克曾与监管机构和投资者发生过多次冲突,尤其是在2018年的特斯拉推文事件中,并且他的沟通和商业行为一直受到严格审查。
## Termhub:AI驱动的终端控制
Termhub 是一款原生AI工具,旨在简化与终端会话的交互。它使AI能够智能管理终端——打开窗口/标签页,启动会话,发送命令,并仅捕获*新的*输出。这种“发送-捕获增量循环”是高效AI工作流程的关键。
**主要特性:**
* **AI驱动自动化:** 基于AI检查和需求自动化终端任务。
* **跨平台:** 支持macOS (iTerm2, Terminal) 和 Windows (Windows Terminal, CMD)。
* **提供SDK:** 提供JavaScript SDK,用于对终端进行程序化控制。
* **核心命令:** 包括 `open`、`list`、`resolve/find`、`send`、`press`、`capture`、`focus`、`close`、`doctor` 和 `spec`。
* **会话管理:** 使用会话ID或句柄进行精确的目标定位。
* **增量捕获:** 仅捕获命令*发送后*的输出,提高效率。
**安装:** 可通过npm (`@duo121/termhub`)、Homebrew (macOS) 或从GitHub Releases直接下载。
Termhub简化了将终端交互集成到AI应用程序中,为自动化任务提供了一个强大而灵活的解决方案。
加利福尼亚州正进入旱季,雪盖严重不足——全州目前仅为正常水平的18%。 锡埃拉内华达山脉受影响尤其严重,部分地区仅有其典型降雪量的6%。
这令人担忧,因为加利福尼亚州严重依赖融雪作为其供水来源。 今年,较暖的风暴带来了降雨而不是降雪,导致2月/3月出现过早的峰值和快速融化。
虽然加利福尼亚州的雪盖在历史上一直有波动,但科学家们注意到,由于气温升高,一种日益严重的“盛衰循环”正在形成。 在2023年创纪录的降雪之后,这次急剧下降威胁着供水,增加了野火风险,并将给农业和生态系统带来压力。 由于这些剧烈的波动,长期的水资源规划正变得越来越困难。