每日HackerNews RSS

Proton Mail是一家受瑞士法律管辖、注重隐私的电子邮件提供商,已与瑞士当局分享了付款数据,随后该数据被美国联邦调查局(FBI)访问。这些数据帮助识别了一名与亚特兰大“停止建设警察城市”运动相关联的匿名账户的个人。 该账户与“捍卫亚特兰大森林”组织有关,该组织抗议建设警察训练中心。当局调查该组织涉嫌纵火、破坏公物和公开个人信息。法庭记录显示,尽管Proton Mail以强大的加密和隐私保护而闻名,但它向第三方提供的的数据量。 值得注意的是,最初与抗议活动有关的60多人的指控已被撤销。此案例凸显了Proton Mail的隐私承诺与其遵守法律请求之间的潜在冲突,即使是在瑞士法律框架内。

## 为Mapillary & Panoramax贡献:摘要 作者开始将行车记录仪的视频分享到街景图像平台。他们发现Mapillary易于使用,因为它支持直接上传视频。然而,为Panoramax贡献内容则更为复杂,需要预处理视频,将其转换为带有地理标签的图像——而他们的行车记录仪并不直接支持这项任务。 为了解决这个问题,作者开发了一个脚本(适用于Garmin 47行车记录仪,在Linux上运行),用于从视频中提取GPS数据,创建等距分布的GPS点,使用`ffmpeg`提取相应的图像,并嵌入GPS/时间元数据。这包括四个关键步骤:使用`exiftool`提取GPS,GPS点插值,精确计时提取图像,以及添加元数据。 该过程利用脚本自动化诸如格式化GPS数据和循环遍历图像进行元数据标记之类的任务。虽然完全自动化上传到Panoramax仍然是未来的目标,但作者分享了详细的步骤和命令,希望帮助面临类似挑战的其他人。他们还暗示了潜在的改进,例如处理数据错误和处理多个片段,并愿意与感兴趣的用户分享他们的脚本。

一个黑客新闻的讨论集中在将行车记录仪视频转换为适用于OpenStreetMap的Panoramax图像。核心挑战是如何从视频中获取GPS数据。用户质疑GPS数据嵌入的频率——每帧、每秒,还是仅在开始时——以及不同行车记录仪型号中的普及程度。 最近的进展表明,特斯拉现在将GPS和遥测数据(如转向和加速度)作为单独的数据流*嵌入*到视频文件中,从而可以提取数据。另一个建议是使用机器视觉直接从视频帧中提取坐标,但对所有帧的准确性表示担忧。 对话还注意到Panoramax(地理标记图像)和谷歌街景(从图像中获取视频)之间具有讽刺意味的互惠需求,并赞扬Panoramax在促进地图应用程序开发中的竞争作用。

GLiNER2 是一种统一高效的信息抽取模型,将命名实体识别、文本分类、结构化数据抽取和关系抽取整合到一个包含 2.05 亿参数的模型中。它擅长一次性执行所有四项任务,并设计用于快速的 CPU 推理——无需 GPU 或外部 API 依赖,确保 100% 本地处理的隐私。 用户可以通过 Python 库 (`pip install gliner2`) 访问 GLiNER2,并利用预训练模型或使用 JSONL 格式的数据对其进行微调。一个更大更强大的 GLiNER XL 1B 模型可以通过 API 访问。高级功能包括可定制的置信度阈值、使用正则表达式进行字段验证以及多任务模式组合。 LoRA 训练允许进行参数高效的微调,为特定领域创建轻量级适配器。GLiNER2 提供全面的文档、教程,并采用 Apache 2.0 许可,研究用途需要引用。它由 Fastino AI 构建,旨在提供易于访问且强大的信息抽取能力。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 工作 | 提交 登录 GLiNER2:统一的基于模式的信息提取 (github.com/fastino-ai) 36 分,apwheele 4小时前 | 隐藏 | 过去 | 收藏 | 3 评论 帮助 iwhalen 2小时前 | 下一个 [–] 非常酷的东西。喜欢专注于CPU优先。也想看看在基本VM设置上的吞吐量数据。 编辑:论文中有一些延迟数据 https://arxiv.org/pdf/2507.18546 回复 deepsquirrelnet 2小时前 | 上一个 | 下一个 [–] 零样本编码器模型太酷了。我一定会去看看这个。 如果你正在寻找一个零样本分类器,tasksource 也是类似的。https://huggingface.co/tasksource/ModernBERT-large-nli 回复 hbcondo714 2小时前 | 上一个 [–] 还有另一个版本在这里:https://github.com/urchade/GLiNER 看起来它也在持续维护?回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

现代柑橘类水果,如橙子、柠檬和柚子,并非简单地从单一祖先演化而来,而是由三种原始物种——柚子、橘子和香橼——杂交产生的复杂混合体。它们的进化历史并非一棵树,而是一个错综复杂的网络,最好用“三元图”来可视化:一个三角形,每个角代表一个原始物种,而水果的位置则表明其基因构成。 这些原始物种在数百万年前就已分化,人类的栽培和贸易进一步混合了它们,尤其偏爱更甜、富含橘子基因的品种。然而,其他原始品种,如通过酸橙引入的沙村柚,以及持续的杂交,使情况变得更加复杂。 三元图并非按时间顺序排列,而是揭示了诸如苦味和甜味等特征的组合如何与人类偏好相符,以及偶然杂交如何塑造了我们今天所知的柑橘类水果。最终,柑橘类水果的多样性既反映了自然进化,*也*反映了人类选择,并在这种独特的基因图谱中得到了完美的可视化。

一个黑客新闻的讨论围绕着一个三元图,可视化柑橘类水果的家谱([jlauf.com](https://jlauf.com))。这个图表由jlauf创建,展示了各种柑橘类水果复杂的遗传关系,超越了简单的树状表示。 用户觉得这个可视化很有趣,有人指出波斯青柠(Key lime和柠檬的杂交)的血统令人惊讶。 几位评论者指出缺少一些柑橘品种,如金桔、香橼和塞维利亚橙,作者解释说,纳入这些品种取决于找到可靠的数据来源。 图表中的交互式搜索功能也存在局限性,在搜索“亚利桑那柠檬”等特定关键词时会失败。 尽管存在这些小问题,但该可视化因其新颖的概念而受到赞扬,并引发了关于某些地区柑橘类水果丰富多样性的讨论。

结构化人工智能正在寻找一位机械设计工程师加入创始团队,构建用于自动化建筑设计质量保证/质量控制的AI代理。这个以产品为中心的角色涉及将实际的暖通空调、机电工程和建筑规范专业知识转化为AI可执行的逻辑,确保专业级别的准确性。 主要职责包括编码工程标准、共同设计和测试AI功能、交付客户报告以及收集来自领先机电工程公司的反馈。理想的候选人拥有2年以上建筑或机电工程经验,具有强大的质量保证/质量控制背景,并能以系统思维方式识别和自动化设计模式。 结构化人工智能旨在消除繁琐的手动审查流程,使工程师能够专注于创新。公司提供全职职位(80,000美元 - 85,000美元),并有可能提供咨询选项,并设想未来AI将与工程师一起*设计*。

黑客新闻新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交登录 Structured AI (YC F25) 正在招聘 (ycombinator.com) 3小时前 | 隐藏 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## OpenTitan:开源安全现已应用于Chromebook OpenTitan,首个开源硅根信任(RoT),现已商业化,搭载于Nuvoton生产的Chromebook中。OpenTitan由Google开发,并得到lowRISC C.I.C.的支持,历时七年打造。它通过确保仅执行授权代码,为设备提供高度安全的基础——由于此类硅的封闭性,此前无法实现这一安全级别。 作为开源项目,OpenTitan具有透明性、独立验证和定制化的优势,用户可以选择商业购买或自行制造。值得注意的是,OpenTitan是首个支持后量子密码学(PQC)的开源RoT,可保护设备免受量子计算带来的未来威胁。 该项目通过严格的测试和详细的文档,拥有行业领先的质量,功能和代码覆盖率超过90%。未来计划包括在Google的数据中心部署,并开发第二代芯片,扩展PQC支持。OpenTitan的成功证明了开源硬件开发的优势,促进了协作和创新,并为在各种应用中更广泛地采用奠定了基础。

## OpenTitan 正式量产:摘要 谷歌的 OpenTitan,一款完全开源的信任根 (RoT) 芯片,现已开始量产——这是同类完全开源硬件的首次。OpenTitan 在学术合作(尤其是在后量子密码学方面)的大力支持下开发,旨在提高硬件的透明度和安全性。 前 lowRISC 开发者庆祝这一里程碑,强调该芯片具有高质量的验证(超过 90% 的功能和代码覆盖率,拥有 40k+ 测试),以及其 IP 模块的可重用潜力。 然而,评论员提出了关于信任的关键点。虽然是开源的,但验证芯片的完整安全性仍然具有挑战性。人们担心部署可能会与不太开放的做法(如锁定引导加载程序)相结合。讨论的重点是如何通过行业采用、基于证书的硬件完整性(如 Matter 的方法)以及更安全的协议(如 mTLS)来建立信任。最终,OpenTitan 的成功不仅取决于芯片本身,还取决于它如何集成到更广泛的系统中。

## 软件许可的未来与AI驱动的重新实现 代码生成的成本降低,尤其是通过AI,正在挑战传统的软件许可模式。最近`chardet`库的事件就是一个例子:其维护者仅使用API和测试套件从头开始重新实现了该库,并将许可从LGPL改为MIT。这引发了争论,原作者认为这是一个衍生作品,而维护者声称是全新实现。 这凸显了一个关键转变——即使是带有copyleft许可(如GPL)的开源代码,也可以被轻松重写。像`readline`甚至`bash`的重新实现项目就证明了这种可行性。核心问题不仅仅是法律上的,更是哲学上的:随着AI促进了毫不费力的重新创作,版权是否还能被执行? 作者认为这种趋势将导致软件以更宽松的许可形式重新出现,甚至以专有软件的形式出现,并建议关注商标而不是许可。虽然承认可能存在冲突,但他们认为这是一个积极的发展,赞成开放共享而非限制性许可,并预计会出现更多“slopforks”(AI辅助的重新实现),以及随之而来的法律辩论。

## AI、代码与版权:摘要 最近,使用AI重新实现的`chardet`库引发了关于大型语言模型(LLM)时代版权和许可的争论。核心问题在于,借助AI生成的代码是否受版权保护,如果不是,这对开源许可意味着什么。 最近的美国法院裁决表明,*没有*大量人工干预的AI生成代码可能进入公有领域,使许可变得无关紧要。这挑战了开发者对其创作保留权利的传统模式。一些人认为,如果LLM在许可代码(如GPL)上进行训练,那么任何输出也应遵守该许可。另一些人则认为,基于API和功能进行重新实现,而不是直接复制代码,属于合理使用。 这场讨论凸显了一种潜在的转变:随着AI使重新实现变得更容易,许可可能变得更难执行,可能导致在宽松许可(如MIT)和完全专有软件之间做出二选一的选择。人们对在没有署名或补偿的情况下使用受版权保护的材料训练AI的伦理问题表示担忧,以及如果代码可以被自由复制,如何激励创新。最终,法律环境正在演变,对软件开发的影响是重大的。

## A/B 测试的 Python 包:比较 本文比较了四个 Python 包 – **tea-tasting**、**Pingouin**、**statsmodels** 和 **SciPy** – 用于分析 A/B 测试结果。它没有评选出唯一的“赢家”,而是阐明了每个包在常见实验任务中的优势以及为获得生产就绪的输出所需的体力工作量。 分析重点在于典型的 A/B 测试工作流程:设计实验、运行测试和分析结果(计算指标值、效应量、置信区间和 p 值)。关键指标类型包括平均值、平均值比率和比例。 **tea-tasting** 专门为 A/B 测试设计,提供简化的工作流程和内置功能,如功效分析、相对效应计算和方差缩减(CUPED)。**Pingouin** 擅长快速、以 pandas 为中心的统计分析,但需要更多体力工作来进行 A/B 特定的计算。**statsmodels** 提供了强大的统计构建块,非常适合希望进行显式控制的分析师。**SciPy** 是一个基础包,提供低级工具,需要最多的自定义编码。 这些包在对相对效应置信区间和多重假设检验校正等功能的支持方面有所不同,从“内置”到“手动”实现不等。最终,最佳选择取决于实验需求的复杂程度和所需的自动化程度。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 比较用于A/B测试分析的Python包(附代码示例) (e10v.me) 8 分,由 e10v_me 发布 9 小时前 | 隐藏 | 过去 | 收藏 | 1 条评论 帮助 e10v_me 9 小时前 [–] 我发布了一篇关于Python包在A/B测试分析中实用比较的文章:tea-tasting, Pingouin, statsmodels 和 SciPy。与其选择一个“最佳”工具,不如分解每个包的适用范围以及生产式实验报告需要多少手动工作。包含代码示例和跨功效分析、比率指标、相对效应置信区间、CUPED、多重检验校正以及处理聚合统计数据以提高效率的功能矩阵。声明:我也是 tea-tasting 的作者。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

该项目详细介绍了如何在Linux系统完全启动*之前*建立持久连接,具体解决了断电时连接丢失的问题。作者由于经常旅行期间遇到频繁断电和动态IP地址,寻求一种超越标准BIOS设置和Tailscale配置的解决方案。 核心思想是将Tailscale和SSH服务器(Dropbear)直接嵌入到`initramfs`中——一个在早期启动期间加载到RAM中的最小操作系统。这允许在解密根分区*之前*进行SSH访问,即使IP地址变化或家庭断电也能实现远程访问。 主要挑战包括保护`initramfs`环境(防止shell访问,管理密钥过期)和配置网络。解决方案包括使用Tailscale ACL限制访问,禁用密钥过期,将SSH限制为密码提示以进行解密,并利用`systemd-network`实现早期以太网连接。 该过程涉及修改`mkinitcpio.conf`以包含必要的钩子,生成专用的SSH密钥,以及重建`initramfs`镜像。最终,这允许在主操作系统加载之前,通过`hostname-initrd`访问系统,从而提供可靠的远程访问解决方案。

## 远程硬盘解锁方案 这次Hacker News讨论的核心是远程解锁加密硬盘,尤其针对服务器和家庭设置。最初的帖子强调了在无需物理访问的情况下允许重启的解决方案的需求,特别是在断电或内核崩溃后。 讨论中涉及了几种方法。**Mandos** 被介绍为基于 Debian 的解决方案,使用标准协议(DNS-SD、OpenPGP、TLS)通过网络检索密码。也提到了 **Tang/Clevis** 等替代方案,但被认为更复杂。其他用户分享了 DIY 解决方案,包括在 initramfs 中使用 SSH、树莓派堡垒主机,甚至定制硬件构建。 一个关键的考虑因素是安全权衡:远程解锁会引入潜在的中间人攻击漏洞。**TPM** 被建议作为更安全的选项,但需要正确的配置,并且不能消除所有风险。对话还涉及了即使存在远程解锁漏洞,全盘加密的好处,因为它可以在物理盗窃场景中提供保护。 最终,最佳解决方案取决于具体的威胁模型和使用场景,范围从简单的家庭服务器到更安全的的企业环境。

启用 JavaScript 和 Cookie 以继续。

更多

联系我们 contact @ memedata.com