每日HackerNews RSS

## PII-Shield:Kubernetes零代码日志脱敏 PII-Shield是一个高性能、零代码的Kubernetes边车容器,旨在通过在日志离开应用程序*之前*屏蔽个人身份信息 (PII) 来防止数据泄露。与传统的日志过滤方法(如Fluentd/Logstash中的正则表达式)相比,PII-Shield使用Go语言编写,具有低延迟处理能力,速度更快且资源消耗更少。 它利用上下文感知的熵分析来检测密钥——即使没有已知密钥——并将其替换为确定性哈希(例如,`[HIDDEN:a1b2c]`),以便在不暴露敏感数据的情况下进行质量保证关联。 PII-Shield无需代码更改,适用于任何语言,并且可以作为边车轻松部署,使用initContainer复制二进制文件即可。它经过严格测试,在各种场景下均具有高精度,包括多语言日志和复杂数据结构。配置通过环境变量管理,包括生产环境所需的HMAC盐。 在Docker Hub上找到它:`docker pull thelisdeep/pii-shield:latest`。

## PII-Shield:Kubernetes日志清理 PII-Shield是一个开源(Apache 2.0)工具,旨在自动检测并删除应用程序日志中的敏感信息。它以Kubernetes sidecar或CLI工具的形式提供,使用香农熵分析来识别潜在的密钥——即使没有预定义的模式,例如API密钥(“sk-live-...”)。并使用确定性HMAC哈希来删除这些信息。这确保了在调试和质量保证目的下,一致的删除(例如,“pass123”始终变为“[HIDDEN:a1b2c]”)而不会暴露原始数据。 主要功能包括解析和重建有效的JSON日志,以实现与SIEM的兼容性(ELK/Datadog),以及“fail-open”设计以保持应用程序的正常运行时间。熵阈值可以通过环境变量进行调整,从而可以自定义以避免误报(如UUID)或提高敏感度。目前专注于高熵密钥,开发者正在考虑在未来版本中添加基于值正则表达式或特定字段名称的删除功能。 项目地址:[https://github.com/aragossa/pii-shield](https://github.com/aragossa/pii-shield)

每本小说使用三个专门的AI模型协同工作。比较每个角色中的表现,以了解哪些模型在不同的创意写作任务中表现出色。 概念生成模型:创建概念、情节和世界构建。 写作模型:撰写章节和叙事内容。 记忆模型:维护故事背景并回忆信息。

## AI Wattpad:评估大型语言模型在小说创作方面的能力 Jauws 创建了 Narrator (narrator.sh),一个旨在量化评估大型语言模型(LLM)创作引人入胜小说的能力平台——本质上是一个“AI Wattpad”。现有的基准测试存在不足,它们单独测试记忆等技能,而不是头脑风暴、写作和保持叙事一致性等完整的创作流程。 Narrator 根据真实的读者参与度对 LLM 生成的连载小说进行排名:浏览量、阅读时间、评分和回访次数。该平台利用持久代理循环,为每个模型提供一个“作家笔记本”来维护跨章节的上下文,与一次性生成相比,显著提高了叙事一致性。它还按流派和语言对故事进行分类,以便进行细粒度分析。 目前托管 151 个模型,包括 Anthropic 的模型,Narrator 具有独特“故事分叉”功能,允许读者分支叙事,以及一个视觉 LitRPG 界面。该创建者寻求更多读者参与和合作,以改进长篇 LLM 生成的一致性。虽然初步反馈强调了 UI 问题和故事质量问题,但目标是收集有关 LLM 在创意写作方面的表现的宝贵数据,超越静态基准测试所能提供的范围。

创业加速器Y Combinator现在为春季项目提供选择,以USDC(一种流行的稳定币)接收其标准的50万美元融资。这标志着数字货币走向主流的重要一步,因为传统风险投资公司通常不会提供这种选择。创始人可以选择在以太坊和Solana等区块链上接收资金。 Y Combinator认为稳定币是关键的创新领域,并预计未来会有更多初创公司“链上”融资。此举紧随华尔街和大型科技公司日益增长的兴趣——Stripe、Cloudflare和Klarna最近都已投资或推出了稳定币项目,这得益于稳定币在更快速、更低成本交易方面的潜力。 尽管更广泛的加密货币市场目前面临低迷,但Y Combinator相信对稳定币的热情依然强劲,并且独立于加密货币价格的波动。这表明了人们对稳定币在加密货币交易之外的效用越来越有信心。

禁止 您没有权限访问此服务器上的 /index.php/ijow/article/view/6001/1299。

启用 JavaScript 和 Cookie 以继续。

## Puget Systems 2025 年最可靠硬件 - Hacker News 摘要 最近 Hacker News 的讨论围绕 Puget Systems 关于 2025 年可靠硬件的文章展开。对话强调了一个共同主题:**组件质量显著影响系统稳定性,通常比软件更重要。** 用户分享了经验,即看似随机的崩溃和数据损坏可以追溯到劣质电源、WiFi/BT 卡或 USB 外设。 许多评论员赞扬 Puget Systems 的制造质量和可靠性,并指出他们对散热管理和定制气流解决方案的关注。 内存方面也有讨论,一些人提倡使用 Kingston ValueRAM,因为它具有更宽松的容差和更长的寿命,而另一些人则希望有更便宜的 ECC RAM 可用。 该帖子涉及了对“改装”组件(RGB 照明等)的沮丧,以及对更专业、更低调硬件的渴望。 几家制造商,如 ASUS (CSM 系列)、Streacom 和 Jonsbo 被提及为替代方案。 最后,用户讨论了 Xeon 工作站处理器的可靠性,并将其与消费级 CPU 进行了有利对比。

## AliSQL:为规模和人工智能而优化的MySQL AliSQL是阿里巴巴集团开发的MySQL分支,专为大规模环境中的高性能、稳定运行而设计。8.0.44版本集成了DuckDB作为原生存储引擎,可以直接通过SQL实现轻量级的分析能力。 主要特性包括对企业级向量处理(高达16,383维)的原生支持,并针对语义搜索和推荐等人工智能应用优化了ANN搜索。未来的开发重点将是显著改进DDL操作(速度、安全性、减少延迟)、恢复时间目标(RTO)和复制吞吐量。 AliSQL是开源的(GPL-2.0许可),并由阿里巴巴积极维护,欢迎通过GitHub进行社区贡献。从源代码构建需要CMake、Python3和C++17编译器,仓库中提供了详细的构建说明。

## AliSQL:融合 DuckDB 与向量引擎的 MySQL - 摘要 阿里巴巴的 AliSQL 是一款开源 MySQL 扩展,它将 DuckDB 集成为存储引擎,并增加了向量能力。这使得分析查询可以路由到 MySQL *下方的* 列式引擎,利用现有的连接、工具和复制,而无需单独的分析数据库。 一个关键的挑战是解决 InnoDB(MySQL 的默认引擎)和 DuckDB 之间的数据一致性问题。AliSQL 使用 GTID(全局事务标识符)持久化来处理这个问题,确保即使在崩溃后也能保持数据对齐——在关闭 binlog 时依赖 `mysql.gtid_executed`,在开启时依赖 binlog 位置。 讨论强调了混合事务/分析处理 (HTAP) 的趋势,以及与 PostgreSQL 相比,AliSQL 与 MySQL 架构集成的便利性。虽然 MariaDB 的 ColumnStore 和 ClickHouse 等替代方案存在,但 AliSQL 旨在实现与 MySQL 生态系统的无缝集成。该项目的开发历史似乎有些不寻常,可能表明最近转向开源。

法国和英国当局正在加强对X(前身为Twitter)和埃隆·马斯克的xAI的审查,原因是担心有害内容和数据隐私问题。法国检察官突击搜查了X的办公室,并传唤马斯克接受问询,作为对包括传播儿童性虐待图像、深度伪造、否认大屠杀以及操纵数据系统等指控的调查的一部分。调查始于去年,此前有关于算法偏见的报告,并在马斯克的人工智能聊天机器人Grok出现问题输出后扩大。 与此同时,英国的数据隐私监管机构正在调查X和xAI在Grok开发过程中如何处理个人数据,特别是关于创建未经同意的性化深度伪造图像的问题。欧盟也在进行调查,此前已因之前的数字监管违规行为对X处以1.2亿欧元罚款。 这些调查凸显了国际社会对X遵守内容审核和数据保护法律的日益增长的压力,欧洲刑警组织正在支持法国当局。马斯克最近将xAI被SpaceX收购进一步复杂化了局势。

## X公司在法国被突击搜查 - 摘要 法国当局突击搜查了X(前身为Twitter)的办公室,原因是收到关于该平台处理非法内容的投诉,包括否认大屠杀和儿童性虐待材料(CSAM)。调查还源于指控称X的算法扭曲信息,并可能偏袒极右翼观点。 讨论的重点在于对科技公司进行突击搜查意味着什么——查封工作站并寻求内部通讯,如电子邮件和源代码。人们担心数据可能被删除,并提及了过去的一些例子,如优步的“紧急按钮”功能。 一个关键的争论点是X的AI聊天机器人Grok,以及它在安全措施下生成有问题内容的能力。一些人认为任何AI都可能被操纵,而另一些人则强调Grok相对未审查的特性是促成因素。还有关于X是否应该对其用户生成的内容负责的讨论,以及与其他国家(如美国)的法规进行比较。 最后,一些评论员认为这次突击搜查是出于政治动机,而另一些人则强调CSAM的严重性以及问责的必要性。

这位作者开始了一段可视化家族历史的旅程,尝试了各种家谱工具,如扇形图、太阳图和传统家谱树。虽然这些方法在美观上令人满意,但随着数据量的增加,它们变得难以导航,并且无法清晰地展现超越直系亲属的家庭关系。 为了克服这个问题,他们创建了一个自定义的径向图,将世代分组并使用颜色来追踪血统。这揭示了一些令人惊讶的见解——特别是,姓氏并不能定义一个人的起源。作者发现祖先来自*十三个*不同的姓氏,这挑战了单一家族“家乡”的概念。 研究还强调了摩门教会在家谱研究中的重要贡献,通常被忽视,通过像GEDCOM文件格式和FamilySearch的大规模记录存档等创新。最终,这个项目产生了一棵具有个人意义的家谱树,以及对他们多元遗产的更深理解。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Visual Family Cosmos (rosano.ca) 13 分,akartik 发表于 1 天前 | 隐藏 | 过去 | 收藏 | 2 条评论 elicash 发表于 1 天前 | 下一个 [–] 这不是页面的重点,但我直到与妻子通过 iMessage 分享这个链接时才意识到,你可以使用带有 meta og:video 标签的视频作为分享“图片”。使用的链接是:https://static.rosano.ca/home/blog/2026-01-22-visual-family-... 回复 mikeaskew 发表于 1 天前 | 上一个 [–] 太棒了 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## 重复诈骗瞄准空置土地所有权 作者和他的兄弟多次成为一起诈骗的目标,该诈骗涉及他们在康涅狄格州威尔顿镇于2015年购买的空置土地。尽管他们没有出售意图,但有三名不同的房地产经纪人联系他们,告知有人冒充他们试图将该房产挂牌出售。 骗子利用公开信息,主要通过短信和电子邮件沟通以避免面对面会面,并提供伪造的身份证明——包括使用作者父亲的信息但附有陌生人照片的驾照。他们甚至已经开始获得现金报价,但被勤勉的律师阻止,律师们独立核实了所有权。 联邦调查局提供的帮助有限,只是记录了一份手写投诉。作者建议土地所有者,特别是拥有空置土地的人,主动向县记录员提交“欺诈/无权”通知,以提醒潜在买家和产权调查员。设置Google快讯以跟踪房产地址,并确保在线可见性,也可以帮助防止此类诈骗,这些诈骗利用了无人看管的土地常见的缺乏即时监督的情况。位于 Cannon Road 221号的房产*不*出售。

Xcode 26.3 引入了“代理编码”,这是一种革命性的方法,利用像 Claude Agent 和 OpenAI 的 Codex 这样的人工智能编码代理来增强应用程序开发。在 Xcode 26 的编码助手基础上,此更新赋予代理在 Xcode 环境中更大的自主权。 这些代理现在可以协助整个开发生命周期——从任务分解和基于项目结构做出决策,到利用 Xcode 的工具进行文档搜索、文件浏览和项目设置调整。重要的是,代理可以使用 Xcode 预览来可视化地验证他们的工作,并迭代构建和修复。 苹果的目标是赋予开发者行业领先的技术,而代理编码有望通过简化工作流程并让开发者专注于创新而不是重复性任务,从而显著提高生产力和创造力。

更多

联系我们 contact @ memedata.com