## 黑客新闻数据集:完整档案 该数据集提供自2006年成立以来,黑客新闻(HN)提交的每一项内容的完整、实时更新档案,截至2026年3月,总计超过4700万项内容。HN由Y Combinator维护,是技术人员和企业家们的重要在线社区。 数据来源于镜像HN Firebase API的ClickHouse Playground,组织成每月Parquet文件,并对当前日期进行5分钟实时更新。它包括故事、评论、投票、招聘信息和用户数据(用户名),允许对趋势、讨论和社区动态进行深入分析。 **主要特点:** * **完整且更新:** 每5分钟持续更新,确保接近实时的数据。 * **高效格式:** 存储为Parquet格式,方便使用DuckDB和`datasets`库进行快速查询。 * **详细数据:** 包括项目ID、类型、作者、时间戳、文本、评分、URL和后代计数。 * **易于访问:** 在Hugging Face上提供,方便下载和使用。 **潜在用途:** 语言模型训练、情感分析、社区研究和信息检索。 该数据集采用开放数据共享许可协议(Open Data Commons Attribution License)。更多详细信息,包括数据模式和使用示例,可在Hugging Face数据集页面上找到。
## Snowflake Cortex 代码 CLI 漏洞摘要
Snowflake Cortex 代码 CLI 在 2026 年 2 月 2 日发布后不久被发现存在一个严重漏洞。该漏洞允许攻击者执行 CLI 沙盒*外部*的任意命令,绕过人工审批,通过精心设计的提示注入实现。
攻击链涉及欺骗 Cortex 下载并执行恶意脚本——隐藏在看似无害的第三方代码仓库中——使用进程替换并利用命令验证系统中的一个弱点。具体来说,`<()>` 表达式中的命令没有得到妥善验证,即使在“安全”命令前缀下也能执行。
成功利用使攻击者能够在受害者的机器上执行远程代码,并可能利用缓存的 Snowflake 凭据来窃取数据、删除表或破坏 Snowflake 实例。该漏洞由 PromptArmor 于 2 月 5 日负责任地披露,Snowflake 于 2 月 28 日发布了修复程序(版本 1.0.25),并在更新时自动应用。
该事件凸显了 LLM 驱动工具中提示注入的风险以及即使在沙盒环境中,健壮的命令验证的重要性。 Snowflake 的完整建议在其社区网站上提供。