Show HN：我们微调了一个模型，它可以进行渗透测试，而不是拒绝处理你的代码。

Show HN：我们微调了一个模型，它可以进行渗透测试，而不是拒绝处理你的代码。
Show HN: We post-trained a model that pen tests instead of refusing

# api.your-app.com — 渗透测试业务预约 2A4F · 2026-06-08 · 4小时22分 · 中等工作量 ## 执行摘要状态：2个严重、1个高危、3个中危 — 均可复现。范围：2台主机，47个端点。范围外项目已推迟并标记，留待下一次测试。 ## 已确认的漏洞利用 1. **JWT 签名绕过 (严重 · CVSS 8.6)** POST /v1/sessions/refresh — 通过禁用签名验证伪造令牌，返回 200 OK 并获得管理员权限。已附带复现脚本。 2. **通过 OAuth 同意重定向进行的 SSRF (高危 · CVSS 7.4)** /oauth/authorize 上的开放重定向漏洞，可解析任意内部 URL。已附带复现说明。 [ 已截断 — 完整摘要包含每个漏洞的证据及修复建议 ]

抱歉。

“Argus”是 Cosine (YC W23) 开发的一款全新安全工具，旨在帮助中小型企业识别软件漏洞。与那些对攻击性任务执行严格拒绝的大型 AI 模型不同，Argus 使用了经过“夺旗赛”（CTF）数据微调的 Kimi K2.6 模型。该工具提供两种主要模式：用于只读审计的本地代码库扫描器，以及一种主动式“渗透测试”模式——该模式会在沙盒环境中尝试攻击实时系统，从而提供可验证的漏洞证明。该项目在 Hacker News 上引发了关于 AI 安全性和可访问性的争论。开发者认为，负责任的企业需要强大的红队工具来保障安全；而批评者则将其限制性访问策略称为“模仿营销”或“人为稀缺”。另一些人则质疑将此类工具封闭在专有 API 之后的伦理问题，认为开源模型已经使这些防护措施变得无效。开发团队坚持认为，虽然他们目前限制了主动攻击模式的使用，但他们的目标是在安全考量与企业主动加固系统以应对现实威胁的需求之间取得平衡。

# api.your-app.com — Pen Test Engagement

booking 2A4F · 2026-06-08 · 4h22m · Moderate effort

## Executive Summary

Status: 2 critical, 1 high, 3 medium — all reproducible.

Scope: 2 hosts, 47 endpoints. Out-of-scope items deferred and flagged for next engagement.

## Confirmed Exploits

1. JWT signature bypass (CRITICAL · CVSS 8.6)
POST /v1/sessions/refresh — forged token with disabled signature verification, returned 200 OK with admin scope. Reproduction script included.

2. SSRF via OAuth consent redirect (HIGH · CVSS 7.4)
Open redirect on /oauth/authorize resolved arbitrary internal URLs. Reproduction included.

[ trimmed — full summary includes evidence and remediation per finding ]

Show HN：我们微调了一个模型，它可以进行渗透测试，而不是拒绝处理你的代码。 Show HN: We post-trained a model that pen tests instead of refusing

Show HN：我们微调了一个模型，它可以进行渗透测试，而不是拒绝处理你的代码。
Show HN: We post-trained a model that pen tests instead of refusing