Claude Code 安全技能测试:只有一个是值得安装的
Claude Code 安全技能测试:只有一个是值得安装的作者:James Bentley
来源:Timonweb.com
引用:https://timonweb.com/ai/i-checked-5-security-skills-for-claude-code-only-one-is-worth-installing/
我写这篇文章是在2026年2月底。Claude Code的技能生态系统发展迅速,这里的具体数字和代码库可能一个月后就会过时。但思考依然适用,所以这可以看作是一个快照。
如果你在使用Claude Code,你可能想知道:它真的能审查我的代码中的安全问题吗?答案是肯定的,但前提是你给它正确的技能。
最近,我寻找了一个安全审查技能。在skills.sh上搜索“security”,得到了一堆结果。我不会只安装最受欢迎的一个并抱有侥幸心理,而是深入研究了每一个。我阅读了SKILL.md文件,检查了代码库,看了它们实际上是如何让Claude在底层执行任务的。
这是我发现的内容。
不要按安装量排序
目前安装量最大的安全审查技能是sickn33/antigravity-awesome-skills@security-review,安装量超过1600次。这听起来很令人印象深刻,直到你意识到这个代码库是一个包含900多个技能的巨大聚合器,拥有15k个星标。人们安装了这个捆绑包,得到了一切,包括这个技能。安装量是一个分布指标,不是一个质量信号。
而这个技能本身?它是另一个技能(affaan-m/everything-claude-code@security-review)的逐字复制版,重新分发而没有添加任何内容。一个文件,没有支持性引用。所以让我们看看原始的和其他领域。
affaan-m/everything-claude-code@security-review
原始的,被广泛复制。它是一个涵盖10个安全领域的清单:秘密管理、输入验证、SQL注入、XSS、CSRF等等。所有代码示例都是TypeScript/Next.js/Supabase。
问题在于?它是一个静态清单。它告诉Claude“寻找这些模式”,但不会教它先检查上下文。如果你在使用Django,它会标记settings.API_URL为潜在的SSRF,因为它不知道服务器配置和用户输入之间的区别。还有一个特别具体的Solana区块链部分,暗示这可能是从一个单一的项目中提取出来的,而不是作为一个通用工具设计的。这个代码库有52k个星标,但这是对50多个技能集的总星标,而不是这个技能本身。
sergiodxa/agent-skills@owasp-security-check
一个结构良好的以OWASP为重点的审计,20条规则分布在5个优先类别中。每条规则都位于自己的markdown文件中,具有一致的格式:影响级别、“为什么它很重要”、要检查的内容、坏模式、好模式。
这是一项很好的工作。作者(Sergio Xalambrí,之前在Vercel工作)显然了解Web开发。但示例仅限于TypeScript,并且没有机制来过滤误报或追踪数据流。它是一个很好的参考,但不是一个方法。
alirezarezvani/claude-skills@senior-security
这个让我感到惊讶。它实际上不是一个代码审查技能。它是一个安全工程工具包:STRIDE/DREAD威胁建模、深度防御架构、事件响应计划。它甚至还提供了用于威胁建模和秘密扫描的Python脚本。对于它所提供的,质量很高,但如果让你“审查这段代码”,它会想为你构建一个威胁模型。这不是正确的工具。
davila7/claude-code-templates@security-review
affaan-m技能的副本,增加了两行frontmatter。正确地归功于原作者,但没有添加任何内容。跳过。
getsentry/skills@security-review
这个与众不同。它不是把一系列坏模式交给Claude,而是教Claude如何思考安全问题。而且,它是当之无愧的赢家。
大多数安全技能都可以被称为“浅层提示包装器”。它们给Claude一个清单,但不会改变它的推理方式。Sentry的技能在本质上与它们不同。它定义了一个方法:
一个防止噪音的信心系统。发现被分类为高(有漏洞的模式+攻击者控制的输入已确认)、中(发现模式但输入来源不明确)或低(理论/最佳实践)。只有高信心的问题会被报告。这本身就使它比标记一切清单的检查表有显著的价值。
误报意识。它知道django.conf.settings的值是服务器控制的,不是用户输入。它知道Django模板默认会自动转义。它特别识别真正危险的模式,如mark_safe(user_input)或pickle.loads(user_data)。这是区别一个浪费时间和一个发现真正漏洞的工具的关键。
在报告之前进行研究。在标记任何内容之前,它会追踪数据流并检查上游验证。它查看代码库的上下文,而不仅仅是单独的diff。
几十个支持性参考文件。17个特定漏洞的指南(注入、XSS、SSRF、CSRF、身份验证、加密等等),Python/Django、JavaScript/Node/React、Go、Rust和Docker/Kubernetes基础设施的指南。这个技能提供了一个完整的知识库,而不仅仅是一个提示文件。
输出也很整洁:结构化的markdown,带有VULN-001/VERIFY-001编号,文件:行位置,信心级别,证据片段和修复建议。
由Sentry团队构建,该公司专门处理大规模的错误和代码质量。这显而易见。
安装它
运行以下命令,它将下载技能到你的项目的.claude/目录:
npx skills install getsentry/skills@security-review
我已经在我的项目中使用了它,它真的很好。它能够捕捉真实的问题,而不会让你淹没在误报中,这正是你想要的代码审查工具。
总结
如果你为Claude Code选择技能,不要只按安装量排序。阅读SKILL.md。一个薄清单和一个方法之间的区别是噪音和信号之间的区别。随着更多技能的发布,安装量问题只会变得更糟。
祝你有美好的一天!
页:
[1]