UQLM

开源推理 & 运维 › 安全与护栏⭐ 1.2k

CVS Health 出品的 LLM 幻觉检测工具，1200+ stars。基于不确定性量化的语言模型幻觉检测 Python 包，提供置信度评分和幻觉缓解策略，是 AI 安全与合规的重要工具

🎯适用场景：LLM 输出可靠性检测，AI 安全合规审计，模型评估

#幻觉检测#AI 安全#不确定性量化#CVS Health

📥 收录于 2026/5/22

访问工具

📊 仓库数据

Stars1,183

Forks126

语言Python

更新2026/7/9

✅ 优点

•CVS Health（大型医疗企业）出品，可靠性有背书
•基于不确定性量化，方法论科学
•Python 包形式，易于集成到现有 pipeline

⚠️ 限制

•功能相对单一，仅做幻觉检测
•需要配合其他工具使用

🔗 相关工具

Strix

开源⭐ 40k↑+294

github.com/usestrix/strix

开源 AI 安全黑客工具——自动发现并修复应用漏洞。基于 LLM 的智能渗透测试平台，能自主分析代码、识别安全漏洞并生成修复建议。25K+ stars，是 AI + 网络安全交叉领域的新标杆

🎯AI 安全与合规防护、自动化漏洞扫描与修复

#AI 安全#渗透测试#漏洞扫描#自动化修复

语言Python

🍴 Forks4,185

🔄 更新2026/7/11

📥 收录2026/6/2

AI Infra Guard

开源⭐ 4.1k↑+3

github.com/Tencent/AI-Infra-Guard

全栈 AI 红队测试平台，3.7K+ stars。腾讯安全出品，覆盖 OpenClaw 安全扫描、Agent 扫描、Skills 扫描、MCP 扫描、AI 基础设施扫描和 LLM 越狱评估，是 AI 安全领域的综合性红队工具

🎯MCP 工具协议集成、AI 安全与合规防护

#AI 安全#红队测试#越狱评估#MCP 安全

语言Python

🍴 Forks394

🔄 更新2026/7/10

📥 收录2026/5/19

Claude BugHunter

开源⭐ 2.9k↑+5

github.com/elementalsouls/Claude-BugHunter

Claude Code 安全技能包，1.8K+ stars。71 个技能、15 个斜杠命令、681 个漏洞披露模式，覆盖 24 类核心漏洞类型，含企业级身份和基础设施攻击矩阵

🎯AI 辅助安全测试——用 Claude Code 自动执行漏洞挖掘和红队攻击，提升安全审计效率。

#AI 安全#红队#漏洞挖掘#Claude Code

语言Python

🍴 Forks451

🔄 更新2026/7/10

📥 收录2026/6/9

Gpt Jailbreak Status

开源⭐ 933

github.com/tg12/gpt_jailbreak_status

GPT Jailbreak Status 追踪 OpenAI GPT 系列模型的安全漏洞和越狱状态。定期更新最新越狱方法和修复情况，帮助开发者和安全研究人员了解模型安全态势。

🎯AI 安全研究、模型漏洞追踪、安全评估参考

#AI 安全#Chatgpt#Gpt#越狱测试

语言HTML

🍴 Forks66

🔄 更新2026/6/28

📥 收录2026/6/3

Front-End Checklist

开源⭐ 73k↑+8

github.com/thedaviddias/Front-End-Checklist

现代 Web 开发必备清单，72.8K+ stars。涵盖 HTML、CSS、JavaScript、性能、安全、可访问性等方方面面。已被众多 AI Agent 用作代码审查参考标准

🎯前端开发质量检查、AI 代码审查参考

#checklist#web-development#前端#quality

语言MDX

🍴 Forks6,650

🔄 更新2026/7/11

📥 收录2026/5/31

shannon

开源⭐ 46k↑+16

github.com/KeygraphHQ/shannon

自主白盒 AI 渗透测试工具，分析源代码、识别攻击向量并执行真实漏洞验证，在上线前发现安全风险。

🎯Web 应用和 API 上线前的自动化安全审计和渗透测试

#pentesting#security-audit#ai-security#vulnerability+1

语言TypeScript

🍴 Forks5,293

🔄 更新2026/7/10

📥 收录2026/6/12

← 浏览全部 1267 个工具