Back to Projects
自进化智能体 (SEA)
红队对抗系统,采用类似 AutoDAN 的自进化多智能体架构进行 AI 安全攻防研究。
AI Security
★ Featured
Tech Stack
Python
Multi-Agent
LLM
Project Details
Self-Evolving Multi-Agent System (SEA)
一个用于 AI 安全研究的自进化多智能体攻防系统。
问题背景
- 静态提示:一旦找到攻击向量(越狱),它会永远有效直到人工修补
- 无学习能力:标准 Agent 每次对话后重置记忆,会重复犯错
解决方案
实现 自进化智能体 架构:
- 多智能体:Attacker, Defender, Judge, Reflector 角色分工
- 数据飞轮:每次交互被记录、分析、提炼为 "经验教训" 更新长期记忆
- 原生 Python:无重型框架,确保 Agent 对自己 "脑代码" 的完全可见性和控制
架构
Battle Arena (短期记忆)
Attacker → Defender → Judge → 结果
Evolution Engine (长期记忆)
Logger → Reflector → Memory Bank → 更新 A & D