Back to Projects

自进化智能体 (SEA)

红队对抗系统，采用类似 AutoDAN 的自进化多智能体架构进行 AI 安全攻防研究。

2025年12月15日

AI Security

★ Featured

Tech Stack

Python

Multi-Agent

LLM

Project Details

Self-Evolving Multi-Agent System (SEA)

一个用于 AI 安全研究的自进化多智能体攻防系统。

问题背景

静态提示：一旦找到攻击向量（越狱），它会永远有效直到人工修补
无学习能力：标准 Agent 每次对话后重置记忆，会重复犯错

解决方案

实现 自进化智能体 架构：

多智能体：Attacker, Defender, Judge, Reflector 角色分工
数据飞轮：每次交互被记录、分析、提炼为 "经验教训" 更新长期记忆
原生 Python：无重型框架，确保 Agent 对自己 "脑代码" 的完全可见性和控制

架构

Battle Arena (短期记忆)
  Attacker → Defender → Judge → 结果

Evolution Engine (长期记忆)
  Logger → Reflector → Memory Bank → 更新 A & D