論文の概要: CyberEvolver: Structured Self-Evolution for Cybersecurity Agents On the Fly
- arxiv url: http://arxiv.org/abs/2605.26195v1
- Date: Mon, 25 May 2026 16:26:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.286239
- Title: CyberEvolver: Structured Self-Evolution for Cybersecurity Agents On the Fly
- Title(参考訳): CyberEvolver: サイバーセキュリティエージェントをオンザフライで構築したセルフエボリューション
- Authors: Yihe Fan, Changyi Li, Lichen Xu, Xudong Pan, Jiarun Dai, Hong Geng, Min Yang,
- Abstract要約: 我々は、自己進化型サイバーセキュリティエージェントフレームワークであるtextscCyberEvolverを紹介した。
textscCyberEvolverは、失敗した実行試行の経験に基づいて、自身の足場を反復的に修正する。
CTFの課題,脆弱性のエクスプロイト,および4つのオープンソースLCMを用いた侵入テストタスクについて,textscCyberEvolverの評価を行った。
- 参考スコア(独自算出の注目度): 15.168064055560293
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: LLM-based agents are increasingly used for cybersecurity tasks, but most existing systems rely on fixed, human-designed scaffolds that struggle to adapt across diverse targets and failure modes. We introduce \textsc{CyberEvolver}, a self-evolving cybersecurity agent framework that iteratively revises its own scaffold based on experience from failed execution attempts. Self-evolution in cybersecurity is challenging because the space of possible scaffold changes is largely unstructured, execution feedback is sparse and often obscured by the environment, and low-diversity updates can cause errors to compound over repeated iterations. \textsc{CyberEvolver} addresses these challenges with a four-layer evolvable agent architecture that decomposes scaffold optimization into structured components, a trace-to-diagnosis mechanism that converts noisy execution logs into actionable revision signals, and a population-based beam search strategy that preserves diverse agent variants during evolution. We evaluate \textsc{CyberEvolver} on CTF challenges, vulnerability exploitation, and penetration-testing tasks using four open-source LLMs. Across these settings, \textsc{CyberEvolver} improves the seed agent's success rate by $13.6$\,\% on average, and outperforms six human-designed cybersecurity agents as well as two self-improvement methods adapted from other domains. These results suggest that scaffold self-evolution is a promising direction for building adaptive LLM agents for security testing.
- Abstract(参考訳): LLMベースのエージェントはますますサイバーセキュリティタスクに使われているが、既存のシステムの多くは、さまざまなターゲットや障害モードに適応するのに苦労する、固定された人間設計の足場に依存している。
我々は,自己進化型サイバーセキュリティエージェントフレームワークである‘textsc{CyberEvolver}を紹介した。
サイバーセキュリティの自己進化は、考えられる足場変更の空間がほとんど構造化されておらず、実行フィードバックは環境によって疎外され、低多様性の更新が繰り返し繰り返されるエラーを引き起こす可能性があるため、困難である。
\textsc{CyberEvolver} は、足場最適化を構造化されたコンポーネントに分解する4層進化可能なエージェントアーキテクチャ、ノイズのある実行ログを実行可能なリビジョン信号に変換するトレースから診断メカニズム、進化中に多様なエージェントの変種を保存する人口ベースのビームサーチ戦略でこれらの課題に対処する。
CTFの課題,脆弱性のエクスプロイト,そして4つのオープンソースLCMを用いた浸透テストタスクについて,textsc{CyberEvolver} の評価を行った。
これらの設定全体で、 \textsc{CyberEvolver} はシードエージェントの成功率を平均で13.6$\,\%改善し、6つの人間によって設計されたサイバーセキュリティエージェントと、他のドメインから適応された2つの自己改善メソッドを上回っている。
これらの結果から, 足場自己進化は, セキュリティテストのための適応LLMエージェントを構築する上で有望な方向であることが示唆された。
関連論文リスト
- Evolutionary Ensemble of Agents [7.465452178698495]
EvEは、分散化されたフレームワークであり、アルゴリズム発見のためのライブで共進化するシステムにコーディングエージェントを編成する。
2つの共進化する人口を維持することで、EvEはエージェントを同期レースを通じて評価し、経験的Elo格付けを更新する。
固定初期エージェントや凍結した「ベスト進化」エージェントによって駆動される変種と比較して、EvEは位相ミスマッチを独自に回避する。
論文 参考訳(メタデータ) (2026-05-09T15:56:10Z) - NAAMSE: Framework for Evolutionary Security Evaluation of Agents [1.0131895986034316]
我々は,エージェントのセキュリティ評価をフィードバック駆動最適化問題として再編成する進化的フレームワークであるNAAMSEを提案する。
本システムでは,遺伝子プロンプト変異,階層的コーパス探索,非対称的行動スコアリングのライフサイクルを編成する単一自律エージェントを用いている。
Gemini 2.5 Flashの実験では、進化的突然変異がワンショットメソッドによって欠落した脆弱性を体系的に増幅することを示した。
論文 参考訳(メタデータ) (2026-02-07T06:13:02Z) - SCOPE: Prompt Evolution for Enhancing Agent Effectiveness [53.75986399936395]
大規模言語モデル(LLM)エージェントは、大規模で動的なコンテキストを生成する環境にますますデプロイされている。
エージェントはこのコンテキストにアクセスできますが、静的なプロンプトには効果的に管理するメカニズムがありません。
textbfSCOPE (Self-evolving Context Optimization via Prompt Evolution) を導入する。
本稿では,戦術的特異性(即時誤りの解消)と戦略的汎用性(長期原則の進化)のバランスをとるデュアルストリーム機構を提案する。
論文 参考訳(メタデータ) (2025-12-17T12:25:05Z) - The Evolution of Agentic AI in Cybersecurity: From Single LLM Reasoners to Multi-Agent Systems and Autonomous Pipelines [0.0]
サイバーセキュリティはエージェントAIのアーリーアダプターの1つになった。
この調査は、サイバーセキュリティにおけるエージェントAIの5世代分類を提示する。
論文 参考訳(メタデータ) (2025-12-07T05:10:16Z) - AgentCyTE: Leveraging Agentic AI to Generate Cybersecurity Training & Experimentation Scenarios [0.19999259391104388]
本稿では,大規模言語モデルと決定論的・スキーマ制約付きネットワークエミュレーションを統合したフレームワークであるAgentCyTEを提案する。
AgentCyTEはシナリオの結果を観察し、正確性を検証し、リアリズムと一貫性を反復的に強化する。
論文 参考訳(メタデータ) (2025-10-29T05:44:12Z) - A Survey of Self-Evolving Agents: On Path to Artificial Super Intelligence [87.08051686357206]
大きな言語モデル(LLM)は強力な能力を示しているが、基本的に静的である。
LLMはますますオープンでインタラクティブな環境にデプロイされているため、この静的な性質は重要なボトルネックとなっている。
この調査は、自己進化エージェントの体系的で包括的なレビューを初めて提供する。
論文 参考訳(メタデータ) (2025-07-28T17:59:05Z) - On the Resilience of LLM-Based Multi-Agent Collaboration with Faulty Agents [58.79302663733703]
大規模言語モデルに基づくマルチエージェントシステムは、専門家エージェントの協力により、様々なタスクにまたがる優れた能力を示している。
不器用なエージェントや悪意のあるエージェントが与える影響 - システム全体のパフォーマンスにおいて、頻繁にタスクでエラーを犯すものは、いまだに過小評価されていない。
本稿では,下流タスクにおける障害要因下での各種システム構造のレジリエンスについて検討する。
論文 参考訳(メタデータ) (2024-08-02T03:25:20Z) - DS-Agent: Automated Data Science by Empowering Large Language Models with Case-Based Reasoning [56.887047551101574]
大規模言語モデル(LLM)エージェントとケースベース推論(CBR)を利用した新しいフレームワークであるDS-Agentを提案する。
開発段階では、DS-AgentはCBRフレームワークに従い、自動イテレーションパイプラインを構築する。
デプロイメントの段階では、DS-Agentは、シンプルなCBRパラダイムで低リソースのデプロイメントステージを実装し、LCMの基本能力に対する需要を大幅に削減する。
論文 参考訳(メタデータ) (2024-02-27T12:26:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。