論文の概要: Building Better Environments for Autonomous Cyber Defence
- arxiv url: http://arxiv.org/abs/2604.08805v1
- Date: Thu, 09 Apr 2026 22:41:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.603083
- Title: Building Better Environments for Autonomous Cyber Defence
- Title(参考訳): 自律型サイバー防衛のためのより良い環境の構築
- Authors: Chris Hicks, Elizabeth Bates, Shae McFadden, Isaac Symes Thompson, Myles Foley, Ed Chapman, Nickolas Espinosa Dice, Ankita Samaddar, Joshua Sylvester, Himanshu Neema, Nicholas Butts, Nate Foster, Ahmad Ridley, Zoe M, Paul Jones,
- Abstract要約: 本稿では,自律型サイバー防衛のための優れた強化学習環境を構築するためのワークショップにおいて,参加者が共有する知識について詳述する。
本研究の貢献は,(1) RLサイバー環境と実システムとのインターフェースを分解するフレームワーク,(2) RLベースのACD環境開発とエージェント評価の現在のベストプラクティスに関するガイドラインの2つである。
- 参考スコア(独自算出の注目度): 7.071210981778692
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In November 2025, the authors ran a workshop on the topic of what makes a good reinforcement learning (RL) environment for autonomous cyber defence (ACD). This paper details the knowledge shared by participants both during the workshop and shortly afterwards by contributing herein. The workshop participants come from academia, industry, and government, and have extensive hands-on experience designing and working with RL and cyber environments. While there is now a sizeable body of literature describing work in RL for ACD, there is nevertheless a great deal of tradecraft, domain knowledge, and common hazards which are not detailed comprehensively in a single resource. With a specific focus on building better environments to train and evaluate autonomous RL agents in network defence scenarios, including government and critical infrastructure networks, the contributions of this work are twofold: (1) a framework for decomposing the interface between RL cyber environments and real systems, and (2) guidelines on current best practice for RL-based ACD environment development and agent evaluation, based on the key findings from our workshop.
- Abstract(参考訳): 2025年11月、著者らは自律サイバー防衛(ACD)のための優れた強化学習環境(RL)についてワークショップを開催した。
本報告では,ワークショップ中に参加者が共有した知識について概説する。
ワークショップの参加者は、学術、産業、政府出身で、RLやサイバー環境を設計し、作業する広範な経験を持つ。
現在、ACDのためにRLで仕事を記述している文献は相当規模にあるが、しかしながら、単一のリソースで包括的に詳細ではない、多くの貿易技術、ドメイン知識、共通のハザードが存在する。
1)RLサイバー環境と実際のシステムとのインターフェースを分解するフレームワーク,(2)RLベースのACD環境開発とエージェント評価の現在のベストプラクティスに関するガイドラインを,ワークショップの要点に基づいて,ネットワーク防衛シナリオにおける自律的RLエージェントの訓練と評価に特に重点を置いている。
関連論文リスト
- Autonomous Continual Learning of Computer-Use Agents for Environment Adaptation [57.65688895630163]
ACuRLは自律的なカリキュラム強化学習フレームワークで、エージェントを人間データゼロの特定の環境に継続的に適応させる。
本研究では,環境内学習と環境横断学習の両方を効果的に実現し,既存の環境を忘れずに4~22%の性能向上を実現した。
論文 参考訳(メタデータ) (2026-02-10T23:06:02Z) - AgentGym-RL: Training LLM Agents for Long-Horizon Decision Making through Multi-Turn Reinforcement Learning [129.44038804430542]
本稿では,マルチターン対話型意思決定のためのLLMエージェントをRLで学習する新しいフレームワークであるAgentGym-RLを紹介する。
本研究では,探索-探索バランスと安定したRL最適化のためのトレーニング手法であるScalingInter-RLを提案する。
当社のエージェントは、さまざまな環境にまたがる27のタスクで、商用モデルにマッチするか、超えています。
論文 参考訳(メタデータ) (2025-09-10T16:46:11Z) - The 1st International Workshop on Disentangled Representation Learning for Controllable Generation (DRL4Real): Methods and Results [132.86866727471093]
本稿では,ICCV 2025と共同で開催されている制御可能生成のための分散表現学習(DRL4Real)の第1回国際ワークショップをレビューする。
DRL4Realは、制御可能生成、モデルの堅牢性、解釈可能性、一般化の進歩を探究するなど、実用的な応用におけるDRL手法の評価に重点を置いている。
ワークショップでは、新しい誘導バイアス(言語など)の統合、DRLへの拡散モデルの適用、3D認識のゆがみ、自律運転や脳波分析のような専門分野へのDRLの拡張など、幅広いトピックをカバーする9つの論文を受理した。
論文 参考訳(メタデータ) (2025-08-15T16:35:41Z) - Large Language Models are Autonomous Cyber Defenders [0.1884913108327873]
自律サイバーディフェンス(ACD)は、人工知能(AI)エージェントによるインシデント対応を自動化することを目的としている。
ほとんどのACDアプローチは単一エージェントシナリオにフォーカスし、強化学習(RL)を活用する。
大きな言語モデル(LLM)は、一般的なセキュリティコンテキストで説明可能なアクションを提供することによって、これらの問題に対処することができる。
論文 参考訳(メタデータ) (2025-05-07T22:42:37Z) - Kinetix: Investigating the Training of General Agents through Open-Ended Physics-Based Control Tasks [3.479490713357225]
我々は、何千万もの2次元物理に基づくタスクを手続き的に生成し、それらを物理制御のための一般強化学習(RL)エージェントの訓練に使用する。
Kinetixは物理ベースのRL環境のオープンエンドスペースで、ロボットの移動やグリップからビデオゲームや古典的なRL環境まで、さまざまなタスクを表現できる。
我々の訓練されたエージェントは、2次元空間において強力な物理的推論能力を示し、目に見えない人間設計環境をゼロショットで解決することができる。
論文 参考訳(メタデータ) (2024-10-30T16:59:41Z) - Aquatic Navigation: A Challenging Benchmark for Deep Reinforcement Learning [53.3760591018817]
ゲームエンジンとDeep Reinforcement Learningの統合の最近の進歩を利用して,水上ナビゲーションのための新しいベンチマーク環境を提案する。
具体的には、最も広く受け入れられているアルゴリズムの一つであるPPOに着目し、先進的なトレーニング手法を提案する。
実験により,これらの成分をうまく組み合わせることで,有望な結果が得られることが示された。
論文 参考訳(メタデータ) (2024-05-30T23:20:23Z) - Towards Autonomous Cyber Operation Agents: Exploring the Red Case [3.805031560408777]
強化・深部強化学習(RL/DRL)がサイバーネットワーク運用のための自律エージェントの開発に応用されている(CyOps)。
トレーニング環境は、エージェントが学び、達成することを目的とした、高い忠実度でCyOpsをシミュレートする必要があります。
優れたシミュレータは、サイバー環境の極端な複雑さのために達成し難い。
論文 参考訳(メタデータ) (2023-09-05T13:56:31Z) - CyGIL: A Cyber Gym for Training Autonomous Agents over Emulated Network
Systems [3.2550963598419957]
CyGILは、ネットワークサイバー操作のためのエミュレートされたRLトレーニング環境の実験ベッドである。
ステートレスな環境アーキテクチャを使用し、MITRE ATT&CKフレームワークを組み込んで、高品質なトレーニング環境を確立する。
その包括的なアクションスペースとフレキシブルなゲームデザインにより、エージェントトレーニングは特定の高度な永続脅威(APT)プロファイルに集中することができる。
論文 参考訳(メタデータ) (2021-09-07T20:52:44Z) - Scenic4RL: Programmatic Modeling and Generation of Reinforcement
Learning Environments [89.04823188871906]
リアルタイム戦略(RTS)環境では,多様な現実シナリオの生成が難しい。
既存のシミュレータのほとんどは環境をランダムに生成することに頼っている。
我々は、研究者を支援するために、既存の形式シナリオ仕様言語であるSCENICを採用する利点を紹介する。
論文 参考訳(メタデータ) (2021-06-18T21:49:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。