論文の概要: Learning Models of Adversarial Agent Behavior under Partial
Observability
- arxiv url: http://arxiv.org/abs/2306.11168v1
- Date: Mon, 19 Jun 2023 21:18:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-21 16:22:12.568123
- Title: Learning Models of Adversarial Agent Behavior under Partial
Observability
- Title(参考訳): 部分観測可能性下における対立エージェント行動の学習モデル
- Authors: Sean Ye, Manisha Natarajan, Zixuan Wu, Rohan Paleja, Letian Chen, and
Matthew C. Gombolay
- Abstract要約: 相手エージェントの動作をモデル化するために,graPh neurAl Network aDvErsarial MOdeliNg wIth mUtualMationを提案する。
PANDEMONiumは、敵の現在の状態と将来の状態を予測するための目的として相互情報を利用する、新しいグラフニューラルネットワーク(GNN)ベースのアプローチである。
- 参考スコア(独自算出の注目度): 6.757727645540147
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The need for opponent modeling and tracking arises in several real-world
scenarios, such as professional sports, video game design, and drug-trafficking
interdiction. In this work, we present graPh neurAl Network aDvErsarial
MOdeliNg wIth mUtual informMation for modeling the behavior of an adversarial
opponent agent. PANDEMONIUM is a novel graph neural network (GNN) based
approach that uses mutual information maximization as an auxiliary objective to
predict the current and future states of an adversarial opponent with partial
observability. To evaluate PANDEMONIUM, we design two large-scale,
pursuit-evasion domains inspired by real-world scenarios, where a team of
heterogeneous agents is tasked with tracking and interdicting a single
adversarial agent, and the adversarial agent must evade detection while
achieving its own objectives. With the mutual information formulation,
PANDEMONIUM outperforms all baselines in both domains and achieves 31.68%
higher log-likelihood on average for future adversarial state predictions
across both domains.
- Abstract(参考訳): 対戦相手のモデリングと追跡の必要性は、プロスポーツ、ビデオゲームデザイン、ドラッグ・トラフィック・インターディクションなど、現実のいくつかのシナリオで生じる。
本稿では、相手エージェントの動作をモデル化するためのgraPh neurAl Network aDvErsarial MOdeliNg wUtual informMationを提案する。
pandemoniumは新たなグラフニューラルネットワーク(gnn)ベースのアプローチであり、相互情報最大化を補助目的として、部分可観測性を持つ敵の現在と将来の状態を予測している。
パンデモニウムの評価には、異種エージェントのチームが単一の敵エージェントを追跡・妨害し、敵エージェントは自身の目的を達成しながら検出を回避しなければならないという現実シナリオに触発された2つの大規模追跡回避ドメインを設計する。
相互情報の定式化により、PANDEMONiumは両ドメインの全てのベースラインを上回り、両ドメイン間の将来の敵対状態予測のために平均して31.68%高いログライクな状態を達成する。
関連論文リスト
- MAP-Former: Multi-Agent-Pair Gaussian Joint Prediction [6.110153599741102]
交通行動予測モジュールから得られる軌道情報と実際に必要とされるものとの間には,軌道のリスク評価のギャップがある。
既存の予測モデルでは、単一エージェントに対する不確実な重み付きエージェントの将来の軌道の合同予測やガウス確率密度関数(PDF)が得られている。
本稿では, エージェント対共分散行列をシーン中心の方法で予測することに着目し, 動き予測への新しいアプローチを提案する。
論文 参考訳(メタデータ) (2024-04-30T06:21:42Z) - Towards a Game-theoretic Understanding of Explanation-based Membership Inference Attacks [8.06071340190569]
ブラックボックス機械学習(ML)モデルは、メンバーシップ推論攻撃(MIA)のようなプライバシ脅威を実行するために利用することができる。
既存の作業は、敵とターゲットMLモデルの間の単一の"What if"相互作用シナリオにおいてのみ、MIAを分析している。
このような最適しきい値が存在することを証明し、MIAの起動に使用できる音響数学的定式化を提案する。
論文 参考訳(メタデータ) (2024-04-10T16:14:05Z) - Interactive Autonomous Navigation with Internal State Inference and
Interactivity Estimation [58.21683603243387]
本稿では,関係時間的推論を伴う3つの補助的タスクを提案し,それらを標準のディープラーニングフレームワークに統合する。
これらの補助的なタスクは、他の対話的エージェントの行動パターンを推測するための追加の監視信号を提供する。
提案手法は,標準評価指標の観点から,頑健かつ最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-11-27T18:57:42Z) - Diffusion Models for Multi-target Adversarial Tracking [0.49157446832511503]
標的追跡は現実世界のシナリオ、特に薬物輸送の対話において重要な役割を担っている。
無人ドローンの普及に伴い、安全と安全のためには正確な自律目標推定がさらに重要である。
本稿では、敵位置の包括的予測を生成するアプローチであるCADENCE(Constrained Agent-based Diffusion for Enhanced Multi-Agent Tracking)を提案する。
論文 参考訳(メタデータ) (2023-07-12T15:34:39Z) - Decentralized Adversarial Training over Graphs [55.28669771020857]
機械学習モデルの敵攻撃に対する脆弱性は、近年、かなりの注目を集めている。
この研究は、個々のエージェントが様々な強度摂動空間に従属するグラフ上の敵の訓練を研究する。
論文 参考訳(メタデータ) (2023-03-23T15:05:16Z) - Targeted Adversarial Attacks against Neural Network Trajectory
Predictors [14.834932672948698]
軌道予測は現代の自律システムの不可欠な構成要素である。
ディープニューラルネットワーク(DNN)モデルは、しばしば軌道予測タスクに使用される。
軌道予測タスクのための DNN モデルに対するターゲット対逆攻撃を提案する。
論文 参考訳(メタデータ) (2022-12-08T08:34:28Z) - AdvDO: Realistic Adversarial Attacks for Trajectory Prediction [87.96767885419423]
軌道予測は、自動運転車が正しく安全な運転行動を計画するために不可欠である。
我々は,現実的な対向軌道を生成するために,最適化に基づく対向攻撃フレームワークを考案する。
私たちの攻撃は、AVが道路を走り去るか、シミュレーション中に他の車両に衝突する可能性がある。
論文 参考訳(メタデータ) (2022-09-19T03:34:59Z) - Deep Interactive Motion Prediction and Planning: Playing Games with
Motion Prediction Models [162.21629604674388]
本研究は,新しい対話型マルチエージェントニューラルネットワークポリシを予測モデルの一部として使用するゲーム理論モデル予測制御器(MPC)を提案する。
本手法の成功の基礎は,周辺エージェントの状態と地図情報に基づいて車両を操縦できる,新しいマルチエージェントポリシーネットワークの設計である。
論文 参考訳(メタデータ) (2022-04-05T17:58:18Z) - Spatio-Temporal Graph Dual-Attention Network for Multi-Agent Prediction
and Tracking [23.608125748229174]
異種エージェントを含む多エージェント軌道予測のための汎用生成ニューラルシステムを提案する。
提案システムは, 軌道予測のための3つのベンチマークデータセット上で評価される。
論文 参考訳(メタデータ) (2021-02-18T02:25:35Z) - Traffic Agent Trajectory Prediction Using Social Convolution and
Attention Mechanism [57.68557165836806]
本稿では,自律走行車周辺における標的エージェントの軌道予測モデルを提案する。
対象エージェントの履歴トラジェクトリをアテンションマスクとしてエンコードし、ターゲットエージェントとその周辺エージェント間の対話関係をエンコードするソーシャルマップを構築する。
提案手法の有効性を検証するため,提案手法を公開データセット上の複数の手法と比較し,20%の誤差低減を実現した。
論文 参考訳(メタデータ) (2020-07-06T03:48:08Z) - Graph Backdoor [53.70971502299977]
GTAはグラフニューラルネットワーク(GNN)に対する最初のバックドア攻撃である。
GTAは、トポロジカル構造と記述的特徴の両方を含む特定の部分グラフとしてトリガーを定義する。
トランスダクティブ(ノード分類など)とインダクティブ(グラフ分類など)の両方のタスクに対してインスタンス化することができる。
論文 参考訳(メタデータ) (2020-06-21T19:45:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。