論文の概要: Deceptive Planning for Resource Allocation
- arxiv url: http://arxiv.org/abs/2206.01306v1
- Date: Thu, 2 Jun 2022 21:23:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-06 14:36:34.387882
- Title: Deceptive Planning for Resource Allocation
- Title(参考訳): 資源配分の認知的計画
- Authors: Yagiz Savas, Mustafa O. Karabag, Brian M. Sadler, Ufuk Topcu
- Abstract要約: 我々は、敵の環境をナビゲートする自律エージェントのチームが、目標とする場所のセットにリソースを割り当てることで、タスクを達成することを目指している。
環境の敵は、自律チームの行動を観察し、彼らの目的を推測し、彼らのリソースを目標の場所に配置する。
我々は,目標とする最終資源配分を達成しつつ,その目的について敵を欺くことができるように,自律チームの密度を制御する戦略を開発する。
- 参考スコア(独自算出の注目度): 36.95301826863314
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider a team of autonomous agents that navigate in an adversarial
environment and aim to achieve a task by allocating their resources over a set
of target locations. The adversaries in the environment observe the autonomous
team's behavior to infer their objective and counter-allocate their own
resources to the target locations. In this setting, we develop strategies for
controlling the density of the autonomous team so that they can deceive the
adversaries regarding their objective while achieving the desired final
resource allocation. We first develop a prediction algorithm, based on the
principle of maximum entropy, to express the team's behavior expected by the
adversaries. Then, by measuring the deceptiveness via Kullback-Leibler
divergence, we develop convex optimization-based planning algorithms that
deceives adversaries by either exaggerating the behavior towards a decoy
allocation strategy or creating ambiguity regarding the final allocation
strategy. Finally, we illustrate the performance of the proposed algorithms
through numerical simulations.
- Abstract(参考訳): 我々は、敵環境をナビゲートする自律エージェントのチームが、目標とする場所のセットにリソースを割り当てることで、タスクを達成することを目指している。
環境の敵は自律チームの行動を観察し、目標を推測し、自身のリソースを目標の場所に配置する。
そこで本研究では,自律的なチームの密度を制御し,目的について敵を騙し,最終的な資源配分を達成するための戦略を策定する。
まず,最大エントロピーの原理に基づく予測アルゴリズムを開発し,敵が期待するチームの振る舞いを表現する。
そして,Kulback-Leibler の発散による誤認性を測定することで,デコイアロケーション戦略に対する振る舞いを誇張したり,最終的なアロケーション戦略に関する曖昧さを創り出すことで,敵を欺く凸最適化に基づく計画アルゴリズムを開発する。
最後に,数値シミュレーションによる提案アルゴリズムの性能について述べる。
関連論文リスト
- Collaborative AI Teaming in Unknown Environments via Active Goal Deduction [22.842601384114058]
協調エージェントを訓練するための既存のアプローチは、しばしば定義され既知の報酬信号を必要とする。
本稿では,カーネル密度ベイズ逆学習法をアクティブなゴール推論に活用する未知のエージェントフレームワークと組むことを提案する。
我々のフレームワークにおける不偏報酬推定は、未知のエージェントと最適なチームを作るのに十分であることを示す。
論文 参考訳(メタデータ) (2024-03-22T16:50:56Z) - Discriminative Adversarial Unlearning [40.30974185546541]
我々は、min-max最適化パラダイムの確立した原則に基づいて、新しい機械学習フレームワークを導入する。
我々は、訓練されたモデルから特定のサンプルの学習を容易にするために、強力なメンバーシップ推論攻撃(MIA)の能力を利用する。
提案アルゴリズムは,スクラッチから再学習する理想的なベンチマークを,ランダムサンプルの忘れ方とクラスワイドの忘れ方の両方に近似する。
論文 参考訳(メタデータ) (2024-02-10T03:04:57Z) - Discrete Factorial Representations as an Abstraction for Goal
Conditioned Reinforcement Learning [99.38163119531745]
離散化ボトルネックを適用することにより,目標条件付きRLセットアップの性能が向上することを示す。
分布外目標に対する期待した回帰を実験的に証明し、同時に表現的な構造で目標を指定できるようにします。
論文 参考訳(メタデータ) (2022-11-01T03:31:43Z) - AdvDO: Realistic Adversarial Attacks for Trajectory Prediction [87.96767885419423]
軌道予測は、自動運転車が正しく安全な運転行動を計画するために不可欠である。
我々は,現実的な対向軌道を生成するために,最適化に基づく対向攻撃フレームワークを考案する。
私たちの攻撃は、AVが道路を走り去るか、シミュレーション中に他の車両に衝突する可能性がある。
論文 参考訳(メタデータ) (2022-09-19T03:34:59Z) - A Tale of HodgeRank and Spectral Method: Target Attack Against Rank
Aggregation Is the Fixed Point of Adversarial Game [153.74942025516853]
ランクアグリゲーション手法の本質的な脆弱性は文献ではよく研究されていない。
本稿では,ペアデータの変更による集計結果の指定を希望する目的のある敵に焦点をあてる。
提案した標的攻撃戦略の有効性は,一連の玩具シミュレーションと実世界のデータ実験によって実証された。
論文 参考訳(メタデータ) (2022-09-13T05:59:02Z) - On Almost-Sure Intention Deception Planning that Exploits Imperfect
Observers [24.11353445650682]
意図的な騙しは、エージェントの意図や目的に対する間違った信念に敵を欺く戦略を計算することを含む。
本稿では,意図的騙しを伴う確率的計画問題の類型を考察し,防御者の限定的な感覚的モダリティをどのように活用するかを考察する。
論文 参考訳(メタデータ) (2022-09-01T16:38:03Z) - Generative multitask learning mitigates target-causing confounding [61.21582323566118]
マルチタスク学習のための因果表現学習のためのシンプルでスケーラブルなアプローチを提案する。
改善は、目標を狙うが入力はしない、観測されていない共同ファウンダーを緩和することによる。
人の属性とタスクノミーのデータセットに対する我々の結果は、事前の確率シフトに対するロバストネスの概念的改善を反映している。
論文 参考訳(メタデータ) (2022-02-08T20:42:14Z) - Deceptive Decision-Making Under Uncertainty [25.197098169762356]
タスクを遂行しながら,外部の観察者の意図を判断できる自律エージェントの設計について検討する。
エージェントの動作をマルコフ決定プロセスとしてモデル化することにより、エージェントが複数の潜在的な目標を達成するための設定を考える。
本稿では,最大エントロピーの原理に基づいて観測者予測をモデル化し,認識戦略を効率的に生成する手法を提案する。
論文 参考訳(メタデータ) (2021-09-14T14:56:23Z) - Provably Efficient Algorithms for Multi-Objective Competitive RL [54.22598924633369]
エージェントの報酬がベクトルとして表現される多目的強化学習(RL)について検討する。
エージェントが相手と競合する設定では、その平均戻りベクトルから目標セットまでの距離によってその性能を測定する。
統計的および計算学的に効率的なアルゴリズムを開発し、関連するターゲットセットにアプローチする。
論文 参考訳(メタデータ) (2021-02-05T14:26:00Z) - Revisiting Membership Inference Under Realistic Assumptions [87.13552321332988]
従来研究でよく用いられていた仮定のいくつかが緩和された環境での会員推定について検討する。
この設定は、研究者が通常考慮するバランスのとれた事前設定よりも現実的である。
我々は、トレーニングセットメンバーに対応する入力が損失関数の局所最小値に近いという直感に基づく新しい推論攻撃を開発する。
論文 参考訳(メタデータ) (2020-05-21T20:17:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。