論文の概要: Diversifying Agent's Behaviors in Interactive Decision Models
- arxiv url: http://arxiv.org/abs/2203.03068v1
- Date: Sun, 6 Mar 2022 23:05:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-08 17:52:12.631835
- Title: Diversifying Agent's Behaviors in Interactive Decision Models
- Title(参考訳): 対話型意思決定モデルにおけるエージェントの多様性
- Authors: Yinghui Pan, Hanyi Zhang, Yifeng Zeng, Biyang Ma, Jing Tang and Zhong
Ming
- Abstract要約: 他のエージェントの振る舞いをモデル化することは、複数のエージェント間の相互作用に関する決定モデルにおいて重要な役割を果たす。
本稿では,その相互作用に先立って,被験者の意思決定モデルにおける他のエージェントの行動の多様化について検討する。
- 参考スコア(独自算出の注目度): 11.125175635860169
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modelling other agents' behaviors plays an important role in decision models
for interactions among multiple agents. To optimise its own decisions, a
subject agent needs to model what other agents act simultaneously in an
uncertain environment. However, modelling insufficiency occurs when the agents
are competitive and the subject agent can not get full knowledge about other
agents. Even when the agents are collaborative, they may not share their true
behaviors due to their privacy concerns. In this article, we investigate into
diversifying behaviors of other agents in the subject agent's decision model
prior to their interactions. Starting with prior knowledge about other agents'
behaviors, we use a linear reduction technique to extract representative
behavioral features from the known behaviors. We subsequently generate their
new behaviors by expanding the features and propose two diversity measurements
to select top-K behaviors. We demonstrate the performance of the new techniques
in two well-studied problem domains. This research will contribute to
intelligent systems dealing with unknown unknowns in an open artificial
intelligence world.
- Abstract(参考訳): 他のエージェントの振る舞いをモデル化することは、複数のエージェント間の相互作用に関する決定モデルにおいて重要な役割を果たす。
自己決定を最適化するには、被写体エージェントは、不確実な環境で同時に行動する他のエージェントをモデル化する必要がある。
しかし、エージェントが競争力があり、対象エージェントが他のエージェントについて完全な知識を得ることができない場合に、モデリング不足が発生する。
エージェントが協力している場合でも、プライバシー上の懸念から本当の行動を共有できないかもしれない。
本稿では,その相互作用に先立って,被験者の意思決定モデルにおける他のエージェントの行動の多様化を検討する。
他エージェントの行動に関する事前の知識から始め、既知の行動から代表的行動特徴を抽出するために線形還元法を用いる。
その後,特徴を拡張して新たな行動を生成し,トップk行動を選択するための2つの多様性計測を提案する。
2つのよく研究された問題領域における新しい手法の性能を示す。
この研究は、オープン人工知能の世界における未知の未知を扱うインテリジェントシステムに貢献する。
関連論文リスト
- DCIR: Dynamic Consistency Intrinsic Reward for Multi-Agent Reinforcement
Learning [84.22561239481901]
本稿では,エージェントの行動が他のエージェントの行動と一致しているかどうかを学習するための新しいアプローチを提案する。
マルチエージェント粒子, Google Research Football および StarCraft II Micromanagement を含む複数の環境における DCIR の評価を行った。
論文 参考訳(メタデータ) (2023-12-10T06:03:57Z) - Fact-based Agent modeling for Multi-Agent Reinforcement Learning [6.431977627644292]
Fact-based Agent Modeling (FAM) 法は,Fact-based belief inference (FBI) ネットワークがローカル情報のみに基づいて,部分的に観測可能な環境下で他のエージェントをモデル化する手法である。
種々のマルチエージェント粒子環境(MPE)上でFAMを評価し,その結果を最先端のMARLアルゴリズムと比較した。
論文 参考訳(メタデータ) (2023-10-18T19:43:38Z) - AgentCF: Collaborative Learning with Autonomous Language Agents for
Recommender Systems [112.76941157194544]
本稿では,エージェントベースの協調フィルタリングにより,レコメンデータシステムにおけるユーザとイテムのインタラクションをシミュレートするエージェントCFを提案する。
我々は、ユーザだけでなく、アイテムをエージェントとして、創造的に考慮し、両方のエージェントを同時に最適化する協調学習アプローチを開発します。
全体として、最適化されたエージェントは、ユーザ・イテム、ユーザ・ユーザ・ユーザ、アイテム・イテム、集合的インタラクションなど、フレームワーク内での多様なインタラクションの振る舞いを示す。
論文 参考訳(メタデータ) (2023-10-13T16:37:14Z) - Multi-Agent Imitation Learning with Copulas [102.27052968901894]
マルチエージェント模倣学習は、観察と行動のマッピングを学習することで、デモからタスクを実行するために複数のエージェントを訓練することを目的としている。
本稿では,確率変数間の依存を捉える強力な統計ツールである copula を用いて,マルチエージェントシステムにおける相関関係と協調関係を明示的にモデル化する。
提案モデルでは,各エージェントの局所的行動パターンと,エージェント間の依存構造のみをフルにキャプチャするコプラ関数を別々に学習することができる。
論文 参考訳(メタデータ) (2021-07-10T03:49:41Z) - Deep Interactive Bayesian Reinforcement Learning via Meta-Learning [63.96201773395921]
他のエージェントの戦略に対する不確実性下での最適適応行動は、インタラクティブベイズ強化学習フレームワークを用いて計算することができる。
本稿では,メタラーン近似的信念推論とベイズ最適行動を提案する。
提案手法は, モデルフリーアプローチ, 近似後部からのサンプル採取, 他者のメモリフリーモデル維持, あるいは環境の既知の構造を完全に活用しない既存手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-01-11T13:25:13Z) - Learning Latent Representations to Influence Multi-Agent Interaction [65.44092264843538]
エージェントのポリシーの潜在表現を学習するための強化学習に基づくフレームワークを提案する。
提案手法は代替手段よりも優れており,他のエージェントに影響を与えることを学習している。
論文 参考訳(メタデータ) (2020-11-12T19:04:26Z) - Domain-independent generation and classification of behavior traces [18.086782548507855]
CABBOT(英語: CABBOT)は、エージェントが行動を観察している種類の計画エージェントのオンライン分類を行うことができる学習技術である。
我々は、有望な結果をもたらすいくつかの(金融と非金融の両方)領域で実験を行う。
論文 参考訳(メタデータ) (2020-11-03T16:58:54Z) - Learning to Incentivize Other Learning Agents [73.03133692589532]
我々は、学習インセンティブ関数を用いて、RLエージェントに他のエージェントに直接報酬を与える能力を持たせる方法を示す。
このようなエージェントは、一般的なマルコフゲームにおいて、標準のRLと対戦型エージェントを著しく上回っている。
私たちの仕事は、マルチエージェントの未来において共通の善を確実にする道のりに沿って、より多くの機会と課題を指しています。
論文 参考訳(メタデータ) (2020-06-10T20:12:38Z) - Variational Autoencoders for Opponent Modeling in Multi-Agent Systems [9.405879323049659]
マルチエージェントシステムは、共有環境における複数のエージェントの相互作用から生じる複雑な振る舞いを示す。
本研究は,マルチエージェントシステムにおけるエージェントの制御に関心を持ち,ポリシーを定めているエージェントとのインタラクションをうまく学習する。
他のエージェント(反対者)の振る舞いをモデル化することは、システム内のエージェントの相互作用を理解するのに不可欠である。
論文 参考訳(メタデータ) (2020-01-29T13:38:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。