論文の概要: Memory-like Adaptive Modeling Multi-Agent Learning System
- arxiv url: http://arxiv.org/abs/2212.07646v1
- Date: Thu, 15 Dec 2022 07:39:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-16 17:46:23.516534
- Title: Memory-like Adaptive Modeling Multi-Agent Learning System
- Title(参考訳): メモリ型適応モデリングマルチエージェント学習システム
- Authors: Xingyu Qian, Aximu Yuemaier, Longfei Liang, Wen-Chi Yang, Xiaogang
Chen, Shunfen Li, Weibang Dai, Zhitang Song
- Abstract要約: メモリ型適応型マルチエージェント学習システム(MAMMALS)を提案する。
マルチエージェント学習では、エージェント間の相乗効果を無視する振る舞いのため、個々のエージェント用に設計された学習方法を用いることで、一般的には、グローバルなパフォーマンスが低下する。
- 参考スコア(独自算出の注目度): 1.2752808844888015
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this work, we propose a self-supervised multi-agent system, termed a
memory-like adaptive modeling multi-agent learning system (MAMMALS), that
realizes online learning towards behavioral pattern clustering tasks for time
series. Encoding the visual behaviors as discrete time series(DTS), and
training and modeling them in the multi-agent system with a bio-memory-like
form. We finally implemented a fully decentralized multi-agent system design
framework and completed its feasibility verification in a surveillance video
application scenario on vehicle path clustering. In multi-agent learning, using
learning methods designed for individual agents will typically perform poorly
globally because of the behavior of ignoring the synergy between agents.
- Abstract(参考訳): 本研究では,時系列の行動パターンクラスタリングタスクに対するオンライン学習を実現する,メモリ型適応モデリングマルチエージェント学習システム (mammals) という,自己教師付きマルチエージェントシステムを提案する。
視覚動作を離散時系列(dts)としてエンコードし、バイオメモリライクな形式でマルチエージェントシステムでトレーニングとモデリングを行う。
最終的に,完全分散マルチエージェントシステム設計フレームワークを実装し,車道クラスタリングにおける監視ビデオアプリケーションシナリオにおける実現可能性検証を完了した。
マルチエージェント学習では、個々のエージェント向けに設計された学習方法を使用すると、エージェント間のシナジーを無視する振舞いのため、一般的にグローバルにパフォーマンスが低下する。
関連論文リスト
- Discovering Decision Manifolds to Assure Trusted Autonomous Systems [0.0]
本稿では,システムが提示できる正誤応答の範囲を最適化した探索手法を提案する。
この多様体は、従来のテストやモンテカルロシミュレーションよりもシステムの信頼性をより詳細に理解する。
この概念実証では,本手法を自動運転車のループ内ソフトウェア評価に適用する。
論文 参考訳(メタデータ) (2024-02-12T16:55:58Z) - Hierarchical hybrid modeling for flexible tool use [0.0]
本稿では,エージェントの構成を複製する複数のハイブリッドユニットで構成され,高レベル離散モデルによって制御されるアーキテクチャを提案する。
我々はこの階層的ハイブリッドモデルを非自明なタスクで評価し、移動ツールを選択した後、移動物体に到達した。
論文 参考訳(メタデータ) (2024-02-01T15:15:25Z) - On the dynamics of multi agent nonlinear filtering and learning [2.206852421529135]
マルチエージェントシステムは、ダイナミックスを求める分散コンセンサスを通じて、高度に複雑な学習課題を達成することを目的としている。
本稿では非線形フィルタリング/学習力学を用いたマルチエージェントネットワークシステムの挙動について検討する。
論文 参考訳(メタデータ) (2023-09-07T08:39:53Z) - Interactive System-wise Anomaly Detection [66.3766756452743]
異常検出は様々なアプリケーションにおいて基本的な役割を果たす。
既存のメソッドでは、インスタンスがデータとして容易に観察できないシステムであるシナリオを扱うのが難しい。
システム埋め込みを学習するエンコーダデコーダモジュールを含むエンドツーエンドアプローチを開発する。
論文 参考訳(メタデータ) (2023-04-21T02:20:24Z) - Safe Multi-agent Learning via Trapping Regions [89.24858306636816]
我々は、動的システムの定性理論から知られているトラップ領域の概念を適用し、分散学習のための共同戦略空間に安全セットを作成する。
本稿では,既知の学習力学を持つシステムにおいて,候補がトラップ領域を形成することを検証するための二分分割アルゴリズムと,学習力学が未知のシナリオに対するサンプリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-27T14:47:52Z) - Distributionally Adaptive Meta Reinforcement Learning [85.17284589483536]
テスト時間分布シフトの下で適切に振る舞うメタRLアルゴリズムのフレームワークを開発する。
我々の枠組みは、分布のロバスト性に対する適応的なアプローチを中心とし、様々なレベルの分布シフトに対してロバストであるようメタポリスの人口を訓練する。
本研究は, 分散シフト下での後悔を改善するための枠組みを示し, シミュレーションロボティクス問題に対する効果を実証的に示す。
論文 参考訳(メタデータ) (2022-10-06T17:55:09Z) - How to solve a classification problem using a cooperative tiling
Multi-Agent System? [0.0]
本稿では,分類問題を入力変数空間の協調タイリングに変換する枠組みを提案する。
線形分離性の異なる3種類のベンチマーク玩具問題に対して,オンライン非線形分類に線形分類器を用いることが可能であることを示す。
論文 参考訳(メタデータ) (2022-09-15T09:35:33Z) - An ensemble Multi-Agent System for non-linear classification [0.0]
smapyは、移動予測のためのアンサンブルベースのAMAS実装である。
ベンチマークトランスポートモード検出データセットの非線形分類に線形モデルを用いることが可能であることを示す。
論文 参考訳(メタデータ) (2022-09-14T08:22:11Z) - Multi-Agent Imitation Learning with Copulas [102.27052968901894]
マルチエージェント模倣学習は、観察と行動のマッピングを学習することで、デモからタスクを実行するために複数のエージェントを訓練することを目的としている。
本稿では,確率変数間の依存を捉える強力な統計ツールである copula を用いて,マルチエージェントシステムにおける相関関係と協調関係を明示的にモデル化する。
提案モデルでは,各エージェントの局所的行動パターンと,エージェント間の依存構造のみをフルにキャプチャするコプラ関数を別々に学習することができる。
論文 参考訳(メタデータ) (2021-07-10T03:49:41Z) - Decentralized MCTS via Learned Teammate Models [89.24858306636816]
本稿では,モンテカルロ木探索に基づくトレーニング可能なオンライン分散計画アルゴリズムを提案する。
深層学習と畳み込みニューラルネットワークを用いて正確なポリシー近似を作成可能であることを示す。
論文 参考訳(メタデータ) (2020-03-19T13:10:20Z) - Multi-Agent Interactions Modeling with Correlated Policies [53.38338964628494]
本稿では,マルチエージェントインタラクションモデリング問題をマルチエージェント模倣学習フレームワークに実装する。
相関ポリシー(CoDAIL)を用いた分散型適応模倣学習アルゴリズムの開発
様々な実験により、CoDAILはデモレーターに近い複雑な相互作用をより良く再生できることが示されている。
論文 参考訳(メタデータ) (2020-01-04T17:31:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。