論文の概要: The Influence of Memory in Multi-Agent Consensus
- arxiv url: http://arxiv.org/abs/2105.04666v1
- Date: Mon, 10 May 2021 20:59:35 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-12 13:50:55.651242
- Title: The Influence of Memory in Multi-Agent Consensus
- Title(参考訳): マルチエージェントコンセンサスにおける記憶の影響
- Authors: David Kohan Marzag\~ao, Luciana Basualdo Bonatto, Tiago Madeira,
Marcelo Matheus Gauy, Peter McBurney
- Abstract要約: 我々は、emphmemoryコンセンサスプロトコルと呼ばれるものを研究するためのフレームワークを提案する。
メモリの利用により、そのようなプロセスは常に収束し、サイクルのようないくつかのシナリオではより早く収束することが示される。
エージェントが表現した最初の意見に基づいて、各オプションが最終的にそのようなプロセスに勝つ確率を理論的に分析する。
- 参考スコア(独自算出の注目度): 0.8399688944263843
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Multi-agent consensus problems can often be seen as a sequence of autonomous
and independent local choices between a finite set of decision options, with
each local choice undertaken simultaneously, and with a shared goal of
achieving a global consensus state. Being able to estimate probabilities for
the different outcomes and to predict how long it takes for a consensus to be
formed, if ever, are core issues for such protocols.
Little attention has been given to protocols in which agents can remember
past or outdated states. In this paper, we propose a framework to study what we
call \emph{memory consensus protocol}. We show that the employment of memory
allows such processes to always converge, as well as, in some scenarios, such
as cycles, converge faster. We provide a theoretical analysis of the
probability of each option eventually winning such processes based on the
initial opinions expressed by agents. Further, we perform experiments to
investigate network topologies in which agents benefit from memory on the
expected time needed for consensus.
- Abstract(参考訳): マルチエージェントのコンセンサス問題は、有限個の決定オプション間の自律的および独立的なローカルな選択の連続と見なされ、それぞれのローカルな選択は同時に行われ、グローバルなコンセンサス状態を達成するという共通の目標を持つ。
異なる結果の確率を推定し、コンセンサスを形成するのにどのくらいの時間を要するかを予測できるというのは、そのようなプロトコルの中核的な問題である。
エージェントが過去のまたは時代遅れの状態を記憶できるプロトコルにはほとんど注目されていない。
本稿では, \emph{memory consensus protocol} と呼ぶものを研究するフレームワークを提案する。
メモリの利用により、そのようなプロセスは常に収束し、サイクルのようないくつかのシナリオではより早く収束することが示される。
エージェントが表現した最初の意見に基づいて、各オプションが最終的にそのようなプロセスに勝つ確率を理論的に分析する。
さらに,コンセンサスに必要な期待時間について,エージェントがメモリから恩恵を受けるネットワークトポロジを調べる実験を行う。
関連論文リスト
- Causal Influence in Federated Edge Inference [34.487472866247586]
本稿では、未ラベルのストリーミングデータを用いて、接続性のある異種エージェントが推論を行う環境について考察する。
不確実性を克服するために、エージェントは、融合センターを通じてローカルな推論を交換することで互いに協力する。
エージェントの関与パターンや核融合センターの方針を反映した様々なシナリオを考察した。
論文 参考訳(メタデータ) (2024-05-02T13:06:50Z) - Online POMDP Planning with Anytime Deterministic Guarantees [11.157761902108692]
不確実性の下での計画は、部分的に観測可能なマルコフ決定プロセス(POMDP)を用いて数学的に定式化できる
POMDPの最適計画を見つけるには計算コストがかかり、小さなタスクにのみ適用可能である。
簡便な解と理論的に最適な解との決定論的関係を導出する。
論文 参考訳(メタデータ) (2023-10-03T04:40:38Z) - Pure Exploration under Mediators' Feedback [63.56002444692792]
マルチアームバンディット(Multi-armed bandits)は、各インタラクションステップにおいて、学習者が腕を選択し、報酬を観察する、シーケンシャルな意思決定フレームワークである。
本稿では,学習者が仲介者の集合にアクセスできるシナリオについて考察する。
本稿では,学習者には仲介者の方針が知られていると仮定して,最適な腕を発見するための逐次的意思決定戦略を提案する。
論文 参考訳(メタデータ) (2023-08-29T18:18:21Z) - On the Complexity of Multi-Agent Decision Making: From Learning in Games
to Partial Monitoring [105.13668993076801]
マルチエージェント強化学習(MARL)理論における中心的な問題は、構造条件やアルゴリズムの原理がサンプル効率の学習保証につながるかを理解することである。
本稿では,複数のエージェントを用いた対話型意思決定のための一般的な枠組みとして,この問題について考察する。
マルチエージェント意思決定における統計的複雑性を特徴付けることは、単一エージェント決定の統計的複雑性を特徴付けることと等価であることを示す。
論文 参考訳(メタデータ) (2023-05-01T06:46:22Z) - Factorization of Multi-Agent Sampling-Based Motion Planning [72.42734061131569]
現代のロボティクスは、共有環境内で複数のエンボディエージェントを動作させることが多い。
標準的なサンプリングベースのアルゴリズムは、ロボットの関節空間における解の探索に使用できる。
我々は、因子化の概念をサンプリングベースアルゴリズムに統合し、既存の手法への最小限の変更しか必要としない。
本稿では, PRM* のサンプル複雑性の観点から解析的ゲインを導出し, RRG の実証結果を示す。
論文 参考訳(メタデータ) (2023-04-01T15:50:18Z) - A protocol for global multiphase estimation [0.0]
我々は,ホレボの推定理論に基づくグローバル多相プロトコルを考案する。
多相戦略では、独立した単相推定の系列に対して、一定の量子優位性しか持たないことが示される。
論文 参考訳(メタデータ) (2023-01-18T09:14:23Z) - Multi-agent Deep Covering Skill Discovery [50.812414209206054]
本稿では,複数エージェントの結合状態空間の予測被覆時間を最小化し,マルチエージェントオプションを構築するマルチエージェントDeep Covering Option Discoveryを提案する。
また、MARLプロセスにマルチエージェントオプションを採用するための新しいフレームワークを提案する。
提案アルゴリズムは,アテンション機構とエージェントの相互作用を効果的に把握し,マルチエージェントオプションの同定に成功した。
論文 参考訳(メタデータ) (2022-10-07T00:40:59Z) - Cooperative Online Learning in Stochastic and Adversarial MDPs [50.62439652257712]
我々は、協調的オンライン学習と敵対的マルコフ決定過程(MDP)について研究する。
各エピソードでは、$m$エージェントが同時にMDPと対話し、個人の後悔を最小限に抑えるために情報を共有する。
協調強化学習(RL)を非フレッシュランダム性, あるいは敵対的MDPで検討したのは, 初めてである。
論文 参考訳(メタデータ) (2022-01-31T12:32:11Z) - Improved analytical bounds on delivery times of long-distance
entanglement [0.0]
我々は, 絡み合い分布プロトコルの平均および完了時刻の定量値について, 解析的境界を改良した。
そのようなプロトコルの標準的な例として、ネストされた量子リピータスキームがあり、これは有意な絡み合いの生成と絡み合いのスワップからなる。
論文 参考訳(メタデータ) (2021-03-21T18:14:56Z) - Public Bayesian Persuasion: Being Almost Optimal and Almost Persuasive [57.47546090379434]
i) 任意の状態空間, (ii) 任意の行動空間, (iii) 任意の送信者のユーティリティ関数を用いて, 一般の状況下での公衆の説得問題を考察する。
任意の公的な説得問題に対して準多項式時間ビクテリア近似アルゴリズムを提案し、特定の設定でQPTASを出力する。
論文 参考訳(メタデータ) (2020-02-12T18:59:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。