論文の概要: Task-Based Information Compression for Multi-Agent Communication
Problems with Channel Rate Constraints
- arxiv url: http://arxiv.org/abs/2005.14220v4
- Date: Mon, 31 Jan 2022 11:31:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-27 06:08:39.757094
- Title: Task-Based Information Compression for Multi-Agent Communication
Problems with Channel Rate Constraints
- Title(参考訳): チャネルレート制約付きマルチエージェント通信問題に対するタスクベース情報圧縮
- Authors: Arsham Mostaani, Thang X. Vu, Symeon Chatzinotas, Bj\"orn Ottersten
- Abstract要約: 本稿では,情報圧縮アルゴリズム(SAIC)のステートアグリゲーションを導入し,定式化TBIC問題の解法を提案する。
その結果,SAICは割引報酬の総和でほぼ最適性能を達成できることが示唆された。
- 参考スコア(独自算出の注目度): 28.727611928919725
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: {We investigate the communications design in a multiagent system (MAS) in
which agents cooperate to maximize the averaged sum of discounted one-stage
rewards of a collaborative task. Due to the limited communication rate between
the agents, each agent should efficiently represent its local observation and
communicate an abstract version of the observations to improve the
collaborative task performance. We first show that this problem is equivalent
to a form of rate-distortion problem which we call task-based information
compression (TBIC). We then introduce the state-aggregation for information
compression algorithm (SAIC) to solve the formulated TBIC problem. It is shown
that SAIC is able to achieve near-optimal performance in terms of the achieved
sum of discounted rewards. The proposed algorithm is applied to a rendezvous
problem and its performance is compared with several benchmarks. Numerical
experiments confirm the superiority of the proposed algorithm.
- Abstract(参考訳): エージェントが協調するマルチエージェントシステム (mas) における通信設計について検討し, 協調作業の1段階報酬の平均和を最大化するためにエージェントが協力する。
エージェント間の通信速度が限られているため、各エージェントはそのローカルな観察を効率的に表現し、観察の抽象バージョンを伝達して協調作業性能を向上させる必要がある。
まず,この問題がタスクベース情報圧縮(tbic)と呼ばれるレート分散問題と等価であることを示す。
次に,情報圧縮アルゴリズム(SAIC)のステートアグリゲーションを導入し,定式化TBIC問題を解く。
その結果,saicは割引報酬の達成額という観点で,ほぼ最適性能を達成できることがわかった。
提案アルゴリズムはランデブー問題に適用され,その性能をいくつかのベンチマークと比較した。
数値実験により提案アルゴリズムの優位性が確認された。
関連論文リスト
- Minimum Entropy Coupling with Bottleneck [22.409716686394525]
本稿では,対数損失下で動作する新しい損失圧縮フレームワークについて検討する。
特に、共同圧縮と検索を必要とするアプリケーションや、処理による分散シフトを伴うシナリオに関係している。
提案した定式化は、ボトルネックを統合することにより、古典的な最小エントロピー結合フレームワークを拡張していることを示す。
論文 参考訳(メタデータ) (2024-10-29T02:19:07Z) - Scalable Decentralized Algorithms for Online Personalized Mean Estimation [12.002609934938224]
本研究は,各エージェントが実数値分布からサンプルを収集し,その平均値を推定する,オーバーアーキシング問題の簡易版に焦点を当てた。
1つは信念の伝播からインスピレーションを得ており、もう1つはコンセンサスに基づくアプローチを採用している。
論文 参考訳(メタデータ) (2024-02-20T08:30:46Z) - Pure Exploration in Asynchronous Federated Bandits [57.02106627533004]
マルチアームバンディットとリニアバンディットのフェデレートされた純粋な探索問題について検討し、M$エージェントが中央サーバとの通信を通じて最適なアームを協調的に識別する方法について検討した。
信頼度を固定した純粋探索のための非同期マルチアームバンディットおよび線形バンディットアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-10-17T06:04:00Z) - Provably Efficient Learning in Partially Observable Contextual Bandit [4.910658441596583]
古典的帯域幅アルゴリズムの改善に因果境界をどのように適用できるかを示す。
本研究は,実世界の応用における文脈的包括的エージェントの性能を高める可能性を秘めている。
論文 参考訳(メタデータ) (2023-08-07T13:24:50Z) - Communication-Efficient Federated Bilevel Optimization with Local and
Global Lower Level Problems [118.00379425831566]
我々はFedBiOAccという通信効率の高いアルゴリズムを提案する。
我々は、FedBiOAcc-Localがこの種の問題に対して同じ速度で収束していることを証明する。
実験結果から,アルゴリズムの性能が向上した。
論文 参考訳(メタデータ) (2023-02-13T21:28:53Z) - MARLIN: Soft Actor-Critic based Reinforcement Learning for Congestion
Control in Real Networks [63.24965775030673]
そこで本研究では,汎用的な渋滞制御(CC)アルゴリズムを設計するための新しい強化学習(RL)手法を提案する。
我々の解であるMARLINは、Soft Actor-Criticアルゴリズムを用いてエントロピーとリターンの両方を最大化する。
我々は,MARLINを実ネットワーク上で訓練し,実ミスマッチを克服した。
論文 参考訳(メタデータ) (2023-02-02T18:27:20Z) - Communication-Efficient Collaborative Best Arm Identification [6.861971769602314]
エージェントが協調して目的関数を学習するマルチエージェント学習モデルにおいて,バンドイット理論の基本的な問題であるトップ・m$腕識別について検討する。
私たちは、最大限のスピードアップを達成するための協調学習アルゴリズムの設計に興味を持っています。
論文 参考訳(メタデータ) (2022-08-18T19:02:29Z) - ReAct: Temporal Action Detection with Relational Queries [84.76646044604055]
本研究は,アクションクエリを備えたエンコーダ・デコーダフレームワークを用いて,時間的行動検出(TAD)の進展を図ることを目的とする。
まず,デコーダ内の関係注意機構を提案し,その関係に基づいてクエリ間の関心を誘導する。
最後に、高品質なクエリを区別するために、推論時に各アクションクエリのローカライズ品質を予測することを提案する。
論文 参考訳(メタデータ) (2022-07-14T17:46:37Z) - Distributed Adaptive Learning Under Communication Constraints [54.22472738551687]
本研究では,コミュニケーション制約下での運用を目的とした適応型分散学習戦略について検討する。
我々は,ストリーミングデータの連続的な観察から,オンライン最適化問題を解決しなければならないエージェントのネットワークを考える。
論文 参考訳(メタデータ) (2021-12-03T19:23:48Z) - Communication Efficient Distributed Learning with Censored, Quantized,
and Generalized Group ADMM [52.12831959365598]
本稿では,相互接続作業者のネットワーク上で定義されたコンセンサス最適化問題を解決するための,コミュニケーション効率のよい分散機械学習フレームワークを提案する。
提案アルゴリズムであるCensored and Quantized Generalized GADMMは、GADMM(Group Alternating Direction Method of Multipliers)の労働者グループ化と分散学習のアイデアを活用する。
CQ-GGADMMは通信ラウンド数で高い通信効率を示し、精度と収束速度を損なうことなくエネルギー消費を伝達する。
論文 参考訳(メタデータ) (2020-09-14T14:18:19Z) - Kernel Methods for Cooperative Multi-Agent Contextual Bandits [15.609414012418043]
協調的マルチエージェント意思決定は、遅延のあるネットワーク上で通信しながら、学習問題を協調的に解決するエージェントのグループを含む。
エージェントが得られる報酬は、関連するカーネル再生ヒルベルト空間(RKHS)におけるコンテキストのイメージの任意の線形関数である。
我々は, 年齢ごとの後悔に対して, ほぼ最適境界を与えるアルゴリズムであるtextscCoop- KernelUCBを提案する。
論文 参考訳(メタデータ) (2020-08-14T07:37:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。