論文の概要: Task-Oriented Communication Design at Scale
- arxiv url: http://arxiv.org/abs/2305.08481v1
- Date: Mon, 15 May 2023 09:32:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-16 15:10:30.365191
- Title: Task-Oriented Communication Design at Scale
- Title(参考訳): 大規模タスク指向コミュニケーション設計
- Authors: Arsham Mostaani, Thang X. Vu, Hamed Habibi, Symeon Chatzinotas, Bjorn
Ottersten
- Abstract要約: 本稿では,協調型マルチエージェントシステムにおけるスケーラブルなタスク指向量子化とコミュニケーションを設計するための新しいアプローチを提案する。
提案手法では,TOCDフレームワークと情報量(VoI)の概念を用いて,定量化観測の効率的な通信を実現する。
数値計算の結果,MAS問題におけるTOCDに必要なVoIを得る際の計算複雑性の低減が著しく向上した。
- 参考スコア(独自算出の注目度): 26.297026173363165
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With countless promising applications in various domains such as IoT and
industry 4.0, task-oriented communication design (TOCD) is getting accelerated
attention from the research community. This paper presents a novel approach for
designing scalable task-oriented quantization and communications in cooperative
multi-agent systems (MAS). The proposed approach utilizes the TOCD framework
and the value of information (VoI) concept to enable efficient communication of
quantized observations among agents while maximizing the average return
performance of the MAS, a parameter that quantifies the MAS's task
effectiveness. The computational complexity of learning the VoI, however, grows
exponentially with the number of agents. Thus, we propose a three-step
framework: i) learning the VoI (using reinforcement learning (RL)) for a
two-agent system, ii) designing the quantization policy for an $N$-agent MAS
using the learned VoI for a range of bit-budgets and, (iii) learning the
agents' control policies using RL while following the designed quantization
policies in the earlier step. We observe that one can reduce the computational
cost of obtaining the value of information by exploiting insights gained from
studying a similar two-agent system - instead of the original $N$-agent system.
We then quantize agents' observations such that their more valuable
observations are communicated more precisely. Our analytical results show the
applicability of the proposed framework under a wide range of problems.
Numerical results show striking improvements in reducing the computational
complexity of obtaining VoI needed for the TOCD in a MAS problem without
compromising the average return performance of the MAS.
- Abstract(参考訳): IoTや業界 4.0 などさまざまな分野の有望なアプリケーションが数え切れないほどあることから,タスク指向通信設計 (TOCD) が研究コミュニティから注目を集めている。
本稿では、協調型マルチエージェントシステム(MAS)におけるスケーラブルなタスク指向量子化と通信を設計するための新しいアプローチを提案する。
提案手法はTOCDフレームワークと情報量(VoI)の概念を用いて,MASのタスク効率を定量化するパラメータであるMASの平均戻り性能を最大化しながら,エージェント間の量子化観測の効率的な通信を可能にする。
しかし、voiを学習する計算の複雑さはエージェントの数で指数関数的に増加する。
そこで我々は3段階の枠組みを提案する。
一 複エージェントシステムのためのVoI(強化学習(RL)を用いて)を学ぶこと。
二 学習したVoIをビット予算の範囲に用いて、N$エージェントMASの量子化ポリシーを設計すること。
三 初期段階において設計した量子化政策に従いながら、RLを用いてエージェントの制御方針を学習すること。
従来の$N$-agentシステムではなく、類似の2エージェントシステムから得られる洞察を活用することで、情報の価値を得るための計算コストを削減できることを観察する。
次に、エージェントの観測を定量化し、より価値のある観測をより正確に伝達する。
分析の結果,提案手法の適用性は広範囲に及んだ。
数値計算の結果,MAS問題におけるTOCDに必要なVoI取得の計算複雑性を,MASの平均回帰性能を損なうことなく大幅に改善した。
関連論文リスト
- Towards Human-Level Understanding of Complex Process Engineering Schematics: A Pedagogical, Introspective Multi-Agent Framework for Open-Domain Question Answering [0.0]
化学・プロセス産業では、プロセス・フロー・ダイアグラム(PFD)とパイプ・アンド・インスツルメンテーション・ダイアグラム(P&ID)が設計、建設、保守に不可欠である。
生成型AIの最近の進歩は、ビジュアル質問回答(VQA)のプロセス図の理解と解釈の約束を示している。
本稿では,階層的かつマルチエージェントなRetrieval Augmented Generation(RAG)フレームワークを用いた,セキュアでオンプレミスなエンタープライズソリューションを提案する。
論文 参考訳(メタデータ) (2024-08-24T19:34:04Z) - Controlling Large Language Model-based Agents for Large-Scale
Decision-Making: An Actor-Critic Approach [28.477463632107558]
我々はLLaMACと呼ばれるモジュラーフレームワークを開発し、大規模言語モデルにおける幻覚とマルチエージェントシステムにおける協調に対処する。
LLaMACは、人間の脳にあるものに似た値分布をコードし、内部および外部からのフィードバック機構を利用して、モジュール間の協調と反復的推論を促進する。
論文 参考訳(メタデータ) (2023-11-23T10:14:58Z) - Partially Observable Multi-Agent Reinforcement Learning with Information Sharing [33.145861021414184]
部分的に観察可能なゲーム(POSG)の一般的な枠組みにおける証明可能なマルチエージェント強化学習(RL)について検討する。
我々は,エージェント間での情報共有の可能性,経験的マルチエージェントRLにおける一般的な実践,コミュニケーションを伴うマルチエージェント制御システムの標準モデルを活用することを提唱する。
論文 参考訳(メタデータ) (2023-08-16T23:42:03Z) - Semantic Information Marketing in The Metaverse: A Learning-Based
Contract Theory Framework [68.8725783112254]
仮想サービスプロバイダ(VSP)によるインセンティブのメカニズム設計の問題に対処し,センサデータ販売にIoTデバイスを採用。
帯域幅が限られているため,センサIoTデバイスによる配信データを削減するためにセマンティック抽出アルゴリズムを提案する。
本稿では,新しい反復型契約設計を提案し,マルチエージェント強化学習(MARL)の新たな変種を用いて,モデル付き多次元契約問題の解法を提案する。
論文 参考訳(メタデータ) (2023-02-22T15:52:37Z) - Multi-Agent Reinforcement Learning for Long-Term Network Resource
Allocation through Auction: a V2X Application [7.326507804995567]
我々は,自律エージェント間の分散意思決定として,移動エージェントの動的グループ(自動車など)からの計算タスクのオフロードを定式化する。
我々は、競争と協力のバランスをとることで、そのようなエージェントにプライベートとシステム目標の整合を動機付けるインタラクションメカニズムを設計する。
本稿では,部分的,遅延,ノイズの多い状態情報を用いて学習する,新しいマルチエージェントオンライン学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-07-29T10:29:06Z) - Task-Oriented Sensing, Computation, and Communication Integration for
Multi-Device Edge AI [108.08079323459822]
本稿では,AIモデルの分割推論と統合センシング通信(ISAC)を併用した,新しいマルチインテリジェントエッジ人工レイテンシ(AI)システムについて検討する。
推定精度は近似的だが抽出可能な計量、すなわち判別利得を用いて測定する。
論文 参考訳(メタデータ) (2022-07-03T06:57:07Z) - Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。
我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。
コア最適化問題の実用的なパラメトリゼーションを提供する。
論文 参考訳(メタデータ) (2021-07-08T18:01:02Z) - Adaptive Stochastic ADMM for Decentralized Reinforcement Learning in
Edge Industrial IoT [106.83952081124195]
強化学習 (Reinforcement Learning, RL) は, 意思決定および最適制御プロセスのための有望な解法として広く研究されている。
本稿では,Adaptive ADMM (asI-ADMM)アルゴリズムを提案する。
実験の結果,提案アルゴリズムは通信コストやスケーラビリティの観点から技術状況よりも優れており,複雑なIoT環境に適応できることがわかった。
論文 参考訳(メタデータ) (2021-06-30T16:49:07Z) - Dif-MAML: Decentralized Multi-Agent Meta-Learning [54.39661018886268]
我々は,MAML や Dif-MAML と呼ばれる協調型マルチエージェントメタ学習アルゴリズムを提案する。
提案手法により, エージェントの集合が線形速度で合意に達し, 集約MAMLの定常点に収束できることを示す。
シミュレーションの結果は従来の非協調的な環境と比較して理論的な結果と優れた性能を示している。
論文 参考訳(メタデータ) (2020-10-06T16:51:09Z) - Information Freshness-Aware Task Offloading in Air-Ground Integrated
Edge Computing Systems [49.80033982995667]
本稿では,空域統合マルチアクセスエッジコンピューティングシステムにおける情報更新性を考慮したタスクオフロードの問題について検討する。
サードパーティのリアルタイムアプリケーションサービスプロバイダは、InPからの限られた通信と計算リソースで、加入したモバイルユーザ(MU)にコンピューティングサービスを提供する。
本稿では,各MUに2つの個別の深度Q-networksを適用し,Q-factorと後Q-factorを近似する新しい深度強化学習手法を提案する。
論文 参考訳(メタデータ) (2020-07-15T21:32:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。