論文の概要: Team Deep Mixture of Experts for Distributed Power Control
- arxiv url: http://arxiv.org/abs/2007.14147v1
- Date: Tue, 28 Jul 2020 12:01:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-06 03:12:31.574062
- Title: Team Deep Mixture of Experts for Distributed Power Control
- Title(参考訳): 分散電力制御の専門家のチームディープミックス
- Authors: Matteo Zecchin, David Gesbert, Marios Kountouris
- Abstract要約: 我々は、よく知られたMixture of Experts(MoE)モデルから着想を得たアーキテクチャを提案する。
時間変動統計シナリオを効率的に追跡する Team-DMoE モデルの有効性を示す。
- 参考スコア(独自算出の注目度): 23.612400109629544
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the context of wireless networking, it was recently shown that multiple
DNNs can be jointly trained to offer a desired collaborative behaviour capable
of coping with a broad range of sensing uncertainties. In particular, it was
established that DNNs can be used to derive policies that are robust with
respect to the information noise statistic affecting the local information
(e.g. CSI in a wireless network) used by each agent (e.g. transmitter) to make
its decision. While promising, a major challenge in the implementation of such
method is that information noise statistics may differ from agent to agent and,
more importantly, that such statistics may not be available at the time of
training or may evolve over time, making burdensome retraining necessary. This
situation makes it desirable to devise a "universal" machine learning model,
which can be trained once for all so as to allow for decentralized cooperation
in any future feedback noise environment. With this goal in mind, we propose an
architecture inspired from the well-known Mixture of Experts (MoE) model, which
was previously used for non-linear regression and classification tasks in
various contexts, such as computer vision and speech recognition. We consider
the decentralized power control problem as an example to showcase the validity
of the proposed model and to compare it against other power control algorithms.
We show the ability of the so called Team-DMoE model to efficiently track
time-varying statistical scenarios.
- Abstract(参考訳): 近年,無線ネットワークの文脈において,複数のdnnを共同で訓練することで,幅広いセンサの不確実性に対処できる望ましい協調行動を提供できることを示した。
特に、DNNは、各エージェント(例えば送信機)が決定するために使用するローカル情報(例えば、無線ネットワークにおけるCSI)に影響を及ぼす情報ノイズ統計量に関して、堅牢なポリシーを導出することができることが確立された。
このような手法の実装における大きな課題は、情報ノイズ統計がエージェントからエージェントへ異なる場合があり、さらに重要なことは、そのような統計がトレーニング時に利用できない場合や、時間とともに進化し、負担のかかる再訓練が必要な場合である。
この状況は、将来のフィードバックノイズ環境において分散協調を可能にするために、すべての場所で1回トレーニング可能な、"ユニバーサル"な機械学習モデルを考案することが望ましい。
この目的を念頭に置いて,コンピュータビジョンや音声認識といった様々な文脈において,これまで非線形回帰や分類タスクに用いられてきた,著名な専門家の混合(moe)モデルから着想を得たアーキテクチャを提案する。
本稿では,分散化電力制御問題を,提案モデルの有効性を示し,他の電力制御アルゴリズムと比較する例として考察する。
時間変動統計シナリオを効率的に追跡する Team-DMoE モデルの有効性を示す。
関連論文リスト
- Enhancing Multiple Reliability Measures via Nuisance-extended
Information Bottleneck [77.37409441129995]
トレーニングデータに制限がある現実的なシナリオでは、データ内の多くの予測信号は、データ取得のバイアスからより多く得る。
我々は,相互情報制約の下で,より広い範囲の摂動をカバーできる敵の脅威モデルを考える。
そこで本研究では,その目的を実現するためのオートエンコーダベーストレーニングと,提案したハイブリッド識別世代学習を促進するための実用的なエンコーダ設計を提案する。
論文 参考訳(メタデータ) (2023-03-24T16:03:21Z) - Fully Decentralized Model-based Policy Optimization for Networked
Systems [23.46407780093797]
本研究の目的は,モデルベース学習によるマルチエージェント制御のデータ効率の向上である。
エージェントが協力的であり、隣人とのみローカルに通信するネットワークシステムについて検討する。
提案手法では,各エージェントが将来の状態を予測し,通信によって予測をブロードキャストする動的モデルを学習し,その後,モデルロールアウトに基づいてポリシーをトレーニングする。
論文 参考訳(メタデータ) (2022-07-13T23:52:14Z) - Denoised MDPs: Learning World Models Better Than the World Itself [94.74665254213588]
本研究は,野生の情報を制御可能性と報酬との関係に基づく4つのタイプに分類し,制御性および報酬関連性の両方に有用な情報を定式化する。
DeepMind Control Suite と RoboDesk の変種に関する実験では、生の観測のみを用いた場合よりも、認知された世界モデルの優れた性能が示されている。
論文 参考訳(メタデータ) (2022-06-30T17:59:49Z) - Robust, Deep, and Reinforcement Learning for Management of Communication
and Power Networks [6.09170287691728]
本論文は、まず、分散不確実性や逆データに対して汎用機械学習モデルを堅牢にするための原則的手法を開発する。
次に、この堅牢なフレームワークの上に構築し、グラフメソッドによる堅牢な半教師付き学習を設計します。
この論文の第2部は、次世代の有線および無線ネットワークの可能性を完全に解き放つことを意図している。
論文 参考訳(メタデータ) (2022-02-08T05:49:06Z) - On Addressing Heterogeneity in Federated Learning for Autonomous
Vehicles Connected to a Drone Orchestrator [32.61132332561498]
我々は,自動運転車の性能を向上する上で,連邦学習(FL)のシナリオを想定する。
我々は,自律走行車の名目上の操作を損なう可能性のある,特定の種類の臨界物体(CO)の学習を加速する問題に焦点をあてる。
論文 参考訳(メタデータ) (2021-08-05T16:25:48Z) - Learning to Continuously Optimize Wireless Resource in a Dynamic
Environment: A Bilevel Optimization Perspective [52.497514255040514]
この研究は、データ駆動メソッドが動的環境でリソース割り当て戦略を継続的に学び、最適化することを可能にする新しいアプローチを開発しています。
学習モデルが新たなエピソードに段階的に適応できるように、連続学習の概念を無線システム設計に組み込むことを提案する。
我々の設計は、異なるデータサンプルにまたがる公平性を保証する、新しい二段階最適化定式化に基づいている。
論文 参考訳(メタデータ) (2021-05-03T07:23:39Z) - Learning Connectivity for Data Distribution in Robot Teams [96.39864514115136]
グラフニューラルネットワーク(GNN)を用いたアドホックネットワークにおけるデータ分散のためのタスク非依存,分散化,低レイテンシ手法を提案する。
当社のアプローチは、グローバル状態情報に基づいたマルチエージェントアルゴリズムを各ロボットで利用可能にすることで機能させます。
我々は,情報の平均年齢を報酬関数として強化学習を通じて分散gnn通信政策を訓練し,タスク固有の報酬関数と比較してトレーニング安定性が向上することを示す。
論文 参考訳(メタデータ) (2021-03-08T21:48:55Z) - Collective Awareness for Abnormality Detection in Connected Autonomous
Vehicles [4.659696262995864]
本稿では,知的エージェントのネットワークにおいて,集団認識の初期レベルを開発するための新しいアプローチを提案する。
特定の集団的自己認識機能、すなわちエージェントが異常な状況を検出することを考える。
また、ネットワークの各エージェントによって分散的に検知されたデータを共有するために、ネットワークが使用する通信チャネルによって影響を評価する。
論文 参考訳(メタデータ) (2020-10-28T12:11:36Z) - Dif-MAML: Decentralized Multi-Agent Meta-Learning [54.39661018886268]
我々は,MAML や Dif-MAML と呼ばれる協調型マルチエージェントメタ学習アルゴリズムを提案する。
提案手法により, エージェントの集合が線形速度で合意に達し, 集約MAMLの定常点に収束できることを示す。
シミュレーションの結果は従来の非協調的な環境と比較して理論的な結果と優れた性能を示している。
論文 参考訳(メタデータ) (2020-10-06T16:51:09Z) - Plausible Counterfactuals: Auditing Deep Learning Classifiers with
Realistic Adversarial Examples [84.8370546614042]
ディープラーニングモデルのブラックボックスの性質は、彼らがデータから何を学ぶかについて、未回答の疑問を提起している。
GAN(Generative Adversarial Network)とマルチオブジェクトは、監査されたモデルに妥当な攻撃を与えるために使用される。
その実用性は人間の顔の分類タスクの中で示され、提案されたフレームワークの潜在的可能性を明らかにしている。
論文 参考訳(メタデータ) (2020-03-25T11:08:56Z) - Resource Management in Wireless Networks via Multi-Agent Deep
Reinforcement Learning [15.091308167639815]
マルチエージェント深部強化学習(RL)を用いた無線ネットワークにおける分散リソース管理と干渉軽減機構を提案する。
ネットワーク内の各送信機に深部RLエージェントを装備し、それに関連するユーザからの遅延観測を受信するとともに、近隣のエージェントと観測を交換する。
提案フレームワークは,エージェントが他のエージェントの同時決定を知らずに,同時かつ分散的に意思決定を行うことを可能にする。
論文 参考訳(メタデータ) (2020-02-14T19:01:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。