Fugu-MT 論文翻訳(概要): Team Deep Mixture of Experts for Distributed Power Control

論文の概要: Team Deep Mixture of Experts for Distributed Power Control

arxiv url: http://arxiv.org/abs/2007.14147v1
Date: Tue, 28 Jul 2020 12:01:06 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-06 03:12:31.574062
Title: Team Deep Mixture of Experts for Distributed Power Control
Title（参考訳）: 分散電力制御の専門家のチームディープミックス
Authors: Matteo Zecchin, David Gesbert, Marios Kountouris
Abstract要約: 我々は、よく知られたMixture of Experts(MoE)モデルから着想を得たアーキテクチャを提案する。時間変動統計シナリオを効率的に追跡する Team-DMoE モデルの有効性を示す。
参考スコア（独自算出の注目度）: 23.612400109629544
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In the context of wireless networking, it was recently shown that multiple DNNs can be jointly trained to offer a desired collaborative behaviour capable of coping with a broad range of sensing uncertainties. In particular, it was established that DNNs can be used to derive policies that are robust with respect to the information noise statistic affecting the local information (e.g. CSI in a wireless network) used by each agent (e.g. transmitter) to make its decision. While promising, a major challenge in the implementation of such method is that information noise statistics may differ from agent to agent and, more importantly, that such statistics may not be available at the time of training or may evolve over time, making burdensome retraining necessary. This situation makes it desirable to devise a "universal" machine learning model, which can be trained once for all so as to allow for decentralized cooperation in any future feedback noise environment. With this goal in mind, we propose an architecture inspired from the well-known Mixture of Experts (MoE) model, which was previously used for non-linear regression and classification tasks in various contexts, such as computer vision and speech recognition. We consider the decentralized power control problem as an example to showcase the validity of the proposed model and to compare it against other power control algorithms. We show the ability of the so called Team-DMoE model to efficiently track time-varying statistical scenarios.
Abstract（参考訳）: 近年,無線ネットワークの文脈において,複数のdnnを共同で訓練することで,幅広いセンサの不確実性に対処できる望ましい協調行動を提供できることを示した。特に、DNNは、各エージェント(例えば送信機)が決定するために使用するローカル情報(例えば、無線ネットワークにおけるCSI)に影響を及ぼす情報ノイズ統計量に関して、堅牢なポリシーを導出することができることが確立された。このような手法の実装における大きな課題は、情報ノイズ統計がエージェントからエージェントへ異なる場合があり、さらに重要なことは、そのような統計がトレーニング時に利用できない場合や、時間とともに進化し、負担のかかる再訓練が必要な場合である。この状況は、将来のフィードバックノイズ環境において分散協調を可能にするために、すべての場所で1回トレーニング可能な、"ユニバーサル"な機械学習モデルを考案することが望ましい。この目的を念頭に置いて,コンピュータビジョンや音声認識といった様々な文脈において,これまで非線形回帰や分類タスクに用いられてきた,著名な専門家の混合(moe)モデルから着想を得たアーキテクチャを提案する。本稿では,分散化電力制御問題を,提案モデルの有効性を示し,他の電力制御アルゴリズムと比較する例として考察する。時間変動統計シナリオを効率的に追跡する Team-DMoE モデルの有効性を示す。

関連論文リスト

Diffusion Models for Smarter UAVs: Decision-Making and Modeling [15.093742222365156]
無人航空機(UAV)は、現代の通信ネットワークにおいてますます採用されている。しかし、意思決定とデジタルモデリングの課題は、その急速な進歩を妨げ続けている。本稿では,これらの課題を効果的に解決するために,DMとRL,DTの統合について検討する。
論文参考訳（メタデータ） (2025-01-10T09:59:16Z)
Reservoir computing for system identification and predictive control with limited data [3.1484174280822845]
我々は、ベンチマーク制御システムの力学を学習し、モデル予測制御(MPC)の代理モデルとして機能するRNN変種の評価を行う。エコー状態ネットワーク(ESN)は、計算複雑性の低減、より有効な予測時間、MPC目的関数のコスト削減など、競合するアーキテクチャよりも様々な利点がある。
論文参考訳（メタデータ） (2024-10-23T21:59:07Z)
Federated Learning for Misbehaviour Detection with Variational Autoencoders and Gaussian Mixture Models [0.2999888908665658]
Federated Learning (FL)は、機械学習(ML)モデルを協調的にトレーニングするための魅力的なアプローチになっている。本研究は、車載環境における潜在的な不適切な行動を特定するための、新しい教師なしFLアプローチを提案する。当社は、モデルアグリゲーションの目的のために、パブリッククラウドサービスのコンピューティング能力を活用しています。
論文参考訳（メタデータ） (2024-05-16T08:49:50Z)
Optimal design of experiments in the context of machine-learning inter-atomic potentials: improving the efficiency and transferability of kernel based methods [0.7234862895932991]
原子間相互作用のデータ駆動機械学習(ML)モデルは、原子配列のニュアンスな側面をエネルギーと力の予測に関連付けることができる。主な課題は、化学環境のディスクリプタが、よく明確に定義された連続計量のない高次元の物体であるという事実に起因している。実験の統計的計画と最適設計の古典的な概念は、そのような問題を比較的低い計算コストで緩和するのに役立つことを実証する。
論文参考訳（メタデータ） (2024-05-14T14:14:23Z)
Decentralized Learning Strategies for Estimation Error Minimization with Graph Neural Networks [94.2860766709971]
統計的に同一性を持つ無線ネットワークにおける自己回帰的マルコフ過程のサンプリングとリモート推定の課題に対処する。我々のゴールは、分散化されたスケーラブルサンプリングおよび送信ポリシーを用いて、時間平均推定誤差と/または情報の年齢を最小化することである。
論文参考訳（メタデータ） (2024-04-04T06:24:11Z)
MADiff: Offline Multi-agent Learning with Diffusion Models [79.18130544233794]
MADiffは拡散型マルチエージェント学習フレームワークである。分散ポリシと集中型コントローラの両方として機能する。実験の結果,MADiffは様々なマルチエージェント学習タスクにおいて,ベースラインアルゴリズムよりも優れていた。
論文参考訳（メタデータ） (2023-05-27T02:14:09Z)
Enhancing Multiple Reliability Measures via Nuisance-extended Information Bottleneck [77.37409441129995]
トレーニングデータに制限がある現実的なシナリオでは、データ内の多くの予測信号は、データ取得のバイアスからより多く得る。我々は,相互情報制約の下で,より広い範囲の摂動をカバーできる敵の脅威モデルを考える。そこで本研究では,その目的を実現するためのオートエンコーダベーストレーニングと,提案したハイブリッド識別世代学習を促進するための実用的なエンコーダ設計を提案する。
論文参考訳（メタデータ） (2023-03-24T16:03:21Z)
Denoised MDPs: Learning World Models Better Than the World Itself [94.74665254213588]
本研究は,野生の情報を制御可能性と報酬との関係に基づく4つのタイプに分類し,制御性および報酬関連性の両方に有用な情報を定式化する。 DeepMind Control Suite と RoboDesk の変種に関する実験では、生の観測のみを用いた場合よりも、認知された世界モデルの優れた性能が示されている。
論文参考訳（メタデータ） (2022-06-30T17:59:49Z)
Learning Connectivity for Data Distribution in Robot Teams [96.39864514115136]
グラフニューラルネットワーク(GNN)を用いたアドホックネットワークにおけるデータ分散のためのタスク非依存,分散化,低レイテンシ手法を提案する。当社のアプローチは、グローバル状態情報に基づいたマルチエージェントアルゴリズムを各ロボットで利用可能にすることで機能させます。我々は,情報の平均年齢を報酬関数として強化学習を通じて分散gnn通信政策を訓練し,タスク固有の報酬関数と比較してトレーニング安定性が向上することを示す。
論文参考訳（メタデータ） (2021-03-08T21:48:55Z)
Collective Awareness for Abnormality Detection in Connected Autonomous Vehicles [4.659696262995864]
本稿では,知的エージェントのネットワークにおいて,集団認識の初期レベルを開発するための新しいアプローチを提案する。特定の集団的自己認識機能、すなわちエージェントが異常な状況を検出することを考える。また、ネットワークの各エージェントによって分散的に検知されたデータを共有するために、ネットワークが使用する通信チャネルによって影響を評価する。
論文参考訳（メタデータ） (2020-10-28T12:11:36Z)
Dif-MAML: Decentralized Multi-Agent Meta-Learning [54.39661018886268]
我々は,MAML や Dif-MAML と呼ばれる協調型マルチエージェントメタ学習アルゴリズムを提案する。提案手法により, エージェントの集合が線形速度で合意に達し, 集約MAMLの定常点に収束できることを示す。シミュレーションの結果は従来の非協調的な環境と比較して理論的な結果と優れた性能を示している。
論文参考訳（メタデータ） (2020-10-06T16:51:09Z)
Plausible Counterfactuals: Auditing Deep Learning Classifiers with Realistic Adversarial Examples [84.8370546614042]
ディープラーニングモデルのブラックボックスの性質は、彼らがデータから何を学ぶかについて、未回答の疑問を提起している。 GAN(Generative Adversarial Network)とマルチオブジェクトは、監査されたモデルに妥当な攻撃を与えるために使用される。その実用性は人間の顔の分類タスクの中で示され、提案されたフレームワークの潜在的可能性を明らかにしている。
論文参考訳（メタデータ） (2020-03-25T11:08:56Z)
Resource Management in Wireless Networks via Multi-Agent Deep Reinforcement Learning [15.091308167639815]
マルチエージェント深部強化学習(RL)を用いた無線ネットワークにおける分散リソース管理と干渉軽減機構を提案する。ネットワーク内の各送信機に深部RLエージェントを装備し、それに関連するユーザからの遅延観測を受信するとともに、近隣のエージェントと観測を交換する。提案フレームワークは,エージェントが他のエージェントの同時決定を知らずに,同時かつ分散的に意思決定を行うことを可能にする。
論文参考訳（メタデータ） (2020-02-14T19:01:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。