Fugu-MT 論文翻訳(概要): On Collaboration in Distributed Parameter Estimation with Resource Constraints

論文の概要: On Collaboration in Distributed Parameter Estimation with Resource Constraints

arxiv url: http://arxiv.org/abs/2307.06442v1
Date: Wed, 12 Jul 2023 20:11:50 GMT
ステータス: 翻訳完了
システム内更新日: 2023-07-14 16:26:31.101025
Title: On Collaboration in Distributed Parameter Estimation with Resource Constraints
Title（参考訳）: 資源制約を考慮した分散パラメータ推定における協調について
Authors: Yu-Zhen Janice Chen, Daniel S. Menasch\'e, and Don Towsley
Abstract要約: パラメータ推定のためのセンサ/エージェントデータ収集と協調ポリシーについて検討する。我々は、最適なデータ収集と協調ポリシーを学ぶために、マルチアームバンディットアルゴリズムを適用する新しい方法を提案する。
参考スコア（独自算出の注目度）: 13.014069919671623
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: We study sensor/agent data collection and collaboration policies for parameter estimation, accounting for resource constraints and correlation between observations collected by distinct sensors/agents. Specifically, we consider a group of sensors/agents each samples from different variables of a multivariate Gaussian distribution and has different estimation objectives, and we formulate a sensor/agent's data collection and collaboration policy design problem as a Fisher information maximization (or Cramer-Rao bound minimization) problem. When the knowledge of correlation between variables is available, we analytically identify two particular scenarios: (1) where the knowledge of the correlation between samples cannot be leveraged for collaborative estimation purposes and (2) where the optimal data collection policy involves investing scarce resources to collaboratively sample and transfer information that is not of immediate interest and whose statistics are already known, with the sole goal of increasing the confidence on the estimate of the parameter of interest. When the knowledge of certain correlation is unavailable but collaboration may still be worthwhile, we propose novel ways to apply multi-armed bandit algorithms to learn the optimal data collection and collaboration policy in our distributed parameter estimation problem and demonstrate that the proposed algorithms, DOUBLE-F, DOUBLE-Z, UCB-F, UCB-Z, are effective through simulations.
Abstract（参考訳）: 本研究では,センサ/エージェント間のパラメータ推定,資源制約の計算,センサ/エージェント間の相関について検討した。具体的には,多変量ガウス分布の異なる変数から抽出されたセンサ・エージェント群をそれぞれ異なる推定目標を持ち,センサ・エージェントのデータ収集と協調政策設計問題をフィッシャー情報最大化(あるいはクレーマー・ラオ境界最小化)問題として定式化する。 When the knowledge of correlation between variables is available, we analytically identify two particular scenarios: (1) where the knowledge of the correlation between samples cannot be leveraged for collaborative estimation purposes and (2) where the optimal data collection policy involves investing scarce resources to collaboratively sample and transfer information that is not of immediate interest and whose statistics are already known, with the sole goal of increasing the confidence on the estimate of the parameter of interest. 本研究では,分散パラメータ推定問題における最適データ収集と協調政策を学習するために,多腕バンディットアルゴリズムを適用する新しい手法を提案し,提案手法であるdouble-f,double-z,ucb-f,ucb-zがシミュレーションにより有効であることを示す。

関連論文リスト

Preference Optimization for Combinatorial Optimization Problems [54.87466279363487]
強化学習(Reinforcement Learning, RL)は、ニューラルネットワーク最適化のための強力なツールとして登場した。大幅な進歩にもかかわらず、既存のRLアプローチは報酬信号の減少や大規模な行動空間における非効率な探索といった課題に直面している。統計的比較モデルを用いて定量的報酬信号を定性的選好信号に変換する新しい手法であるPreference Optimizationを提案する。
論文参考訳（メタデータ） (2025-05-13T16:47:00Z)
Exploiting inter-agent coupling information for efficient reinforcement learning of cooperative LQR [3.4760283855855336]
エージェント間結合情報を利用して,各エージェントの局所的なQ-関数を正確に分解するための体系的アプローチを提案する。提案した分解に基づく最小2乗ポリシー反復アルゴリズムを開発し,各エージェントの局所的なQ-関数を学習するための2つのアーキテクチャを同定する。
論文参考訳（メタデータ） (2025-04-29T16:42:13Z)
Multi-Source Conformal Inference Under Distribution Shift [41.701790856201036]
複数のバイアスのあるデータソースを活用することにより,対象個体数の分布自由な予測区間を得るという課題を考察する。対象集団および源集団における未観測結果の定量値に対する効率的な影響関数を導出する。本稿では、効率向上のための重み付き情報ソースとバイアス低減のための重み付き非情報ソースに対するデータ適応戦略を提案する。
論文参考訳（メタデータ） (2024-05-15T13:33:09Z)
Distributed Personalized Empirical Risk Minimization [19.087524494290676]
本稿では、異種データからの学習を容易にするために、新たなパラダイムであるPersonalized Empirical Risk Minimization(PERM)を提案する。本稿では,標準モデル平均化をモデルシャッフルに置き換えた分散アルゴリズムを提案し,すべてのデバイスに対してPERM目標を同時に最適化する。
論文参考訳（メタデータ） (2023-10-26T20:07:33Z)
Compressed Regression over Adaptive Networks [58.79251288443156]
分散エージェントのネットワークによって達成可能な性能を導出し,通信制約や回帰問題を解消し,適応的に解決する。エージェントによって最適化に必要なパラメータをオンラインで学習できる最適化アロケーション戦略を考案する。
論文参考訳（メタデータ） (2023-04-07T13:41:08Z)
Multi-Resource Allocation for On-Device Distributed Federated Learning Systems [79.02994855744848]
本研究は,デバイス上の分散フェデレーション学習(FL)システムにおいて,レイテンシとエネルギー消費の重み付け和を最小化する分散マルチリソース割り当て方式を提案する。システム内の各モバイルデバイスは、指定された領域内でモデルトレーニングプロセスを実行し、それぞれパラメータの導出とアップロードを行うための計算と通信資源を割り当てる。
論文参考訳（メタデータ） (2022-11-01T14:16:05Z)
To Collaborate or Not in Distributed Statistical Estimation with Resource Constraints? [14.626510386380474]
本研究では,異なるセンサ/学習者が収集した観測値の相関関係が,データ収集と協調戦略に与える影響について検討した。無線センサネットワークにおけるIoT DDoS攻撃検出と分散推定という2つのアプリケーションについて検討する。
論文参考訳（メタデータ） (2022-05-31T20:47:09Z)
DRFLM: Distributionally Robust Federated Learning with Inter-client Noise via Local Mixup [58.894901088797376]
連合学習は、生データをリークすることなく、複数の組織のデータを使用してグローバルモデルをトレーニングするための有望なアプローチとして登場した。上記の2つの課題を同時に解決するための一般的な枠組みを提案する。我々は、ロバストネス解析、収束解析、一般化能力を含む包括的理論的解析を提供する。
論文参考訳（メタデータ） (2022-04-16T08:08:29Z)
FedADMM: A Robust Federated Deep Learning Framework with Adaptivity to System Heterogeneity [4.2059108111562935]
Federated Learning(FL)は、エッジデバイスによる大規模データの分散処理のための新興フレームワークである。本稿では,FLAD FedADMMに基づく新しいプロトコルを提案する。我々は,FedADMMが通信効率の点で,すべてのベースライン手法を一貫して上回っていることを示す。
論文参考訳（メタデータ） (2022-04-07T15:58:33Z)
Reinforcement Learning with Heterogeneous Data: Estimation and Inference [84.72174994749305]
人口の不均一性に関する逐次的決定問題に対処するために,K-ヘテロ・マルコフ決定過程(K-ヘテロ・MDP)を導入する。本稿では、ある政策の価値を推定するための自己クラスタ化政策評価(ACPE)と、ある政策クラスにおける最適な政策を推定するための自己クラスタ化政策イテレーション(ACPI)を提案する。理論的な知見を裏付けるシミュレーションを行い,MIMIC-III標準データセットの実証的研究を行った。
論文参考訳（メタデータ） (2022-01-31T20:58:47Z)
Distributed Estimation of Sparse Inverse Covariance Matrices [0.7832189413179361]
分散エージェントが収集したデータからネットワーク構造をリアルタイムで学習する分散スパース逆共分散アルゴリズムを提案する。我々のアプローチは、エージェントが望ましい構造を協調的に学習できるコンセンサス項を付加した、オンラインのグラフィカル交代最小化アルゴリズムに基づいて構築されている。
論文参考訳（メタデータ） (2021-09-24T15:26:41Z)
Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。コア最適化問題の実用的なパラメトリゼーションを提供する。
論文参考訳（メタデータ） (2021-07-08T18:01:02Z)
Resource Allocation via Model-Free Deep Learning in Free Space Optical Communications [119.81868223344173]
本稿では,自由空間光学(FSO)通信におけるチャネルフェージング効果の緩和のための資源配分の一般的な問題について検討する。本フレームワークでは,FSO資源割り当て問題を解決する2つのアルゴリズムを提案する。
論文参考訳（メタデータ） (2020-07-27T17:38:51Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。