論文の概要: On Collaboration in Distributed Parameter Estimation with Resource
Constraints
- arxiv url: http://arxiv.org/abs/2307.06442v1
- Date: Wed, 12 Jul 2023 20:11:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-14 16:26:31.101025
- Title: On Collaboration in Distributed Parameter Estimation with Resource
Constraints
- Title(参考訳): 資源制約を考慮した分散パラメータ推定における協調について
- Authors: Yu-Zhen Janice Chen, Daniel S. Menasch\'e, and Don Towsley
- Abstract要約: パラメータ推定のためのセンサ/エージェントデータ収集と協調ポリシーについて検討する。
我々は、最適なデータ収集と協調ポリシーを学ぶために、マルチアームバンディットアルゴリズムを適用する新しい方法を提案する。
- 参考スコア(独自算出の注目度): 13.014069919671623
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We study sensor/agent data collection and collaboration policies for
parameter estimation, accounting for resource constraints and correlation
between observations collected by distinct sensors/agents. Specifically, we
consider a group of sensors/agents each samples from different variables of a
multivariate Gaussian distribution and has different estimation objectives, and
we formulate a sensor/agent's data collection and collaboration policy design
problem as a Fisher information maximization (or Cramer-Rao bound minimization)
problem. When the knowledge of correlation between variables is available, we
analytically identify two particular scenarios: (1) where the knowledge of the
correlation between samples cannot be leveraged for collaborative estimation
purposes and (2) where the optimal data collection policy involves investing
scarce resources to collaboratively sample and transfer information that is not
of immediate interest and whose statistics are already known, with the sole
goal of increasing the confidence on the estimate of the parameter of interest.
When the knowledge of certain correlation is unavailable but collaboration may
still be worthwhile, we propose novel ways to apply multi-armed bandit
algorithms to learn the optimal data collection and collaboration policy in our
distributed parameter estimation problem and demonstrate that the proposed
algorithms, DOUBLE-F, DOUBLE-Z, UCB-F, UCB-Z, are effective through
simulations.
- Abstract(参考訳): 本研究では,センサ/エージェント間のパラメータ推定,資源制約の計算,センサ/エージェント間の相関について検討した。
具体的には,多変量ガウス分布の異なる変数から抽出されたセンサ・エージェント群をそれぞれ異なる推定目標を持ち,センサ・エージェントのデータ収集と協調政策設計問題をフィッシャー情報最大化(あるいはクレーマー・ラオ境界最小化)問題として定式化する。
When the knowledge of correlation between variables is available, we analytically identify two particular scenarios: (1) where the knowledge of the correlation between samples cannot be leveraged for collaborative estimation purposes and (2) where the optimal data collection policy involves investing scarce resources to collaboratively sample and transfer information that is not of immediate interest and whose statistics are already known, with the sole goal of increasing the confidence on the estimate of the parameter of interest.
本研究では,分散パラメータ推定問題における最適データ収集と協調政策を学習するために,多腕バンディットアルゴリズムを適用する新しい手法を提案し,提案手法であるdouble-f,double-z,ucb-f,ucb-zがシミュレーションにより有効であることを示す。
関連論文リスト
- Causal Coordinated Concurrent Reinforcement Learning [8.654978787096807]
本稿では,データ共有と協調探索のための新しいアルゴリズムフレームワークを提案する。
本アルゴリズムは,独立規制による個人差分制御モデルパラメータの抽出において,付加雑音モデル-混合モデル(ANM-MM)という形で因果推論アルゴリズムを利用する。
抽出したモデルパラメータの類似度に基づく新しいデータ共有方式を提案し, 自己回帰, 振り子, カートポールのスイングアップタスクのセットにおいて, 優れた学習速度を示す。
論文 参考訳(メタデータ) (2024-01-31T17:20:28Z) - Optimal Heterogeneous Collaborative Linear Regression and Contextual
Bandits [34.121889149071684]
本研究では、各インスタンスの関連パラメータが大域的パラメータとスパースなインスタンス固有項と等しくなるような協調線形回帰と文脈的バンドイットについて検討する。
MOLARと呼ばれる新しい2段階推定器を提案し、まず、インスタンスの線形回帰推定のエントリーワイド中央値を構築し、その後、インスタンス固有推定値を中央値に向けて縮小することで、この構造を利用する。
次に、MOLARを用いて、不均一な協調的文脈的包帯の手法を開発し、独立した包帯法と比較して、後悔の保証を改善する。
論文 参考訳(メタデータ) (2023-06-09T22:48:13Z) - CEDAR: Communication Efficient Distributed Analysis for Regressions [9.50726756006467]
患者レベルのデータを共有することなく、複数のEHRデータベース上での分散学習への関心が高まっている。
本稿では,局所的な最適推定値を集約する通信効率のよい新しい手法を提案する。
本稿では,統計的推測法と差分プライバシーに関する理論的検討を行い,シミュレーションおよび実データ解析におけるその性能評価を行う。
論文 参考訳(メタデータ) (2022-07-01T09:53:44Z) - Causal Balancing for Domain Generalization [95.97046583437145]
そこで本研究では,観察されたトレーニング分布の領域特異的なスプリアス相関を低減するために,バランスの取れたミニバッチサンプリング戦略を提案する。
本研究では, 突発性源の同定可能性を保証するとともに, バランスの取れた, 突発性のない分布から, 提案手法が有効にサンプリング可能であることを示す。
論文 参考訳(メタデータ) (2022-06-10T17:59:11Z) - To Collaborate or Not in Distributed Statistical Estimation with
Resource Constraints? [14.626510386380474]
本研究では,異なるセンサ/学習者が収集した観測値の相関関係が,データ収集と協調戦略に与える影響について検討した。
無線センサネットワークにおけるIoT DDoS攻撃検出と分散推定という2つのアプリケーションについて検討する。
論文 参考訳(メタデータ) (2022-05-31T20:47:09Z) - DRFLM: Distributionally Robust Federated Learning with Inter-client
Noise via Local Mixup [58.894901088797376]
連合学習は、生データをリークすることなく、複数の組織のデータを使用してグローバルモデルをトレーニングするための有望なアプローチとして登場した。
上記の2つの課題を同時に解決するための一般的な枠組みを提案する。
我々は、ロバストネス解析、収束解析、一般化能力を含む包括的理論的解析を提供する。
論文 参考訳(メタデータ) (2022-04-16T08:08:29Z) - Reinforcement Learning with Heterogeneous Data: Estimation and Inference [84.72174994749305]
人口の不均一性に関する逐次的決定問題に対処するために,K-ヘテロ・マルコフ決定過程(K-ヘテロ・MDP)を導入する。
本稿では、ある政策の価値を推定するための自己クラスタ化政策評価(ACPE)と、ある政策クラスにおける最適な政策を推定するための自己クラスタ化政策イテレーション(ACPI)を提案する。
理論的な知見を裏付けるシミュレーションを行い,MIMIC-III標準データセットの実証的研究を行った。
論文 参考訳(メタデータ) (2022-01-31T20:58:47Z) - Sparse Feature Selection Makes Batch Reinforcement Learning More Sample
Efficient [62.24615324523435]
本稿では,スパース線形関数近似を用いた高次元バッチ強化学習(RL)の統計的解析を行う。
候補となる機能が多数存在する場合,提案手法がバッチRLをより効率的にサンプリングできるという事実に光を当てる。
論文 参考訳(メタデータ) (2020-11-08T16:48:02Z) - Optimal Off-Policy Evaluation from Multiple Logging Policies [77.62012545592233]
我々は,複数のロギングポリシからオフ政治評価を行い,それぞれが一定のサイズ,すなわち階層化サンプリングのデータセットを生成する。
複数ロガーのOPE推定器は,任意のインスタンス,すなわち効率のよいインスタンスに対して最小分散である。
論文 参考訳(メタデータ) (2020-10-21T13:43:48Z) - Combining Task Predictors via Enhancing Joint Predictability [53.46348489300652]
そこで本研究では,目標予測能力に基づいて参照の関連性を測定し,その関連性を高めるための新しい予測器組合せアルゴリズムを提案する。
提案アルゴリズムはベイズフレームワークを用いて,すべての参照の関連性について共同で評価する。
視覚属性ランキングとマルチクラス分類シナリオから得られた実世界の7つのデータセットの実験に基づいて,本アルゴリズムが性能向上に寄与し,既存の予測器の組み合わせアプローチの適用範囲を広くすることを示した。
論文 参考訳(メタデータ) (2020-07-15T21:58:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。