論文の概要: Collaborative Algorithms for Online Personalized Mean Estimation
- arxiv url: http://arxiv.org/abs/2208.11530v1
- Date: Wed, 24 Aug 2022 13:23:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-25 12:16:49.624265
- Title: Collaborative Algorithms for Online Personalized Mean Estimation
- Title(参考訳): オンラインパーソナライズ平均推定のための協調アルゴリズム
- Authors: Mahsa Asadi, Aur\'elien Bellet, Odalric-Ambrym Maillard, Marc Tommasi
- Abstract要約: いくつかの分布が同じ平均を持つ場合について検討し、エージェントは他のエージェントからの情報を積極的に問い合わせることができる。
目標は、各エージェントが他のエージェントとの通信によって平均推定を改善するアルゴリズムを設計することである。
我々は、このオンラインパーソナライズされた平均推定問題を解決するための新しい協調戦略を導入する。
- 参考スコア(独自算出の注目度): 12.875154616215305
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We consider an online estimation problem involving a set of agents. Each
agent has access to a (personal) process that generates samples from a
real-valued distribution and seeks to estimate its mean. We study the case
where some of the distributions have the same mean, and the agents are allowed
to actively query information from other agents. The goal is to design an
algorithm that enables each agent to improve its mean estimate thanks to
communication with other agents. The means as well as the number of
distributions with same mean are unknown, which makes the task nontrivial. We
introduce a novel collaborative strategy to solve this online personalized mean
estimation problem. We analyze its time complexity and introduce variants that
enjoy good performance in numerical experiments. We also extend our approach to
the setting where clusters of agents with similar means seek to estimate the
mean of their cluster.
- Abstract(参考訳): エージェントの集合を含むオンライン推定問題を考える。
各エージェントは、実数値分布からサンプルを生成し、その平均を推定する(個人的な)プロセスにアクセスする。
本研究では,分布のいくつかが同じ意味を持つ場合について検討し,エージェントが他のエージェントからの情報を積極的に問い合わせることを可能にした。
目標は、各エージェントが他のエージェントとの通信によって平均推定を改善するアルゴリズムを設計することである。
平均と、同じ平均の分布数は不明であり、これはタスクを非自明にしている。
このオンラインパーソナライズされた平均推定問題を解決するための新しい協調戦略を提案する。
我々は,その時間的複雑さを分析し,数値実験で優れた性能を示す変種を導入する。
また、類似した手段を持つエージェントのクラスタがクラスタの平均を推定する設定にもアプローチを拡張します。
関連論文リスト
- Differentially-Private Collaborative Online Personalized Mean Estimation [22.399703712241546]
プライバシー制約下での協調的パーソナライズされた平均推定の問題を考える。
2つのプライバシ機構と2つのデータ分散推定方式を提案する。
コラボレーションが完全に局所的なアプローチよりも早く収束することを示します。
論文 参考訳(メタデータ) (2024-11-11T16:14:56Z) - Networked Communication for Mean-Field Games with Function Approximation and Empirical Mean-Field Estimation [59.01527054553122]
分散エージェントは、経験的システムの単一かつ非エポゾディックな実行から平均フィールドゲームにおける平衡を学ぶことができる。
既存の設定に関数近似を導入し,Munchausen Online Mirror Descent 方式で描画する。
また, エージェントが局所的な周辺地域に基づいて, グローバルな経験分布を推定できる新しいアルゴリズムも提供する。
論文 参考訳(メタデータ) (2024-08-21T13:32:46Z) - Scalable Decentralized Algorithms for Online Personalized Mean Estimation [12.002609934938224]
本研究は,各エージェントが実数値分布からサンプルを収集し,その平均値を推定する,オーバーアーキシング問題の簡易版に焦点を当てた。
1つは信念の伝播からインスピレーションを得ており、もう1つはコンセンサスに基づくアプローチを採用している。
論文 参考訳(メタデータ) (2024-02-20T08:30:46Z) - Adaptive Crowdsourcing Via Self-Supervised Learning [20.393114559367202]
一般的なクラウドソーシングシステムでは、多くのクラウドワーカーがグループ見積もりを作成するために提供した潜在量の推定値が平均される。
我々は,自己教師付き学習と新しいアグリゲーションスキームを活用する新しいアプローチ,予測学習者を開発した。
論文 参考訳(メタデータ) (2024-01-24T05:57:36Z) - Distributed Bayesian Estimation in Sensor Networks: Consensus on
Marginal Densities [15.038649101409804]
連続変数上の確率分布の関数空間において、確率的確率的アルゴリズムを導出する。
これらの結果を利用して、個々のエージェントが観測する変数のサブセットに制限された新しい分散推定器を得る。
これは、協調的なローカライゼーションやフェデレートドラーニングのような応用に関係しており、任意のエージェントで収集されたデータは、関心のあるすべての変数のサブセットに依存する。
論文 参考訳(メタデータ) (2023-12-02T21:10:06Z) - Robust Online and Distributed Mean Estimation Under Adversarial Data
Corruption [1.9199742103141069]
我々は,敵対的データアタックの存在下でのオンラインおよび分散シナリオにおけるロバスト平均推定について検討した。
アルゴリズムに真の平均を組み込むために,推定値の誤差バウンドと収束特性を提供する。
論文 参考訳(メタデータ) (2022-09-17T16:36:21Z) - Byzantine-Robust Online and Offline Distributed Reinforcement Learning [60.970950468309056]
本稿では,複数のエージェントが環境を探索し,その経験を中央サーバを通じて伝達する分散強化学習環境について考察する。
エージェントの$alpha$-fractionは敵対的であり、任意の偽情報を報告することができる。
我々は、これらの対立エージェントの存在下で、マルコフ決定プロセスの根底にある準最適政策を特定することを模索する。
論文 参考訳(メタデータ) (2022-06-01T00:44:53Z) - Optimal Clustering with Bandit Feedback [57.672609011609886]
本稿では,バンディットフィードバックを用いたオンラインクラスタリングの問題点について考察する。
これは、NPハード重み付きクラスタリング問題をサブルーチンとして解決する必要性を回避するための、シーケンシャルなテストのための新しい停止規則を含む。
合成および実世界のデータセットの広範なシミュレーションを通して、BOCの性能は下界と一致し、非適応的ベースラインアルゴリズムよりも大幅に優れることを示す。
論文 参考訳(メタデータ) (2022-02-09T06:05:05Z) - Leveraging Ensembles and Self-Supervised Learning for Fully-Unsupervised
Person Re-Identification and Text Authorship Attribution [77.85461690214551]
完全ラベル付きデータからの学習は、Person Re-IdentificationやText Authorship Attributionなどのマルチメディアフォレスト問題において困難である。
近年の自己教師型学習法は,基礎となるクラスに意味的差異が有る場合に,完全ラベル付きデータを扱う際に有効であることが示されている。
本研究では,異なるクラスからのサンプルが顕著に多様性を持っていない場合でも,ラベルのないデータから学習できるようにすることにより,個人再認識とテキストオーサシップの属性に対処する戦略を提案する。
論文 参考訳(メタデータ) (2022-02-07T13:08:11Z) - Explaining Reinforcement Learning Policies through Counterfactual
Trajectories [147.7246109100945]
人間の開発者は、RLエージェントがテスト時にうまく機能することを検証しなければならない。
本手法では, エージェントの挙動をより広い軌道分布で示すことにより, エージェントの挙動を分布変化下で表現する。
本研究では,2つのエージェント検証タスクのうちの1つに対して,ベースライン法よりも優れたスコアを得られることを示す。
論文 参考訳(メタデータ) (2022-01-29T00:52:37Z) - Randomized Entity-wise Factorization for Multi-Agent Reinforcement
Learning [59.62721526353915]
実世界のマルチエージェント設定は、エージェントや非エージェントエンティティのタイプや量が異なるタスクを伴うことが多い。
我々の方法は、これらの共通点を活用することを目的としており、「観察対象のランダムに選択されたサブグループのみを考えるとき、各エージェントが期待する効用は何か?」という問いを投げかける。
論文 参考訳(メタデータ) (2020-06-07T18:28:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。