論文の概要: Distributed Hypothesis Testing and Social Learning in Finite Time with a
Finite Amount of Communication
- arxiv url: http://arxiv.org/abs/2004.01306v1
- Date: Thu, 2 Apr 2020 23:38:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-17 13:21:42.583037
- Title: Distributed Hypothesis Testing and Social Learning in Finite Time with a
Finite Amount of Communication
- Title(参考訳): 有限なコミュニケーション量を持つ有限時間における分散仮説テストと社会学習
- Authors: Shreyas Sundaram and Aritra Mitra
- Abstract要約: 分散仮説テスト(ソーシャルラーニング)の問題点を考察する。
エージェントのネットワークは、有限の仮説から世界の真の状態を特定しようとする。
エージェントがネットワークの直径を知っていれば,アルゴリズムをさらに改良して,すべてのエージェントが真の状態を学習できることが示される。
- 参考スコア(独自算出の注目度): 1.9199742103141069
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider the problem of distributed hypothesis testing (or social
learning) where a network of agents seeks to identify the true state of the
world from a finite set of hypotheses, based on a series of stochastic signals
that each agent receives. Prior work on this problem has provided distributed
algorithms that guarantee asymptotic learning of the true state, with
corresponding efforts to improve the rate of learning. In this paper, we first
argue that one can readily modify existing asymptotic learning algorithms to
enable learning in finite time, effectively yielding arbitrarily large
(asymptotic) rates. We then provide a simple algorithm for finite-time learning
which only requires the agents to exchange a binary vector (of length equal to
the number of possible hypotheses) with their neighbors at each time-step.
Finally, we show that if the agents know the diameter of the network, our
algorithm can be further modified to allow all agents to learn the true state
and stop transmitting to their neighbors after a finite number of time-steps.
- Abstract(参考訳): エージェントのネットワークが、各エージェントが受信する一連の確率的信号に基づいて、有限個の仮説から世界の真の状態を識別しようとする分散仮説テスト(または社会学習)の問題を考える。
この問題に対する以前の取り組みは、真の状態の漸近的な学習を保証する分散アルゴリズムを提供し、それに対応することで学習率を向上させる。
本稿では,既存の漸近学習アルゴリズムを簡単に修正して有限時間で学習可能とし,任意に大きい(漸近学習)レートを効果的に得ることを最初に論じる。
次に、有限時間学習のための単純なアルゴリズムを提案し、エージェントはそれぞれの時間ステップで隣人と二進ベクトル(可能な仮説の数に等しい長さ)を交換することを要求する。
最後に、エージェントがネットワークの直径を知っていれば、すべてのエージェントが真の状態を学習し、有限の時間ステップの後に隣人への送信を停止できるようにアルゴリズムをさらに修正できることを示す。
関連論文リスト
- Probabilistic Verification of Neural Networks using Branch and Bound [3.0567348883549816]
ニューラルネットワークの確率的検証は、入力の確率分布の下で、ニューラルネットワークの出力を正式に解析することに関わる。
本稿では,ニューラルネットワークの確率的検証を計算アルゴリズムに基づいて定量化するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-05-27T18:00:03Z) - Scalable Decentralized Algorithms for Online Personalized Mean Estimation [12.002609934938224]
本研究は,各エージェントが実数値分布からサンプルを収集し,その平均値を推定する,オーバーアーキシング問題の簡易版に焦点を当てた。
1つは信念の伝播からインスピレーションを得ており、もう1つはコンセンサスに基づくアプローチを採用している。
論文 参考訳(メタデータ) (2024-02-20T08:30:46Z) - A Stable, Fast, and Fully Automatic Learning Algorithm for Predictive
Coding Networks [65.34977803841007]
予測符号化ネットワークは、ベイズ統計学と神経科学の両方にルーツを持つ神経科学にインスパイアされたモデルである。
シナプス重みに対する更新規則の時間的スケジュールを変更するだけで、元の規則よりもずっと効率的で安定したアルゴリズムが得られることを示す。
論文 参考訳(メタデータ) (2022-11-16T00:11:04Z) - Doubly Inhomogeneous Reinforcement Learning [4.334006170547247]
我々は、ポリシー学習のために、時間とともに個人間で類似したダイナミクスを表示する「最良のデータチャンクを決定するためのオリジナルアルゴリズム」を提案する。
提案手法は汎用的であり,クラスタリングおよび変更点検出アルゴリズムの幅広い範囲で動作する。
論文 参考訳(メタデータ) (2022-11-08T03:41:14Z) - Federated Best Arm Identification with Heterogeneous Clients [62.36929749450298]
中央サーバと複数のクライアントを備えた多腕バンディット・セッティングにおける腕の識別について検討した。
予測停止時間上の上限が乗算定数までの下限と一致するアルゴリズム(ほぼ最適アルゴリズムの場合)について示す。
本稿では,指数時間瞬間に通信する新しいアルゴリズムを提案し,ほぼ最適であることを実証する。
論文 参考訳(メタデータ) (2022-10-14T13:09:11Z) - Multi-Agent Reinforcement Learning with Temporal Logic Specifications [65.79056365594654]
本研究では,時間論理仕様を満たすための学習課題を,未知の環境下でエージェントのグループで検討する。
我々は、時間論理仕様のための最初のマルチエージェント強化学習手法を開発した。
主アルゴリズムの正確性と収束性を保証する。
論文 参考訳(メタデータ) (2021-02-01T01:13:03Z) - Distributed Inference with Sparse and Quantized Communication [7.155594644943642]
ネットワーク内のエージェントが未知の状態によって生成されたプライベート信号のストリームを観測する分散推論の問題を考察する。
本研究では,各仮説に対する低信念を拡散する原理に基づく,イベントトリガー型分散学習ルールを開発する。
逐次量子化器の範囲を精製することにより、各エージェントは1ドルビットで各仮説の信念を符号化しながら、ほぼ確実に指数関数的に真理を学習できることを示す。
論文 参考訳(メタデータ) (2020-04-02T23:08:51Z) - A Distributional Analysis of Sampling-Based Reinforcement Learning
Algorithms [67.67377846416106]
定常ステップサイズに対する強化学習アルゴリズムの理論解析に対する分布的アプローチを提案する。
本稿では,TD($lambda$)や$Q$-Learningのような値ベースの手法が,関数の分布空間で制約のある更新ルールを持つことを示す。
論文 参考訳(メタデータ) (2020-03-27T05:13:29Z) - Finite-Time Last-Iterate Convergence for Multi-Agent Learning in Games [116.0771177871705]
我々は,$lambda$-cocoerciveゲーム上での連立OGD学習における有限時間最終点収束率を特徴付ける。
新たなダブルストッピング時間法により, この適応アルゴリズムは, 非適応的手法と同じ有限時間終点収束率が得られることを示す。
論文 参考訳(メタデータ) (2020-02-23T01:46:34Z) - Statistical Limits of Supervised Quantum Learning [90.0289160657379]
精度の制約を考慮すると、教師付き学習のための量子機械学習アルゴリズムは入力次元における多対数ランタイムを達成できないことを示す。
より効率的な古典的アルゴリズムよりも、教師あり学習のための量子機械学習アルゴリズムの方が、ほとんどの場合スピードアップできると結論付けている。
論文 参考訳(メタデータ) (2020-01-28T17:35:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。