論文の概要: Distributed Bayesian Learning of Dynamic States
- arxiv url: http://arxiv.org/abs/2212.02565v1
- Date: Mon, 5 Dec 2022 19:40:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-07 18:15:27.628744
- Title: Distributed Bayesian Learning of Dynamic States
- Title(参考訳): 動的状態の分散ベイズ学習
- Authors: Mert Kayaalp, Virginia Bordignon, Stefan Vlaski, Vincenzo Matta, Ali
H. Sayed
- Abstract要約: 提案アルゴリズムは有限状態隠れマルコフモデルに対する分散ベイズフィルタタスクである。
逐次状態推定や、動的環境下でのソーシャルネットワーク上での意見形成のモデル化に使用できる。
- 参考スコア(独自算出の注目度): 65.7870637855531
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This work studies networked agents cooperating to track a dynamical state of
nature under partial information. The proposed algorithm is a distributed
Bayesian filtering algorithm for finite-state hidden Markov models (HMMs). It
can be used for sequential state estimation tasks, as well as for modeling
opinion formation over social networks under dynamic environments. We show that
the disagreement with the optimal centralized solution is asymptotically
bounded for the class of geometrically ergodic state transition models, which
includes rapidly changing models. We also derive recursions for calculating the
probability of error and establish convergence under Gaussian observation
models. Simulations are provided to illustrate the theory and to compare
against alternative approaches.
- Abstract(参考訳): 本研究は、部分的情報の下で自然の動的状態を追跡するために協調するネットワークエージェントの研究である。
提案アルゴリズムは有限状態隠れマルコフモデル(HMM)に対する分散ベイズフィルタアルゴリズムである。
シーケンシャルな状態推定タスクや、動的環境下でのソーシャルネットワーク上での意見形成のモデル化に使用できる。
最適集中解に対する不一致は、急速に変化するモデルを含む幾何学的エルゴード状態遷移モデルのクラスに漸近的に有界であることを示す。
また、誤差の確率を計算し、ガウス観測モデルの下で収束を確立するための再帰を導出する。
理論を説明するためのシミュレーションが提供され、代替手法と比較される。
関連論文リスト
- Latent Variable Representation for Reinforcement Learning [131.03944557979725]
モデルに基づく強化学習のサンプル効率を改善するために、潜在変数モデルが学習、計画、探索をいかに促進するかは理論上、実証上、不明である。
状態-作用値関数に対する潜在変数モデルの表現ビューを提供する。これは、抽出可能な変分学習アルゴリズムと楽観主義/悲観主義の原理の効果的な実装の両方を可能にする。
特に,潜伏変数モデルのカーネル埋め込みを組み込んだUPB探索を用いた計算効率の良い計画アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-17T00:26:31Z) - Likelihood-Free Inference in State-Space Models with Unknown Dynamics [71.94716503075645]
本研究では、状態空間モデルにおいて、観測をシミュレートすることしかできず、遷移ダイナミクスが不明な潜在状態の推測と予測を行う手法を提案する。
本研究では,限られた数のシミュレーションで状態予測と状態予測を行う手法を提案する。
論文 参考訳(メタデータ) (2021-11-02T12:33:42Z) - Variational Inference for Continuous-Time Switching Dynamical Systems [29.984955043675157]
従属拡散過程を変調したマルコフジャンプ過程に基づくモデルを提案する。
我々は,新しい連続時間変動推定アルゴリズムを開発した。
モデル仮定と実世界の実例に基づいて,我々のアルゴリズムを広範囲に評価する。
論文 参考訳(メタデータ) (2021-09-29T15:19:51Z) - MINIMALIST: Mutual INformatIon Maximization for Amortized Likelihood
Inference from Sampled Trajectories [61.3299263929289]
シミュレーションベースの推論は、その可能性が実際に計算できない場合でもモデルのパラメータを学習することができる。
あるクラスのメソッドは、異なるパラメータでシミュレートされたデータを使用して、確率とエビデンス比の償却推定器を推定する。
モデルパラメータとシミュレーションデータ間の相互情報の観点から,本手法が定式化可能であることを示す。
論文 参考訳(メタデータ) (2021-06-03T12:59:16Z) - Temporal-Structure-Assisted Gradient Aggregation for Over-the-Air
Federated Edge Learning [24.248673415586413]
本稿では,モデル集約系列の固有時間構造を特徴付けるマルコフ確率モデルを提案する。
本研究では,時間構造支援勾配集約(TSA-GA)と呼ばれるメッセージパッシングアルゴリズムを開発し,この推定課題を満たす。
提案するtsagaアルゴリズムは最先端技術を大幅に上回り,同等の学習性能を達成可能であることを示す。
論文 参考訳(メタデータ) (2021-03-03T09:13:27Z) - Statistical optimality and stability of tangent transform algorithms in
logit models [6.9827388859232045]
我々は,データ生成過程の条件として,ロジカルオプティマによって引き起こされるリスクに対して,非漸近上界を導出する。
特に,データ生成過程の仮定なしにアルゴリズムの局所的変動を確立する。
我々は,大域収束が得られる半直交設計を含む特別な場合について検討する。
論文 参考訳(メタデータ) (2020-10-25T05:15:13Z) - SODEN: A Scalable Continuous-Time Survival Model through Ordinary
Differential Equation Networks [14.564168076456822]
本稿では、ニューラルネットワークとスケーラブルな最適化アルゴリズムを用いた生存分析のためのフレキシブルモデルを提案する。
提案手法の有効性を,既存の最先端ディープラーニングサバイバル分析モデルと比較した。
論文 参考訳(メタデータ) (2020-08-19T19:11:25Z) - Control as Hybrid Inference [62.997667081978825]
本稿では、反復推論と償却推論のバランスを自然に仲介するCHIの実装について述べる。
連続的な制御ベンチマークでアルゴリズムのスケーラビリティを検証し、強力なモデルフリーおよびモデルベースラインを上回る性能を示す。
論文 参考訳(メタデータ) (2020-07-11T19:44:09Z) - A Variational View on Bootstrap Ensembles as Bayesian Inference [24.55506395666038]
本稿では,各モデル/粒子がパラメトリックブートストラップと先行の摂動によりデータの摂動に対応するアンサンブルに基づく手法を検討する。
実験により、アンサンブル法がベイズ近似の代替となることが確認された。
論文 参考訳(メタデータ) (2020-06-08T13:01:37Z) - Decentralized MCTS via Learned Teammate Models [89.24858306636816]
本稿では,モンテカルロ木探索に基づくトレーニング可能なオンライン分散計画アルゴリズムを提案する。
深層学習と畳み込みニューラルネットワークを用いて正確なポリシー近似を作成可能であることを示す。
論文 参考訳(メタデータ) (2020-03-19T13:10:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。