論文の概要: Joint Age-State Belief is All You Need: Minimizing AoII via Pull-Based Remote Estimation
- arxiv url: http://arxiv.org/abs/2411.07179v1
- Date: Mon, 11 Nov 2024 17:57:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-12 14:06:58.448194
- Title: Joint Age-State Belief is All You Need: Minimizing AoII via Pull-Based Remote Estimation
- Title(参考訳): プルベースリモート推定によるAoIIの最小化
- Authors: Ismail Cosandal, Sennur Ulukus, Nail Akar,
- Abstract要約: 不正確な情報の時代(AoII)は、最近提案された新鮮さとミスマッチの指標である。
AoIIの追跡には、ソースと推定プロセスの両方の知識が必要である。
- 参考スコア(独自算出の注目度): 30.838857981082967
- License:
- Abstract: Age of incorrect information (AoII) is a recently proposed freshness and mismatch metric that penalizes an incorrect estimation along with its duration. Therefore, keeping track of AoII requires the knowledge of both the source and estimation processes. In this paper, we consider a time-slotted pull-based remote estimation system under a sampling rate constraint where the information source is a general discrete-time Markov chain (DTMC) process. Moreover, packet transmission times from the source to the monitor are non-zero which disallows the monitor to have perfect information on the actual AoII process at any time. Hence, for this pull-based system, we propose the monitor to maintain a sufficient statistic called {\em belief} which stands for the joint distribution of the age and source processes to be obtained from the history of all observations. Using belief, we first propose a maximum a posteriori (MAP) estimator to be used at the monitor as opposed to existing martingale estimators in the literature. Second, we obtain the optimality equations from the belief-MDP (Markov decision process) formulation. Finally, we propose two belief-dependent policies one of which is based on deep reinforcement learning, and the other one is a threshold-based policy based on the instantaneous expected AoII.
- Abstract(参考訳): 誤情報の年齢(AoII)は、最近提案された新鮮度とミスマッチの指標であり、その期間とともに誤った推定をペナルティ化する。
したがって、AoIIの追跡には、ソースと推定プロセスの両方の知識が必要である。
本稿では,情報ソースが一般的な離散時間マルコフ連鎖(DTMC)プロセスであるサンプリングレート制約の下で,時間スロットのプルベースリモート推定システムについて考察する。
さらに、ソースからモニタへのパケット送信時間はゼロではないので、モニタがいつでも実際のAoIIプロセスについて完全な情報を持つことができない。
したがって、このプルベースシステムでは、すべての観測履歴から得られる年齢と源過程の連成分布を表す十分な統計量を維持するためのモニタが提案される。
本研究はまず,既存のマルティンゲール推定器と対比して,最大後部推定器(MAP)をモニターで使用することを提案する。
第二に、信念-MDP(マルコフ決定過程)の定式化から最適性方程式を得る。
最後に, 深層強化学習に基づく信頼依存政策と, 即時予測されたAoIIに基づくしきい値に基づく政策の2つを提案する。
関連論文リスト
- Data-driven Bayesian State Estimation with Compressed Measurement of Model-free Process using Semi-supervised Learning [57.04370580292727]
モデルフリープロセスの圧縮測定(BSCM)によるデータ駆動ベイズ状態の推定。
時間的測定ベクトルの次元は、推定される時間的状態ベクトルの次元よりも低い。
既存の2つの教師なし学習ベースのデータ駆動手法は、モデルフリープロセスのBSCM問題に対処できない。
半教師付き学習に基づくDANSE手法を開発し,その手法をSemiDANSEと呼ぶ。
論文 参考訳(メタデータ) (2024-07-10T05:03:48Z) - Learning Algorithms for Verification of Markov Decision Processes [20.5951492453299]
マルコフ決定過程(MDP)の検証に学習アルゴリズムを適用するための一般的な枠組みを提案する。
提案するフレームワークは,検証における中核的な問題である確率的到達性に重点を置いている。
論文 参考訳(メタデータ) (2024-03-14T08:54:19Z) - Off-Policy Evaluation in Markov Decision Processes under Weak
Distributional Overlap [5.0401589279256065]
本稿では,マルコフ決定過程(MDP)における非政治的評価の課題を再検討する。
本稿では,この環境での良好な性能を期待できる2重頑健性(TDR)推定器のクラスを紹介する。
論文 参考訳(メタデータ) (2024-02-13T03:55:56Z) - Equal Opportunity of Coverage in Fair Regression [50.76908018786335]
我々は、予測の不確実性の下で公正な機械学習(ML)を研究し、信頼性と信頼性のある意思決定を可能にする。
本研究は,(1)類似した結果の異なる集団に対するカバー率が近いこと,(2)人口全体のカバー率が一定水準にあること,の2つの特性を達成することを目的としたカバーの平等機会(EOC)を提案する。
論文 参考訳(メタデータ) (2023-11-03T21:19:59Z) - Time-Synchronized Full System State Estimation Considering Practical Implementation Challenges [0.15978270011184256]
この問題を解決するために,Deep Neural Network-based State Estimator (DeNSE)を提案する。
DeNSEは、緩やかな時間スケールから引き出された推論と広範囲にわたる監視制御とデータ取得(SCADA)データを高速な時間スケールに間接的に組み合わせるために、ベイズフレームワークを使用している。
IEEE 118-busシステムを用いて得られた結果は、純粋にSCADA状態推定器とPMUのみの線形状態推定器よりもDeNSEの優位性を示す。
論文 参考訳(メタデータ) (2022-12-04T02:59:32Z) - Magic determines the hardness of direct fidelity estimation [0.0]
本稿では,魔法の資源理論が直接忠実度推定プロトコルの硬さをいかに定量化するかを示す。
我々はその結果を量子進化に拡張し、与えられたユニタリ$U$の実装の質を証明するために必要なリソースが、$U$に関連付けられたチョイ状態のマジックによって支配されていることを示す。
論文 参考訳(メタデータ) (2022-04-06T18:00:02Z) - Sampling-Based Robust Control of Autonomous Systems with Non-Gaussian
Noise [59.47042225257565]
雑音分布の明示的な表現に依存しない新しい計画法を提案する。
まず、連続系を離散状態モデルに抽象化し、状態間の確率的遷移によってノイズを捕捉する。
いわゆる区間マルコフ決定過程(iMDP)の遷移確率区間におけるこれらの境界を捉える。
論文 参考訳(メタデータ) (2021-10-25T06:18:55Z) - Universal Off-Policy Evaluation [64.02853483874334]
ユニバーサルオフ政治推定器(UnO)への第一歩を踏み出す
我々は, 平均, 分散, 分位数/中間数, 分位数範囲, cvar, および累積分布全体の推定と同時結合に uno を用いる。
論文 参考訳(メタデータ) (2021-04-26T18:54:31Z) - Neural Methods for Point-wise Dependency Estimation [129.93860669802046]
我々は,2つの結果が共起する確率を定量的に測定する点依存度(PD)の推定に焦点をあてる。
提案手法の有効性を,1)MI推定,2)自己教師付き表現学習,3)クロスモーダル検索タスクで示す。
論文 参考訳(メタデータ) (2020-06-09T23:26:15Z) - Batch Stationary Distribution Estimation [98.18201132095066]
サンプル遷移の組を与えられたエルゴードマルコフ鎖の定常分布を近似する問題を考える。
与えられたデータに対する補正比関数の復元に基づく一貫した推定器を提案する。
論文 参考訳(メタデータ) (2020-03-02T09:10:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。