論文の概要: Decision-Focused Evaluation: Analyzing Performance of Deployed Restless
Multi-Arm Bandits
- arxiv url: http://arxiv.org/abs/2301.07835v1
- Date: Thu, 19 Jan 2023 01:04:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-20 15:52:13.933486
- Title: Decision-Focused Evaluation: Analyzing Performance of Deployed Restless
Multi-Arm Bandits
- Title(参考訳): 決定に焦点をあてた評価:展開レスマルチアームバンドの性能解析
- Authors: Paritosh Verma, Shresth Verma, Aditya Mate, Aparna Taneja, Milind
Tambe
- Abstract要約: Restless Multi-arm bandits (RMAB) は、現実世界のシーケンシャルな意思決定問題をモデル化するための一般的な決定理論フレームワークである。
この研究は、公共衛生領域におけるRMABシステムの第一種デプロイの結果を提供し、分析する。
- 参考スコア(独自算出の注目度): 28.337155169135944
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Restless multi-arm bandits (RMABs) is a popular decision-theoretic framework
that has been used to model real-world sequential decision making problems in
public health, wildlife conservation, communication systems, and beyond.
Deployed RMAB systems typically operate in two stages: the first predicts the
unknown parameters defining the RMAB instance, and the second employs an
optimization algorithm to solve the constructed RMAB instance.
In this work we provide and analyze the results from a first-of-its-kind
deployment of an RMAB system in public health domain, aimed at improving
maternal and child health. Our analysis is focused towards understanding the
relationship between prediction accuracy and overall performance of deployed
RMAB systems. This is crucial for determining the value of investing in
improving predictive accuracy towards improving the final system performance,
and is useful for diagnosing, monitoring deployed RMAB systems.
Using real-world data from our deployed RMAB system, we demonstrate that an
improvement in overall prediction accuracy may even be accompanied by a
degradation in the performance of RMAB system -- a broad investment of
resources to improve overall prediction accuracy may not yield expected
results. Following this, we develop decision-focused evaluation metrics to
evaluate the predictive component and show that it is better at explaining
(both empirically and theoretically) the overall performance of a deployed RMAB
system.
- Abstract(参考訳): レストレス・マルチアーム・バンディット(RMAB)は、公衆衛生、野生生物保護、通信システムなどにおける現実のシーケンシャルな意思決定問題をモデル化するための一般的な意思決定理論フレームワークである。
1つは未知のパラメータを予測し、もう1つは RMAB インスタンスを定義する最適化アルゴリズムを用いて構築された RMAB インスタンスを解く。
本研究は,母子保健を改善することを目的とした,公衆衛生領域におけるrmabシステムの初歩的な展開の結果を提示し,分析する。
本分析は, RMABシステムにおける予測精度と全体的な性能の関係について考察する。
これは最終システム性能を改善するための予測精度向上に投資する価値を決定するのに不可欠であり、デプロイされたrmabシステムの診断、監視に有用である。
本研究では, RMABシステムによる実世界のデータを用いて, 総合予測精度の向上は, RMABシステムの性能低下に伴う可能性もあることを実証する。
次に、予測成分の評価に焦点を絞った評価指標を開発し、RMABシステム全体の性能を説明する(実証的および理論的に)のが優れていることを示す。
関連論文リスト
- Provable Risk-Sensitive Distributional Reinforcement Learning with
General Function Approximation [54.61816424792866]
本稿では,リスク感性分布強化学習(RS-DisRL)と静的リプシッツリスク対策(LRM),一般関数近似について紹介する。
モデルに基づく関数近似のためのモデルベース戦略であるtextttRS-DisRL-M と、一般値関数近似のためのモデルフリーアプローチである textttRS-DisRL-V の2つの革新的なメタアルゴリズムを設計する。
論文 参考訳(メタデータ) (2024-02-28T08:43:18Z) - New Epochs in AI Supervision: Design and Implementation of an Autonomous
Radiology AI Monitoring System [5.50085484902146]
本稿では,放射線学AI分類モデルの性能を実際に監視するための新しい手法を提案する。
予測分散と時間安定性という2つの指標を提案し、AIのパフォーマンス変化のプリエンプティブアラートに使用する。
論文 参考訳(メタデータ) (2023-11-24T06:29:04Z) - Unsupervised Quality Prediction for Improved Single-Frame and Weighted
Sequential Visual Place Recognition [20.737660223671003]
位置推定の質を予測できる新しい,トレーニング不要な手法を提案する。
これらの予測はシーケンスマッチングプロセスに偏りを生じさせ、さらなるパフォーマンス向上をもたらす。
我々のシステムは軽量であり、リアルタイムに動作しており、基礎となるVPR技術に非依存である。
論文 参考訳(メタデータ) (2023-07-04T03:53:05Z) - Provably Efficient UCB-type Algorithms For Learning Predictive State
Representations [55.00359893021461]
逐次決定問題は、予測状態表現(PSR)によってモデル化された低ランク構造が認められる場合、統計的に学習可能である
本稿では,推定モデルと実モデル間の全変動距離を上限とする新しいボーナス項を特徴とする,PSRに対する最初のUCB型アプローチを提案する。
PSRに対する既存のアプローチとは対照的に、UCB型アルゴリズムは計算的トラクタビリティ、最優先の準最適ポリシー、モデルの精度が保証される。
論文 参考訳(メタデータ) (2023-07-01T18:35:21Z) - GEC: A Unified Framework for Interactive Decision Making in MDP, POMDP,
and Beyond [101.5329678997916]
対話型意思決定の一般的な枠組みの下で, サンプル高能率強化学習(RL)について検討した。
本稿では,探索とエクスプロイトの基本的なトレードオフを特徴付ける,新しい複雑性尺度である一般化エルダー係数(GEC)を提案する。
低 GEC の RL 問題は非常にリッチなクラスであり、これは低ベルマン楕円体次元問題、双線型クラス、低証人ランク問題、PO-双線型クラス、一般化正規PSR を仮定する。
論文 参考訳(メタデータ) (2022-11-03T16:42:40Z) - Rectified Max-Value Entropy Search for Bayesian Optimization [54.26984662139516]
我々は、相互情報の概念に基づいて、修正されたMES取得関数を開発する。
その結果、RMESは、いくつかの合成関数ベンチマークと実世界の最適化問題において、MESよりも一貫した改善を示している。
論文 参考訳(メタデータ) (2022-02-28T08:11:02Z) - Understanding the Effects of Adversarial Personalized Ranking
Optimization Method on Recommendation Quality [6.197934754799158]
ベイズパーソナライズランキング(BPR)とAPR最適化フレームワークの学習特性をモデル化する。
APRがBPRよりも人気バイアスを増大させるのは、ショートヘッドアイテムからの肯定的な更新が不均衡に多いためである。
論文 参考訳(メタデータ) (2021-07-29T10:22:20Z) - On the Practicality of Deterministic Epistemic Uncertainty [106.06571981780591]
決定論的不確実性法(DUM)は,分布外データの検出において高い性能を達成する。
DUMが十分に校正されており、現実のアプリケーションにシームレスにスケールできるかどうかは不明だ。
論文 参考訳(メタデータ) (2021-07-01T17:59:07Z) - Autoregressive Hidden Markov Models with partial knowledge on latent
space applied to aero-engines prognostics [2.179313476241343]
本稿では,ARPHMM(Auto Regressive Partially-hidden Markov Model)を用いて,センサデータに基づく機器の故障検出と予後予測を行う。
健康指標に基づいて,このモデルを用いて残りの生活を推定する方法を示す。
論文 参考訳(メタデータ) (2021-05-01T10:23:22Z) - An Adversarial Domain Separation Framework for Septic Shock Early
Prediction Across EHR Systems [7.058760708627898]
本稿では,異なる医療システムから収集したEHRの2つのカテゴリの相違に対処する汎用ドメイン適応(DA)フレームワークを提案する。
本研究は,米国における異なる医療システムから得られた2つの現実的 EHR を用いて,極めて困難な症状である敗血症性ショックの早期診断のための枠組みを評価する。
論文 参考訳(メタデータ) (2020-10-26T23:41:33Z) - An Uncertainty-based Human-in-the-loop System for Industrial Tool Wear
Analysis [68.8204255655161]
人間のループシステムにおけるモンテカルロのドロップアウトに基づく不確実性対策により,システムの透明性と性能が向上することを示す。
シミュレーション研究により、不確実性に基づく「ループ内人間システム」は、様々なレベルの人間の関与に対する性能を高めることが示されている。
論文 参考訳(メタデータ) (2020-07-14T15:47:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。