論文の概要: An $(ε,δ)$-accurate level set estimation with a stopping criterion
- arxiv url: http://arxiv.org/abs/2503.20272v1
- Date: Wed, 26 Mar 2025 06:41:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-27 13:22:08.942432
- Title: An $(ε,δ)$-accurate level set estimation with a stopping criterion
- Title(参考訳): 停止基準付き$(ε,δ)$-精度レベルセット推定
- Authors: Hideaki Ishibashi, Kota Matsui, Kentaro Kutsukake, Hideitsu Hino,
- Abstract要約: 本稿では,停止基準を組み込んだレベルセット推定手法を提案する。
提案手法は,既存のアプローチにおける重要なギャップに対処するため,信頼性レベル1-delta$で$epsilon$-accuracyを満足することを示す。
- 参考スコア(独自算出の注目度): 2.5124069610074895
- License:
- Abstract: The level set estimation problem seeks to identify regions within a set of candidate points where an unknown and costly to evaluate function's value exceeds a specified threshold, providing an efficient alternative to exhaustive evaluations of function values. Traditional methods often use sequential optimization strategies to find $\epsilon$-accurate solutions, which permit a margin around the threshold contour but frequently lack effective stopping criteria, leading to excessive exploration and inefficiencies. This paper introduces an acquisition strategy for level set estimation that incorporates a stopping criterion, ensuring the algorithm halts when further exploration is unlikely to yield improvements, thereby reducing unnecessary function evaluations. We theoretically prove that our method satisfies $\epsilon$-accuracy with a confidence level of $1 - \delta$, addressing a key gap in existing approaches. Furthermore, we show that this also leads to guarantees on the lower bounds of performance metrics such as F-score. Numerical experiments demonstrate that the proposed acquisition function achieves comparable precision to existing methods while confirming that the stopping criterion effectively terminates the algorithm once adequate exploration is completed.
- Abstract(参考訳): レベルセット推定問題は、未知かつ高価な関数値が指定された閾値を超えるような候補点の集合内の領域を特定し、関数値の徹底的な評価に代わる効率的な代替手段を提供する。
従来の手法では、$\epsilon$-accurateのソリューションを見つけるためにシーケンシャルな最適化戦略を用いることが多く、しきい値の輪郭付近のマージンを許容するが、効果的な停止基準を欠くことが多く、過剰な探索と非効率をもたらす。
本稿では、停止基準を組み込んだレベルセット推定のための取得戦略を提案し、さらなる探索が改善しない場合にアルゴリズムが停止することを保証し、不要な機能評価を減らす。
提案手法は,既存のアプローチにおける重要なギャップに対処するため,信頼性レベルが1- \delta$で$\epsilon$-accuracyを満たすことを理論的に証明する。
さらに,これはFスコアなどの低域のパフォーマンス指標の保証にも繋がることを示す。
数値実験により,提案手法が既存の手法に匹敵する精度を実現し,適切な探索が完了すると,停止基準がアルゴリズムを効果的に終了することを確認した。
関連論文リスト
- Achieving $\widetilde{\mathcal{O}}(\sqrt{T})$ Regret in Average-Reward POMDPs with Known Observation Models [56.92178753201331]
平均逆無限水平POMDPを未知の遷移モデルで扱う。
この障壁を克服する斬新でシンプルな推定器を提示する。
論文 参考訳(メタデータ) (2025-01-30T22:29:41Z) - Trust-Region Sequential Quadratic Programming for Stochastic Optimization with Random Models [57.52124921268249]
本稿では,1次と2次の両方の定常点を見つけるための信頼逐次準計画法を提案する。
本手法は, 1次定常点に収束するため, 対象対象の近似を最小化して定義された各イテレーションの勾配ステップを計算する。
2階定常点に収束するため,本手法は負曲率を減少するヘッセン行列を探索する固有ステップも計算する。
論文 参考訳(メタデータ) (2024-09-24T04:39:47Z) - Active Learning for Level Set Estimation Using Randomized Straddle Algorithms [18.96269063427081]
本稿では,関数が与えられたしきい値の上(または下)に値を取る入力点の集合を同定する新しい手法を提案する。
提案手法の信頼性パラメータは,反復数や候補点に依存しず,保守的でないという利点がある。
論文 参考訳(メタデータ) (2024-08-06T12:39:12Z) - Sound Heuristic Search Value Iteration for Undiscounted POMDPs with Reachability Objectives [16.101435842520473]
本稿では,POMDPにおける最大到達可能性確率問題(indefinite-horizon)と呼ばれる問題について検討する。
割引問題に対するポイントベース手法の成功に触発され,MRPPへの拡張について検討した。
本稿では,これらの手法の強みを有効活用し,信念空間を効率的に探索するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-05T02:33:50Z) - Active Level Set Estimation for Continuous Search Space with Theoretical
Guarantee [10.609848119555975]
本稿では,離散化を必要とせず,連続的な探索空間で直接動作する新しいアルゴリズムを提案する。
提案手法は,与えられた閾値よりも高いあるいは低い関数の信頼度尺度として定義される獲得関数を構築することによって,ポイントを提案する。
複数の合成および実世界のデータセットにおいて、我々のアルゴリズムは最先端の手法より優れている。
論文 参考訳(メタデータ) (2024-02-26T01:46:56Z) - Information-Theoretic Safe Bayesian Optimization [59.758009422067005]
そこでは、未知の(安全でない)制約に反するパラメータを評価することなく、未知の関数を最適化することを目的としている。
現在のほとんどのメソッドはドメインの離散化に依存しており、連続ケースに直接拡張することはできない。
本稿では,GP後部を直接利用して,最も情報に富む安全なパラメータを識別する情報理論的安全な探索基準を提案する。
論文 参考訳(メタデータ) (2024-02-23T14:31:10Z) - Maximum-Likelihood Inverse Reinforcement Learning with Finite-Time
Guarantees [56.848265937921354]
逆強化学習(IRL)は報酬関数と関連する最適ポリシーを回復することを目的としている。
IRLの多くのアルゴリズムは本質的にネスト構造を持つ。
我々は、報酬推定精度を損なわないIRLのための新しいシングルループアルゴリズムを開発した。
論文 参考訳(メタデータ) (2022-10-04T17:13:45Z) - Budgeted Classification with Rejection: An Evolutionary Method with
Multiple Objectives [0.0]
予算付きシーケンシャル分類器(BSC)プロセスは、部分的特徴取得と評価ステップのシーケンスを通じて入力を行う。
これにより、不要な特徴取得を防止するための入力の効率的な評価が可能になる。
本稿では,信頼度に基づく拒否オプション付き逐次分類器を構築するための問題固有遺伝的アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-05-01T22:05:16Z) - Off-Policy Interval Estimation with Lipschitz Value Iteration [29.232245317776723]
一般の連続した環境下での政治外評価のための区間境界を求めるための正当な手法を提案する。
リプシッツ値の反復法を導入し、単調に間隔を縮める。
論文 参考訳(メタデータ) (2020-10-29T07:25:56Z) - CoinDICE: Off-Policy Confidence Interval Estimation [107.86876722777535]
強化学習における高信頼行動非依存のオフ政治評価について検討する。
様々なベンチマークにおいて、信頼区間推定が既存の手法よりも厳密で精度が高いことが示されている。
論文 参考訳(メタデータ) (2020-10-22T12:39:11Z) - Provably Efficient Safe Exploration via Primal-Dual Policy Optimization [105.7510838453122]
制約付きマルコフ決定過程(CMDP)を用いた安全強化学習(SRL)問題について検討する。
本稿では,関数近似設定において,安全な探索を行うCMDPの効率の良いオンラインポリシー最適化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-03-01T17:47:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。