論文の概要: On the Optimality of Tracking Fisher Information in Adaptive Testing with Stochastic Binary Responses
- arxiv url: http://arxiv.org/abs/2510.07862v1
- Date: Thu, 09 Oct 2025 07:10:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-10 17:54:14.920055
- Title: On the Optimality of Tracking Fisher Information in Adaptive Testing with Stochastic Binary Responses
- Title(参考訳): 確率的二成分反応を用いた適応試験における漁業情報追跡の最適性について
- Authors: Sanghwa Kim, Dohyun Ahn, Seungki Min,
- Abstract要約: 逐次二進応答から連続能力パラメータを推定する問題について検討する。
本稿では,フィッシャー情報を最大化するための質問を適応的に選択する簡単なアルゴリズムを提案する。
我々は,このフィッシャー追跡戦略が,固定信頼と固定予算の双方において最適な性能を達成することを証明した。
- 参考スコア(独自算出の注目度): 3.491999371287298
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study the problem of estimating a continuous ability parameter from sequential binary responses by actively asking questions with varying difficulties, a setting that arises naturally in adaptive testing and online preference learning. Our goal is to certify that the estimate lies within a desired margin of error, using as few queries as possible. We propose a simple algorithm that adaptively selects questions to maximize Fisher information and updates the estimate using a method-of-moments approach, paired with a novel test statistic to decide when the estimate is accurate enough. We prove that this Fisher-tracking strategy achieves optimal performance in both fixed-confidence and fixed-budget regimes, which are commonly invested in the best-arm identification literature. Our analysis overcomes a key technical challenge in the fixed-budget setting -- handling the dependence between the evolving estimate and the query distribution -- by exploiting a structural symmetry in the model and combining large deviation tools with Ville's inequality. Our results provide rigorous theoretical support for simple and efficient adaptive testing procedures.
- Abstract(参考訳): 本研究では,適応テストやオンライン嗜好学習において自然に発生する課題である,様々な難問を積極的に問うことによって,逐次二分反応から連続的能力パラメータを推定する問題について検討する。
私たちのゴールは、可能な限り少ないクエリを使用して、見積もりが所望のエラーの範囲内にあることを証明することです。
そこで本研究では,提案手法を用いてフィッシャー情報を最大化するための質問を適応的に選択し,提案手法を用いて推定値を更新するアルゴリズムを提案する。
我々は,このフィッシャー追跡戦略が,最も優れた識別文献に一般的に投資される固定信頼と固定予算の両体制において,最適な性能を達成することを証明した。
我々の分析は、モデルの構造対称性を利用して、Villeの不等式と大きな偏差ツールを組み合わせることにより、固定予算設定 -- 進化する推定値とクエリ分布の依存性を扱う -- において重要な技術的課題を克服する。
本研究は, 簡便かつ効率的な適応テスト手順に対する厳密な理論的支援を提供する。
関連論文リスト
- Statistical Inference for Misspecified Contextual Bandits [6.178061357164435]
コンテキストバンディットアルゴリズムは、パーソナライズされた治療のためのリアルタイム適応を可能にすることで、近代的な実験を変革した。
しかし、これらの利点は適応性による統計的推測の課題を生み出す。
収束は適応実験の再現性とオンラインアルゴリズムの安定性を保証する。
論文 参考訳(メタデータ) (2025-09-08T02:19:37Z) - Optimal Adaptive Experimental Design for Estimating Treatment Effect [14.088972921434761]
本稿では,治療効果を推定する際の最適精度を決定するための基本的な問題に対処する。
二重ロバストな手法の概念を逐次実験設計に取り入れることで、最適推定問題をオンラインバンディット学習問題としてモデル化する。
本稿では,バンディットアルゴリズム設計と適応統計的推定の両方のツールとアイデアを用いて,一般的な低スイッチング適応実験フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-07T23:22:51Z) - Pattern based learning and optimisation through pricing for bin packing problem [50.83768979636913]
確率変数の分布のような問題条件が変化すると、以前の状況でうまく機能するパターンはより効果的になるかもしれないと論じる。
本研究では,パターンを効率的に同定し,各条件に対する値の動的定量化を行う新しい手法を提案する。
本手法は,制約を満たす能力と目的値に対する影響に基づいて,パターンの値の定量化を行う。
論文 参考訳(メタデータ) (2024-08-27T17:03:48Z) - Optimal Baseline Corrections for Off-Policy Contextual Bandits [61.740094604552475]
オンライン報酬指標の偏りのないオフライン推定を最適化する意思決定ポリシーを学習することを目指している。
学習シナリオにおける同値性に基づく単一のフレームワークを提案する。
我々のフレームワークは、分散最適非バイアス推定器の特徴付けを可能にし、それに対する閉形式解を提供する。
論文 参考訳(メタデータ) (2024-05-09T12:52:22Z) - Globally-Optimal Greedy Experiment Selection for Active Sequential
Estimation [1.1530723302736279]
逐次的に収集したデータの実験を適応的に選択するアクティブシーケンシャル推定の問題について検討する。
目標は、より正確なモデル推定のための実験選択ルールを設計することである。
そこで本稿では,グリーディ実験の選択手法のクラスを提案し,最大可能性の統計的解析を行う。
論文 参考訳(メタデータ) (2024-02-13T17:09:29Z) - Likelihood Ratio Confidence Sets for Sequential Decision Making [51.66638486226482]
確率に基づく推論の原理を再検討し、確率比を用いて妥当な信頼シーケンスを構築することを提案する。
本手法は, 精度の高い問題に特に適している。
提案手法は,オンライン凸最適化への接続に光を当てることにより,推定器の最適シーケンスを確実に選択する方法を示す。
論文 参考訳(メタデータ) (2023-11-08T00:10:21Z) - Improving Adaptive Conformal Prediction Using Self-Supervised Learning [72.2614468437919]
我々は、既存の予測モデルの上に自己教師付きプレテキストタスクを持つ補助モデルを訓練し、自己教師付きエラーを付加的な特徴として用いて、非整合性スコアを推定する。
合成データと実データの両方を用いて、効率(幅)、欠陥、共形予測間隔の超過といった付加情報の利点を実証的に実証する。
論文 参考訳(メタデータ) (2023-02-23T18:57:14Z) - Post-Contextual-Bandit Inference [57.88785630755165]
コンテキストバンディットアルゴリズムは、電子商取引、医療、政策立案における非適応的なA/Bテストを置き換える傾向にある。
研究参加者の成果を改善することもでき、良い方針や最良の政策を特定できる可能性を高めることもできる。
研究の終盤における新規介入の信頼性推論を支援するため, 平均治療効果, サブグループ効果, あるいは新政策の価値について, 有効な信頼区間を構築したい。
論文 参考訳(メタデータ) (2021-06-01T12:01:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。