論文の概要: The Good, the Bad, and the Sampled: a No-Regret Approach to Safe Online Classification
- arxiv url: http://arxiv.org/abs/2510.01020v1
- Date: Wed, 01 Oct 2025 15:28:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:20.640274
- Title: The Good, the Bad, and the Sampled: a No-Regret Approach to Safe Online Classification
- Title(参考訳): The Good, the Bad, and the Smpled: a No-Regret Approach to Safe Online Classification
- Authors: Tavor Z. Baharav, Spyros Dragazis, Aldo Pacchiano,
- Abstract要約: 本研究は, リスクが未知のロジスティックモデルによって管理される2次性疾患の結果に対して, 個人を順次検査する問題について考察する。
我々のゴールは、必要となるコストのかかるテストの総数を最小限に抑えながら、誤分類のごく一部が予め特定されたエラー耐性を超えないことを保証することです。
これにより、エラー制約のあるロジスティックテストに対する最初のノンレグレット保証が確立され、コストセンシティブな医療スクリーニングに直接適用される。
- 参考スコア(独自算出の注目度): 25.36548531839979
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the problem of sequentially testing individuals for a binary disease outcome whose true risk is governed by an unknown logistic model. At each round, a patient arrives with feature vector $x_t$, and the decision maker may either pay to administer a (noiseless) diagnostic test--revealing the true label--or skip testing and predict the patient's disease status based on their feature vector and prior history. Our goal is to minimize the total number of costly tests required while guaranteeing that the fraction of misclassifications does not exceed a prespecified error tolerance $\alpha$, with probability at least $1-\delta$. To address this, we develop a novel algorithm that interleaves label-collection and distribution estimation to estimate both $\theta^{*}$ and the context distribution $P$, and computes a conservative, data-driven threshold $\tau_t$ on the logistic score $|x_t^\top\theta|$ to decide when testing is necessary. We prove that, with probability at least $1-\delta$, our procedure does not exceed the target misclassification rate, and requires only $O(\sqrt{T})$ excess tests compared to the oracle baseline that knows both $\theta^{*}$ and the patient feature distribution $P$. This establishes the first no-regret guarantees for error-constrained logistic testing, with direct applications to cost-sensitive medical screening. Simulations corroborate our theoretical guarantees, showing that in practice our procedure efficiently estimates $\theta^{*}$ while retaining safety guarantees, and does not require too many excess tests.
- Abstract(参考訳): 本研究は, リスクが未知のロジスティックモデルによって制御される2次性疾患の結果に対して, 個人を順次検査する問題について考察する。
各ラウンドで、患者は特徴ベクトル$x_t$で到着し、意思決定者は、真のラベルを検索する(ノイズのない)診断テストを行うために支払うか、または、その特徴ベクトルと過去の履歴に基づいて、患者の病気状態を予測する。
我々のゴールは、必要となる費用のかかるテストの総数を最小限に抑えながら、誤分類のごく一部が予め規定されたエラー許容値を超えることはないことを保証し、少なくとも1-\delta$の確率を持つようにすることである。
これを解決するために,ラベルの集合と分布推定をインターリーブして$\theta^{*}$と$P$の両方を推定し,ロジスティックスコア$|x_t^\top\theta|$で保守的でデータ駆動のしきい値$\tau_t$を計算し,テストが必要かどうかを決定するアルゴリズムを開発した。
我々は、少なくとも1-\delta$の確率で、我々の手順はターゲットの誤分類率を超えず、$O(\sqrt{T})$過剰なテストのみを必要とすることを証明している。
これにより、エラー制約のあるロジスティックテストに対する最初のノンレグレット保証が確立され、コストセンシティブな医療スクリーニングに直接適用される。
シミュレーションは我々の理論的保証と相関し、実際には我々の手順は安全保証を維持しながら効率的に$\theta^{*}$を推定し、過剰なテストは不要であることを示す。
関連論文リスト
- Active Subsampling for Measurement-Constrained M-Estimation of Individualized Thresholds with High-Dimensional Data [3.1138411427556445]
測定制約のある問題では、大きなデータセットが利用可能であるにもかかわらず、大きなデータセットのごく一部でラベルを観測するのに手頃な価格にしかならない。
このことは、どのデータポイントが予算制約のあるラベルに最も有益であるかという重要な疑問を引き起こします。
本稿では,測定制約付きM推定フレームワークにおける最適個別化しきい値の推定に焦点をあてる。
論文 参考訳(メタデータ) (2024-11-21T00:21:17Z) - Doubly Robust Conditional Independence Testing with Generative Neural Networks [8.323172773256449]
本稿では、第3の確率ベクトル$Z$を与えられた2つのジェネリックランダムベクトル$X$と$Y$の条件独立性をテストする問題に対処する。
条件分布を明示的に推定しない新しい非パラメトリック試験法を提案する。
論文 参考訳(メタデータ) (2024-07-25T01:28:59Z) - Testing the Feasibility of Linear Programs with Bandit Feedback [53.40256244941895]
我々は,低回帰アルゴリズムと反復対数の漸近法則に基づくテストを開発する。
このテストが信頼できることを証明し、信号レベルに適応する'$Gamma,$ of any instance。
信頼性テストのサンプルコストに対して、最小限の$(Omegad/Gamma2)$で補う。
論文 参考訳(メタデータ) (2024-06-21T20:56:35Z) - Collaborative non-parametric two-sample testing [55.98760097296213]
目標は、null仮説の$p_v = q_v$が拒否されるノードを特定することである。
グラフ構造を効率的に活用する非パラメトリックコラボレーティブ2サンプルテスト(CTST)フレームワークを提案する。
提案手法は,f-divergence Estimation, Kernel Methods, Multitask Learningなどの要素を統合する。
論文 参考訳(メタデータ) (2024-02-08T14:43:56Z) - A Priori Determination of the Pretest Probability [0.0]
本稿では,ロジスティック回帰モデルからロジット関数を用いて,疾患の先行確率,先行確率を推定する新しい手法を提案する。
兆候や症状を呈する患者では、事前の確率の最小値である$phi$を、次のように近似することができる。 $phi approx frac15lnleft[styleprod_theta=1ikappa_thetaright]$ where $ln$ is the natural, $kappa_theta$ is the chance ratio with the associated。
論文 参考訳(メタデータ) (2024-01-08T18:44:43Z) - Towards Optimal Statistical Watermarking [95.46650092476372]
仮説テスト問題として定式化して統計的透かしを研究する。
我々の定式化の鍵は、出力トークンと拒絶領域の結合である。
一般仮説テスト設定において,UMP(Uniformly Most Powerful)の透かしを特徴付ける。
論文 参考訳(メタデータ) (2023-12-13T06:57:00Z) - Cost-aware Generalized $\alpha$-investing for Multiple Hypothesis
Testing [5.521213530218833]
非自明なデータ収集コストを伴う逐次多重仮説テストの問題点を考察する。
この問題は、病気の過程の異なる発現遺伝子を識別するための生物学的実験を行うときに発生する。
我々は,$alpha$-wealthの長期的挙動を理論的に分析し,$alpha$-investing決定規則のサンプルサイズを考慮した。
論文 参考訳(メタデータ) (2022-10-31T17:39:32Z) - Noisy Adaptive Group Testing using Bayesian Sequential Experimental
Design [63.48989885374238]
病気の感染頻度が低い場合、Dorfman氏は80年前に、人のテストグループは個人でテストするよりも効率が良いことを示した。
本研究の目的は,ノイズの多い環境で動作可能な新しいグループテストアルゴリズムを提案することである。
論文 参考訳(メタデータ) (2020-04-26T23:41:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。