論文の概要: Exact Minimum-Volume Confidence Set Intersection for Multinomial Outcomes
- arxiv url: http://arxiv.org/abs/2601.18145v1
- Date: Mon, 26 Jan 2026 05:07:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-27 15:23:08.682041
- Title: Exact Minimum-Volume Confidence Set Intersection for Multinomial Outcomes
- Title(参考訳): 多項出力のための厳密な最小値信頼セット切断
- Authors: Heguang Lin, Binhao Chen, Mengze Li, Daniel Pimentel-Alarcón, Matthew L. Malloy,
- Abstract要約: 2つの観察結果が与えられたら、MVCが相互に交わるかどうかを証明できますか?
本稿では,この交差点問題に対する耐久性を考慮したアルゴリズムを提案する。
3つのカテゴリにおいて、このアルゴリズムは、交差点を証明し、不整合を証明し、決定が所定のマージン内にあるときに不確定結果を返す、効率的で証明可能な健全なアルゴリズムをもたらす。
- 参考スコア(独自算出の注目度): 3.6235880175190296
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Computation of confidence sets is central to data science and machine learning, serving as the workhorse of A/B testing and underpinning the operation and analysis of reinforcement learning algorithms. Among all valid confidence sets for the multinomial parameter, minimum-volume confidence sets (MVCs) are optimal in that they minimize average volume, but they are defined as level sets of an exact p-value that is discontinuous and difficult to compute. Rather than attempting to characterize the geometry of MVCs directly, this paper studies a practically motivated decision problem: given two observed multinomial outcomes, can one certify whether their MVCs intersect? We present a certified, tolerance-aware algorithm for this intersection problem. The method exploits the fact that likelihood ordering induces halfspace constraints in log-odds coordinates, enabling adaptive geometric partitioning of parameter space and computable lower and upper bounds on p-values over each cell. For three categories, this yields an efficient and provably sound algorithm that either certifies intersection, certifies disjointness, or returns an indeterminate result when the decision lies within a prescribed margin. We further show how the approach extends to higher dimensions. The results demonstrate that, despite their irregular geometry, MVCs admit reliable certified decision procedures for core tasks in A/B testing.
- Abstract(参考訳): 信頼セットの計算は、データサイエンスと機械学習の中心であり、A/Bテストのワークホースとして機能し、強化学習アルゴリズムの操作と分析の基盤となっている。
多項パラメータに対する有効な信頼集合のうち、最小体積信頼集合(MVC)は平均体積を最小にすることが最適であるが、それらは不連続で計算が難しい正確なp値のレベル集合として定義される。
この論文は、MVCの幾何学を直接特徴づけるのではなく、実際に動機付けられた決定問題を研究する: 2つの観察された多重項結果を考えると、MVCが相互に交わるかどうかを証明できますか?
本稿では,この交差点問題に対する耐久性を考慮したアルゴリズムを提案する。
この手法は、確率順序付けが対数座標における半空間制約を誘導し、パラメータ空間の適応的な幾何分割と、各セル上の p-値上の計算可能な下および上の境界を可能にするという事実を利用する。
3つのカテゴリにおいて、このアルゴリズムは、交差点を証明し、不整合を証明し、決定が所定のマージン内にあるときに不確定結果を返す、効率的で証明可能な健全なアルゴリズムをもたらす。
さらに、このアプローチがより高次元にどのように拡張されるかを示す。
その結果、MVCは不規則な幾何にもかかわらず、A/Bテストにおけるコアタスクの信頼性の高い決定手順を認めていることがわかった。
関連論文リスト
- Stepwise Reasoning Checkpoint Analysis: A Test Time Scaling Method to Enhance LLMs' Reasoning [81.50681925980135]
本稿では,ステップワイズ推論チェックポイント分析(SRCA)を提案する。
本研究は,(1)中間チェックポイント回答による経路推論をグループ化して品質を確保しつつ多様性を維持するAnswer-Clustered Search,(2)最終決定にすべての中間回答を活用するCheckpoint Candidate Augmentationの2つの主要な戦略を取り入れた。
提案手法は経路均質化を効果的に低減し,高品質な中間結果を活用することにより耐故障機構を創出する。
論文 参考訳(メタデータ) (2025-05-23T12:42:50Z) - MIBP-Cert: Certified Training against Data Perturbations with Mixed-Integer Bilinear Programs [50.41998220099097]
トレーニング中のデータエラー、汚職、中毒攻撃は、現代のAIシステムの信頼性に大きな脅威をもたらす。
混合整数双線形プログラミング(MIBP)に基づく新しい認証手法MIBP-Certを紹介する。
摂動データや操作データを通じて到達可能なパラメータの集合を計算することで、可能なすべての結果を予測することができ、堅牢性を保証することができる。
論文 参考訳(メタデータ) (2024-12-13T14:56:39Z) - Online POMDP Planning with Anytime Deterministic Optimality Guarantees [13.824288326240927]
近似解と最適解の間の離散POMDPに対する決定論的関係を導出する。
我々の導出は、新しいアルゴリズムセットの道を提供し、既存のアルゴリズムにアタッチできることを示します。
論文 参考訳(メタデータ) (2023-10-03T04:40:38Z) - General Cutting Planes for Bound-Propagation-Based Neural Network
Verification [144.7290035694459]
任意の切削平面制約を加えることができるような境界伝搬手順を一般化する。
MIPソルバは、境界プロパゲーションベースの検証器を強化するために高品質な切削面を生成することができる。
本手法は,oval20ベンチマークを完全解き,oval21ベンチマークの2倍のインスタンスを検証できる最初の検証器である。
論文 参考訳(メタデータ) (2022-08-11T10:31:28Z) - Geometry of the Minimum Volume Confidence Sets [0.6882042556551609]
本稿では,多項パラメータに対する最小体積信頼集合の幾何について検討する。
より標準的な信頼セットと境界と近似に基づく間隔の代わりに使用される場合、学習アルゴリズムは複雑さの向上を示すことができる。
論文 参考訳(メタデータ) (2022-02-16T16:36:05Z) - Ensemble Learning based on Classifier Prediction Confidence and
Comprehensive Learning Particle Swarm Optimisation for polyp localisation [6.212408891922064]
大腸癌(crc)は、多くの国で最初の死因である。
本稿では,医療用ポリープセグメンテーションアルゴリズムのアンサンブルを紹介する。
論文 参考訳(メタデータ) (2021-04-10T18:34:42Z) - Hybrid Trilinear and Bilinear Programming for Aligning Partially
Overlapping Point Sets [85.71360365315128]
多くの応用において、部分重なり合う点集合が対応するRPMアルゴリズムに不変であるようなアルゴリズムが必要である。
まず、目的が立方体有界関数であることを示し、次に、三線型および双線型単相変換の凸エンベロープを用いて、その下界を導出する。
次に、変換変数上の分岐のみを効率よく実行するブランチ・アンド・バウンド(BnB)アルゴリズムを開発する。
論文 参考訳(メタデータ) (2021-01-19T04:24:23Z) - Breaking the Sample Size Barrier in Model-Based Reinforcement Learning
with a Generative Model [50.38446482252857]
本稿では、生成モデル(シミュレータ)へのアクセスを想定して、強化学習のサンプル効率について検討する。
最初に$gamma$-discounted infinite-horizon Markov decision process (MDPs) with state space $mathcalS$ and action space $mathcalA$を考える。
対象の精度を考慮すれば,モデルに基づく計画アルゴリズムが最小限のサンプルの複雑さを実現するのに十分であることを示す。
論文 参考訳(メタデータ) (2020-05-26T17:53:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。