論文の概要: Bounded P-values in Parametric Programming-based Selective Inference
- arxiv url: http://arxiv.org/abs/2307.11351v2
- Date: Thu, 28 Dec 2023 08:13:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-29 22:36:10.520104
- Title: Bounded P-values in Parametric Programming-based Selective Inference
- Title(参考訳): パラメトリックプログラミングに基づく選択推論における境界P値
- Authors: Tomohiro Shiraishi, Daiki Miwa, Vo Nguyen Le Duy, Ichiro Takeuchi
- Abstract要約: 我々は,p-値の下と上の境界を計算する手法を提案することにより,所望の精度を確保しつつ計算コストを削減する手法を提案する。
本稿では,線形モデルにおける特徴選択と深部ニューラルネットワークにおける注目領域同定のための仮説テスト問題における提案手法の有効性を示す。
- 参考スコア(独自算出の注目度): 23.35466397627952
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Selective inference (SI) has been actively studied as a promising framework
for statistical hypothesis testing for data-driven hypotheses. The basic idea
of SI is to make inferences conditional on an event that a hypothesis is
selected. In order to perform SI, this event must be characterized in a
traceable form. When selection event is too difficult to characterize,
additional conditions are introduced for tractability. This additional
conditions often causes the loss of power, and this issue is referred to as
over-conditioning in [Fithian et al., 2014]. Parametric programming-based SI
(PP-based SI) has been proposed as one way to address the over-conditioning
issue. The main problem of PP-based SI is its high computational cost due to
the need to exhaustively explore the data space. In this study, we introduce a
procedure to reduce the computational cost while guaranteeing the desired
precision, by proposing a method to compute the lower and upper bounds of
p-values. We also proposed three types of search strategies that efficiently
improve these bounds. We demonstrate the effectiveness of the proposed method
in hypothesis testing problems for feature selection in linear models and
attention region identification in deep neural networks.
- Abstract(参考訳): 選択的推論(si)は、データ駆動仮説に対する統計的仮説検証の有望な枠組みとして積極的に研究されてきた。
SIの基本的な考え方は、仮説が選択された事象に推論を条件付けることである。
SIを実行するには、このイベントをトレース可能な形で特徴付ける必要がある。
選択イベントの特徴付けが難しい場合には、トラクタビリティのために追加条件を導入する。
この追加条件はしばしば電力損失を引き起こし、この問題は[Fithian et al., 2014]においてオーバーコンディショニング(over-conditioning)と呼ばれる。
オーバーコンディショニング問題に対処する手段として、パラメトリックプログラミングベースのSI(PPベースのSI)が提案されている。
PPベースのSIの主な問題は、データ空間を徹底的に探索する必要があるため、計算コストが高いことである。
本研究では, p値の下限と上限を計算する手法を提案することにより, 所望の精度を確保しつつ計算コストを削減する手法を提案する。
また,これらの境界を効率的に改善する3種類の探索戦略も提案した。
本稿では,線形モデルにおける特徴選択問題と深層ニューラルネットワークにおける注意領域同定における提案手法の有効性を示す。
関連論文リスト
- Optimal Multi-Distribution Learning [88.3008613028333]
マルチディストリビューション学習は、$k$の異なるデータ分散における最悪のリスクを最小限に抑える共有モデルを学ぶことを目指している。
本稿では, (d+k)/varepsilon2の順に, サンプルの複雑さを伴って, ヴァレプシロン最適ランダム化仮説を導出するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-12-08T16:06:29Z) - Calibrating Neural Simulation-Based Inference with Differentiable
Coverage Probability [50.44439018155837]
ニューラルモデルのトレーニング目的に直接キャリブレーション項を含めることを提案する。
古典的なキャリブレーション誤差の定式化を緩和することにより、エンドツーエンドのバックプロパゲーションを可能にする。
既存の計算パイプラインに直接適用でき、信頼性の高いブラックボックス後部推論が可能である。
論文 参考訳(メタデータ) (2023-10-20T10:20:45Z) - Sub-linear Regret in Adaptive Model Predictive Control [56.705978425244496]
本稿では,STT-MPC (Self-Tuning tube-based Model Predictive Control) について述べる。
システム力学を最初に認識したアルゴリズムと比較して,アルゴリズムの後悔を解析する。
論文 参考訳(メタデータ) (2023-10-07T15:07:10Z) - Bounding Counterfactuals under Selection Bias [60.55840896782637]
本稿では,識別不能なクエリと識別不能なクエリの両方に対処するアルゴリズムを提案する。
選択バイアスによって引き起こされる欠如にもかかわらず、利用可能なデータの可能性は無限であることを示す。
論文 参考訳(メタデータ) (2022-07-26T10:33:10Z) - Self-Certifying Classification by Linearized Deep Assignment [65.0100925582087]
そこで我々は,PAC-Bayesリスク認定パラダイム内で,グラフ上のメトリックデータを分類するための新しい深層予測器のクラスを提案する。
PAC-Bayesの最近の文献とデータに依存した先行研究に基づいて、この手法は仮説空間上の後続分布の学習を可能にする。
論文 参考訳(メタデータ) (2022-01-26T19:59:14Z) - More Powerful Conditional Selective Inference for Generalized Lasso by
Parametric Programming [20.309302270008146]
条件付き選択的推論(si)は、データ駆動仮説の新しい統計推論フレームワークとして研究されてきた。
二次パラメトリックプログラミングに変換可能な問題のクラスに対して,より強力で一般的な条件付きSI法を提案する。
論文 参考訳(メタデータ) (2021-05-11T10:12:00Z) - More Powerful and General Selective Inference for Stepwise Feature
Selection using the Homotopy Continuation Approach [17.191349670354228]
データ駆動仮説のための新しい統計的推論フレームワークとして,条件選択推論(SI)が活発に研究されている。
既存の条件付きSI法の主な制限は、過条件による電力損失である。
我々は,この制限を克服するホモトピー法を用いて,SFSのより強力で汎用的な条件付きSI法を開発した。
論文 参考訳(メタデータ) (2020-12-25T09:01:45Z) - Quantifying Statistical Significance of Neural Network-based Image
Segmentation by Selective Inference [23.97765106673937]
我々は条件選択推論(SI)フレームワークを用いて、セグメンテーション結果の正確な(漸近的でない)p-値を計算する。
提案手法は, 偽陽性率の制御に成功し, 計算効率も良好であり, 医用画像データに適用した場合の良好な結果が得られる。
論文 参考訳(メタデータ) (2020-10-05T07:16:40Z) - Pre-training Is (Almost) All You Need: An Application to Commonsense
Reasoning [61.32992639292889]
事前学習されたトランスモデルの微調整は、一般的なNLPタスクを解決するための標準的なアプローチとなっている。
そこで本研究では,可視性ランキングタスクをフルテキスト形式でキャストする新たなスコアリング手法を提案する。
提案手法は, ランダム再起動にまたがって, より安定した学習段階を提供することを示す。
論文 参考訳(メタデータ) (2020-04-29T10:54:40Z) - Parametric Programming Approach for More Powerful and General Lasso
Selective Inference [25.02674598600182]
選択推論(Selective Inference, SI)は, 線形モデルの特徴を推論するためにここ数年, 活発に研究されてきた。
Lasso のオリジナルの SI アプローチの主な制限は、推論が選択された特徴だけでなく、その兆候にも条件付きで行われることである。
何千ものアクティブな特徴がある場合でも,サインを条件付けせずにSIを実行できるパラメトリックプログラミングベースの手法を提案する。
論文 参考訳(メタデータ) (2020-04-21T04:46:29Z) - Computing Valid p-value for Optimal Changepoint by Selective Inference
using Dynamic Programming [21.361641617994714]
変化点(CP)の意義を統計的に推測する新しい手法を提案する。
選択的推論(SI)フレームワークに基づき、CPの意義をテストするための有効なp値を計算するための正確な(漸近的でない)アプローチを提案する。
合成と実世界の両方のデータセットで実験を行い、提案手法が既存の手法よりも強力であることを示す。
論文 参考訳(メタデータ) (2020-02-21T05:07:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。