論文の概要: Parametric Programming Approach for More Powerful and General Lasso
Selective Inference
- arxiv url: http://arxiv.org/abs/2004.09749v3
- Date: Mon, 22 Feb 2021 13:18:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-11 06:03:14.308348
- Title: Parametric Programming Approach for More Powerful and General Lasso
Selective Inference
- Title(参考訳): より強力で一般的なラッソ選択推論のためのパラメトリックプログラミング手法
- Authors: Vo Nguyen Le Duy, Ichiro Takeuchi
- Abstract要約: 選択推論(Selective Inference, SI)は, 線形モデルの特徴を推論するためにここ数年, 活発に研究されてきた。
Lasso のオリジナルの SI アプローチの主な制限は、推論が選択された特徴だけでなく、その兆候にも条件付きで行われることである。
何千ものアクティブな特徴がある場合でも,サインを条件付けせずにSIを実行できるパラメトリックプログラミングベースの手法を提案する。
- 参考スコア(独自算出の注目度): 25.02674598600182
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Selective Inference (SI) has been actively studied in the past few years for
conducting inference on the features of linear models that are adaptively
selected by feature selection methods such as Lasso. The basic idea of SI is to
make inference conditional on the selection event. Unfortunately, the main
limitation of the original SI approach for Lasso is that the inference is
conducted not only conditional on the selected features but also on their signs
-- this leads to loss of power because of over-conditioning. Although this
limitation can be circumvented by considering the union of such selection
events for all possible combinations of signs, this is only feasible when the
number of selected features is sufficiently small. To address this
computational bottleneck, we propose a parametric programming-based method that
can conduct SI without conditioning on signs even when we have thousands of
active features. The main idea is to compute the continuum path of Lasso
solutions in the direction of a test statistic, and identify the subset of the
data space corresponding to the feature selection event by following the
solution path. The proposed parametric programming-based method not only avoids
the aforementioned computational bottleneck but also improves the performance
and practicality of SI for Lasso in various respects. We conduct several
experiments to demonstrate the effectiveness and efficiency of our proposed
method.
- Abstract(参考訳): 選択推論(Selective Inference, SI)は、近年、Lassoのような特徴選択法によって適応的に選択される線形モデルの特徴を推論するために活発に研究されている。
SIの基本的な考え方は、選択イベントに推論条件を付けることである。
残念なことに、Lassoの元々のSIアプローチの主な制限は、推論が選択された特徴だけでなく、その兆候も条件として実行されることである。
この制限は、すべての可能な記号の組み合わせに対するそのような選択イベントの結合を考慮することで回避できるが、選択された特徴の数が十分小さい場合にのみ実現可能である。
この計算ボトルネックに対処するために,我々は何千ものアクティブな機能がある場合でも符号を条件付けすることなくsiを実行できるパラメトリックプログラミングベースの手法を提案する。
主な考え方は、テスト統計の方向にラッソ解の連続経路を計算し、解経路に従うことによって特徴選択イベントに対応するデータ空間のサブセットを特定することである。
提案手法は, 計算ボトルネックを回避するだけでなく, 様々な面でのlassoのsiの性能と実用性を向上させる。
提案手法の有効性と有効性を示すため,いくつかの実験を行った。
関連論文リスト
- Prompt Optimization with EASE? Efficient Ordering-aware Automated Selection of Exemplars [66.823588073584]
大規模言語モデル(LLM)は、現実世界のアプリケーションで印象的な機能を示している。
これらの卓越した作品の品質は、パフォーマンスに大きな影響を与えます。
既存の方法は、先行注文がパフォーマンスに与える影響を適切に説明できない。
論文 参考訳(メタデータ) (2024-05-25T08:23:05Z) - Efficient Weighting Schemes for Auditing Instant-Runoff Voting Elections [57.67176250198289]
AWAIREは、適応的に重み付けされたテスト統計量であり、本質的には、テストに有効な仮説のセットを「学習」する。
我々は、より広範囲にスキームと設定を検討し、実践のための効率的な選択を特定し、推奨する。
現在のAWAIRE実装の制限は、少数の候補者に限られている。
論文 参考訳(メタデータ) (2024-02-18T10:13:01Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - Bounded P-values in Parametric Programming-based Selective Inference [23.35466397627952]
我々は,p-値の下と上の境界を計算する手法を提案することにより,所望の精度を確保しつつ計算コストを削減する手法を提案する。
本稿では,線形モデルにおける特徴選択と深部ニューラルネットワークにおける注目領域同定のための仮説テスト問題における提案手法の有効性を示す。
論文 参考訳(メタデータ) (2023-07-21T04:55:03Z) - Generalizing Bayesian Optimization with Decision-theoretic Entropies [102.82152945324381]
統計的決定論の研究からシャノンエントロピーの一般化を考える。
まず,このエントロピーの特殊なケースがBO手順でよく用いられる獲得関数に繋がることを示す。
次に、損失に対する選択肢の選択が、どのようにして柔軟な獲得関数の族をもたらすかを示す。
論文 参考訳(メタデータ) (2022-10-04T04:43:58Z) - Black-box Selective Inference via Bootstrapping [5.960626580825523]
条件選択推論は選択イベントの正確な特徴を必要とするが、ラッソのようないくつかの例を除いてしばしば利用できない。
この研究は、選択イベントを推定するための一般的なアプローチを導入し、選択イベントに条件付けされた実行可能な推論を容易にすることで、この問題に対処する。
論文 参考訳(メタデータ) (2022-03-28T05:18:21Z) - Fast Feature Selection with Fairness Constraints [49.142308856826396]
モデル構築における最適特徴の選択に関する基礎的問題について検討する。
この問題は、greedyアルゴリズムの変種を使用しても、大規模なデータセットで計算的に困難である。
適応クエリモデルは,最近提案された非モジュラー関数に対する直交整合探索のより高速なパラダイムに拡張する。
提案アルゴリズムは、適応型クエリモデルにおいて指数関数的に高速な並列実行を実現する。
論文 参考訳(メタデータ) (2022-02-28T12:26:47Z) - More Powerful Conditional Selective Inference for Generalized Lasso by
Parametric Programming [20.309302270008146]
条件付き選択的推論(si)は、データ駆動仮説の新しい統計推論フレームワークとして研究されてきた。
二次パラメトリックプログラミングに変換可能な問題のクラスに対して,より強力で一般的な条件付きSI法を提案する。
論文 参考訳(メタデータ) (2021-05-11T10:12:00Z) - More Powerful and General Selective Inference for Stepwise Feature
Selection using the Homotopy Continuation Approach [17.191349670354228]
データ駆動仮説のための新しい統計的推論フレームワークとして,条件選択推論(SI)が活発に研究されている。
既存の条件付きSI法の主な制限は、過条件による電力損失である。
我々は,この制限を克服するホモトピー法を用いて,SFSのより強力で汎用的な条件付きSI法を開発した。
論文 参考訳(メタデータ) (2020-12-25T09:01:45Z) - Post-selection inference with HSIC-Lasso [19.928884107444908]
本稿では,多面体補題と混在するガウスの枠組みを用いた選択的推論手法を提案する。
次に,計算コストの低いアルゴリズムを開発し,正規化パラメータの選択を行う。
提案手法の性能は, 実世界のデータベース実験と実世界のデータベース実験の両方で説明され, サンプルサイズが小さい場合でも, タイプI誤差の厳密な制御を強調した。
論文 参考訳(メタデータ) (2020-10-29T15:10:21Z) - Adaptive Sampling for Best Policy Identification in Markov Decision
Processes [79.4957965474334]
本稿では,学習者が生成モデルにアクセスできる場合の,割引マルコフ決定(MDP)における最良の政治的識別の問題について検討する。
最先端アルゴリズムの利点を論じ、解説する。
論文 参考訳(メタデータ) (2020-09-28T15:22:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。