論文の概要: Information criteria for structured parameter selection in high
dimensional tree and graph models
- arxiv url: http://arxiv.org/abs/2306.14026v1
- Date: Sat, 24 Jun 2023 17:40:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-27 17:29:35.892200
- Title: Information criteria for structured parameter selection in high
dimensional tree and graph models
- Title(参考訳): 高次元木およびグラフモデルにおける構造化パラメータ選択の情報基準
- Authors: Maarten Jansen
- Abstract要約: 本報告では, 縮小しない推定器を用いて, 偽陽性と偽陰性とを慎重にバランスさせ, 精査した情報基準について検討する。
特に,木や図形モデルにおける構造化選択に対するMallowsのCp基準を補正した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Parameter selection in high-dimensional models is typically finetuned in a
way that keeps the (relative) number of false positives under control. This is
because otherwise the few true positives may be dominated by the many possible
false positives. This happens, for instance, when the selection follows from a
naive optimisation of an information criterion, such as AIC or Mallows's Cp. It
can be argued that the overestimation of the selection comes from the
optimisation process itself changing the statistics of the selected variables,
in a way that the information criterion no longer reflects the true divergence
between the selection and the data generating process. In lasso, the
overestimation can also be linked to the shrinkage estimator, which makes the
selection too tolerant of false positive selections. For these reasons, this
paper works on refined information criteria, carefully balancing false
positives and false negatives, for use with estimators without shrinkage. In
particular, the paper develops corrected Mallows's Cp criteria for structured
selection in trees and graphical models.
- Abstract(参考訳): 高次元モデルのパラメータ選択は通常、(相対的な)偽陽性数の数を制御下におく方法で微調整される。
これは、そうでなければ、少数の真の正が多くの偽陽性によって支配される可能性があるためである。
これは例えば、aic や mallows の cp のような情報基準のナイーブな最適化から選択が導かれるときに起こる。
選択の過大評価は、情報基準が選択とデータ生成プロセスの間の真の分岐を反映しないような方法で、選択された変数の統計を変化させる最適化プロセス自体から生じていると主張することができる。
ラッソでは、過大評価は縮小推定子に関連付けることができ、その結果選択は偽の正の選択に寛容すぎる。
これらの理由から,本論文では,縮小を伴わない推定器で使用するために,偽陽性と偽陰性を慎重にバランスをとる,洗練された情報基準について検討する。
特に,木や図形モデルにおける構造化選択に対するMallowsのCp基準を補正した。
関連論文リスト
- Cost-sensitive Feature Selection for Support Vector Machines [1.743685428161914]
本稿では,最も一般的な分類手法の一つであるSupport Vector Machinesに組込み,数学的最適化に基づく特徴選択手法を提案する。
また, 偽陰性率と偽陰性率とのトレードオフが望まれる一方で, 特徴量を大幅に減少することを示す。
論文 参考訳(メタデータ) (2024-01-15T12:07:52Z) - Self-Evaluation Improves Selective Generation in Large Language Models [54.003992911447696]
オープンエンド生成タスクをトークンレベルの予測タスクに再構成する。
我々はLSMに答えを自己評価するように指示する。
自己評価に基づくスコアリング手法をベンチマークする。
論文 参考訳(メタデータ) (2023-12-14T19:09:22Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - Large Language Models Are Not Robust Multiple Choice Selectors [117.72712117510953]
複数選択質問(MCQ)は、大規模言語モデル(LLM)の評価において、一般的なが重要なタスク形式として機能する。
この研究は、現代のLLMが、その固有の「選択バイアス」によるオプション位置変化に対して脆弱であることを示している。
そこで本研究では,オプションIDに対する事前バイアスを全体予測分布から分離するPriDeという,ラベルのない推論時間脱バイアス手法を提案する。
論文 参考訳(メタデータ) (2023-09-07T17:44:56Z) - Loss-guided Stability Selection [0.0]
LassoやBoostingのようなモデル選択手順は、実際のデータに過度に適合する傾向があることはよく知られている。
標準安定選択は、グローバルな基準、すなわち家族ごとのエラー率に基づいている。
選択された損失関数を付加的な検証ステップで尊重する安定性選択変種を提案する。
論文 参考訳(メタデータ) (2022-02-10T11:20:25Z) - Parameter selection in Gaussian process interpolation: an empirical
study of selection criteria [0.0]
本稿では,ガウス過程におけるパラメータ選択の根本的な問題を再考する。
適切なモデル群を選択することは、特定の選択基準を選択することよりもしばしば重要であることを示す。
論文 参考訳(メタデータ) (2021-07-13T11:57:56Z) - Choice Set Confounding in Discrete Choice [29.25891648918572]
既存の学習方法は、選択セットの割り当てがデータにどう影響するかを見落とします。
我々は因果推論から個別選択設定にメソッドを適応させる。
ホテル予約における選択集合の整理は,合理的な有効性最大化とより一致していることを示す。
論文 参考訳(メタデータ) (2021-05-17T15:39:02Z) - Scalable Marginal Likelihood Estimation for Model Selection in Deep
Learning [78.83598532168256]
階層型モデル選択は、推定困難のため、ディープラーニングではほとんど使われない。
本研究は,検証データが利用できない場合,限界的可能性によって一般化が向上し,有用であることを示す。
論文 参考訳(メタデータ) (2021-04-11T09:50:24Z) - Characterizing Fairness Over the Set of Good Models Under Selective
Labels [69.64662540443162]
同様の性能を実現するモデルセットに対して,予測公正性を特徴付けるフレームワークを開発する。
到達可能なグループレベルの予測格差の範囲を計算するためのトラクタブルアルゴリズムを提供します。
選択ラベル付きデータの実証的な課題に対処するために、我々のフレームワークを拡張します。
論文 参考訳(メタデータ) (2021-01-02T02:11:37Z) - Nonparametric Variable Screening with Optimal Decision Stumps [19.493449206135296]
単レベルCART決定木を用いた非パラメトリックモデルにおける変数選択に対する有限サンプル性能保証を導出する。
切削された基底展開を通じて各辺縁射影を直接推定しようとする従来の辺縁検定方法とは異なり、ここで用いられる適合モデルは単純で同相な決定スタンプである。
論文 参考訳(メタデータ) (2020-11-05T06:56:12Z) - Selective Classification Can Magnify Disparities Across Groups [89.14499988774985]
選択的分類は平均的精度を向上させることができるが、既存の精度格差を同時に増大させることができる。
禁忌の増大は、一部のグループでのアキュラシーを減少させることもある。
我々は,グループ間で類似のフルカバレッジ精度を実現する分散ロバストモデルを訓練し,選択分類が各グループを均一に改善することを示す。
論文 参考訳(メタデータ) (2020-10-27T08:51:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。