Fugu-MT 論文翻訳(概要): Information criteria for structured parameter selection in high dimensional tree and graph models

論文の概要: Information criteria for structured parameter selection in high dimensional tree and graph models

arxiv url: http://arxiv.org/abs/2306.14026v1
Date: Sat, 24 Jun 2023 17:40:40 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-27 17:29:35.892200
Title: Information criteria for structured parameter selection in high dimensional tree and graph models
Title（参考訳）: 高次元木およびグラフモデルにおける構造化パラメータ選択の情報基準
Authors: Maarten Jansen
Abstract要約: 本報告では, 縮小しない推定器を用いて, 偽陽性と偽陰性とを慎重にバランスさせ, 精査した情報基準について検討する。特に,木や図形モデルにおける構造化選択に対するMallowsのCp基準を補正した。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Parameter selection in high-dimensional models is typically finetuned in a way that keeps the (relative) number of false positives under control. This is because otherwise the few true positives may be dominated by the many possible false positives. This happens, for instance, when the selection follows from a naive optimisation of an information criterion, such as AIC or Mallows's Cp. It can be argued that the overestimation of the selection comes from the optimisation process itself changing the statistics of the selected variables, in a way that the information criterion no longer reflects the true divergence between the selection and the data generating process. In lasso, the overestimation can also be linked to the shrinkage estimator, which makes the selection too tolerant of false positive selections. For these reasons, this paper works on refined information criteria, carefully balancing false positives and false negatives, for use with estimators without shrinkage. In particular, the paper develops corrected Mallows's Cp criteria for structured selection in trees and graphical models.
Abstract（参考訳）: 高次元モデルのパラメータ選択は通常、(相対的な)偽陽性数の数を制御下におく方法で微調整される。これは、そうでなければ、少数の真の正が多くの偽陽性によって支配される可能性があるためである。これは例えば、aic や mallows の cp のような情報基準のナイーブな最適化から選択が導かれるときに起こる。選択の過大評価は、情報基準が選択とデータ生成プロセスの間の真の分岐を反映しないような方法で、選択された変数の統計を変化させる最適化プロセス自体から生じていると主張することができる。ラッソでは、過大評価は縮小推定子に関連付けることができ、その結果選択は偽の正の選択に寛容すぎる。これらの理由から,本論文では,縮小を伴わない推定器で使用するために,偽陽性と偽陰性を慎重にバランスをとる,洗練された情報基準について検討する。特に,木や図形モデルにおける構造化選択に対するMallowsのCp基準を補正した。

関連論文リスト

Towards Understanding Valuable Preference Data for Large Language Model Alignment [85.38864561060088]
大規模言語モデル(LLM)のアライメントは通常、人間の好みの比較から学習することで達成される。新たに提案したTruncated Influence Function (TIF) を用いた検証データに対する個人の影響によるデータ品質の評価を行う。この目的のために、我々はそれらを組み合わせ、様々なエラーソースをオフセットし、単純だが効果的なデータ選択ルールをもたらす。
論文参考訳（メタデータ） (2025-10-15T06:57:55Z)
A Principled Approach to Randomized Selection under Uncertainty: Applications to Peer Review and Grant Funding [68.43987626137512]
本稿では,各項目の品質の間隔推定に基づくランダム化意思決定の枠組みを提案する。最適化に基づく最適化手法であるMERITを導入する。 MERITが既存のアプローチで保証されていない望ましい公理特性を満たすことを証明している。
論文参考訳（メタデータ） (2025-06-23T19:59:30Z)
Unintentional Unalignment: Likelihood Displacement in Direct Preference Optimization [60.176008034221404]
直接選好最適化(DPO)とその変種は、言語モデルと人間の選好の整合にますます利用されている。以前の研究では、トレーニング中に好まれる反応の可能性が減少する傾向が見られた。確率変位は破滅的になりうることを示し、確率質量を好ましくない反応から反対の意味の反応へとシフトさせる。
論文参考訳（メタデータ） (2024-10-11T14:22:44Z)
An incremental preference elicitation-based approach to learning potentially non-monotonic preferences in multi-criteria sorting [53.36437745983783]
まず最適化モデルを構築し,非単調な選好をモデル化する。本稿では,情報量測定手法と質問選択戦略を考案し,各イテレーションにおいて最も情報に富む選択肢を特定する。 2つのインクリメンタルな選好に基づくアルゴリズムは、潜在的に単調な選好を学習するために開発された。
論文参考訳（メタデータ） (2024-09-04T14:36:20Z)
Detecting and Identifying Selection Structure in Sequential Data [53.24493902162797]
我々は,音楽のシーケンスなどの実践的な状況において,潜在目的に基づくデータポイントの選択的包摂が一般的である,と論じる。選択構造はパラメトリックな仮定や介入実験なしで識別可能であることを示す。また、他の種類の依存関係と同様に、選択構造を検知し、識別するための証明可能な正当性アルゴリズムを提案する。
論文参考訳（メタデータ） (2024-06-29T20:56:34Z)
Cost-sensitive Feature Selection for Support Vector Machines [1.743685428161914]
本稿では,最も一般的な分類手法の一つであるSupport Vector Machinesに組込み,数学的最適化に基づく特徴選択手法を提案する。また, 偽陰性率と偽陰性率とのトレードオフが望まれる一方で, 特徴量を大幅に減少することを示す。
論文参考訳（メタデータ） (2024-01-15T12:07:52Z)
Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文参考訳（メタデータ） (2023-10-17T08:04:45Z)
Large Language Models Are Not Robust Multiple Choice Selectors [117.72712117510953]
複数選択質問(MCQ)は、大規模言語モデル(LLM)の評価において、一般的なが重要なタスク形式として機能する。この研究は、現代のLLMが、その固有の「選択バイアス」によるオプション位置変化に対して脆弱であることを示している。そこで本研究では,オプションIDに対する事前バイアスを全体予測分布から分離するPriDeという,ラベルのない推論時間脱バイアス手法を提案する。
論文参考訳（メタデータ） (2023-09-07T17:44:56Z)
Loss-guided Stability Selection [0.0]
LassoやBoostingのようなモデル選択手順は、実際のデータに過度に適合する傾向があることはよく知られている。標準安定選択は、グローバルな基準、すなわち家族ごとのエラー率に基づいている。選択された損失関数を付加的な検証ステップで尊重する安定性選択変種を提案する。
論文参考訳（メタデータ） (2022-02-10T11:20:25Z)
Parameter selection in Gaussian process interpolation: an empirical study of selection criteria [0.0]
本稿では,ガウス過程におけるパラメータ選択の根本的な問題を再考する。適切なモデル群を選択することは、特定の選択基準を選択することよりもしばしば重要であることを示す。
論文参考訳（メタデータ） (2021-07-13T11:57:56Z)
Choice Set Confounding in Discrete Choice [29.25891648918572]
既存の学習方法は、選択セットの割り当てがデータにどう影響するかを見落とします。我々は因果推論から個別選択設定にメソッドを適応させる。ホテル予約における選択集合の整理は,合理的な有効性最大化とより一致していることを示す。
論文参考訳（メタデータ） (2021-05-17T15:39:02Z)
Scalable Marginal Likelihood Estimation for Model Selection in Deep Learning [78.83598532168256]
階層型モデル選択は、推定困難のため、ディープラーニングではほとんど使われない。本研究は,検証データが利用できない場合,限界的可能性によって一般化が向上し,有用であることを示す。
論文参考訳（メタデータ） (2021-04-11T09:50:24Z)
Nonparametric Variable Screening with Optimal Decision Stumps [19.493449206135296]
単レベルCART決定木を用いた非パラメトリックモデルにおける変数選択に対する有限サンプル性能保証を導出する。切削された基底展開を通じて各辺縁射影を直接推定しようとする従来の辺縁検定方法とは異なり、ここで用いられる適合モデルは単純で同相な決定スタンプである。
論文参考訳（メタデータ） (2020-11-05T06:56:12Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。