論文の概要: Doctor Rashomon and the UNIVERSE of Madness: Variable Importance with Unobserved Confounding and the Rashomon Effect
- arxiv url: http://arxiv.org/abs/2510.12734v1
- Date: Tue, 14 Oct 2025 17:12:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-15 21:19:15.004283
- Title: Doctor Rashomon and the UNIVERSE of Madness: Variable Importance with Unobserved Confounding and the Rashomon Effect
- Title(参考訳): ラショモン博士とウニヴェルセの狂気--観測不能な結界とラショモン効果の多様性
- Authors: Jon Donnelly, Srikar Katta, Emanuele Borgonovo, Cynthia Rudin,
- Abstract要約: rashomon SEts (UNIVERSE) を用いた可変インポートアンセシスのためのunobservables and Inferenceについて紹介する。
我々のアプローチでは、データセットのほぼ最適モデルの集合であるRashomon集合に適応して、機能不足であっても真のVI上のバウンダリを生成します。
提案手法のロバスト性を理論的に保証し,半合成シミュレーションで高い性能を示し,その有効性を信用リスクタスクで実証する。
- 参考スコア(独自算出の注目度): 26.270700202331792
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Variable importance (VI) methods are often used for hypothesis generation, feature selection, and scientific validation. In the standard VI pipeline, an analyst estimates VI for a single predictive model with only the observed features. However, the importance of a feature depends heavily on which other variables are included in the model, and essential variables are often omitted from observational datasets. Moreover, the VI estimated for one model is often not the same as the VI estimated for another equally-good model - a phenomenon known as the Rashomon Effect. We address these gaps by introducing UNobservables and Inference for Variable importancE using Rashomon SEts (UNIVERSE). Our approach adapts Rashomon sets - the sets of near-optimal models in a dataset - to produce bounds on the true VI even with missing features. We theoretically guarantee the robustness of our approach, show strong performance on semi-synthetic simulations, and demonstrate its utility in a credit risk task.
- Abstract(参考訳): 可変重要度法(VI)は仮説生成、特徴選択、科学的検証にしばしば用いられる。
標準VIパイプラインでは、アナリストは、観測された特徴のみを持つ単一の予測モデルに対してVIを推定する。
しかし、機能の重要性は、どの変数がモデルに含まれるかに大きく依存しており、本質的な変数はしばしば観測データセットから省略される。
さらに、あるモデルで推定されるVIは、別のモデルで推定されるVIとしばしば同じではない(ラショモン効果と呼ばれる現象)。
我々は,ラッショモン・セッツ(UNIVERSE)を用いた可変インポートアンセシスのUNobservablesとInferenceを導入することで,これらのギャップに対処する。
我々のアプローチでは、データセットのほぼ最適モデルの集合であるRashomon集合に適応して、機能不足であっても真のVI上のバウンダリを生成します。
提案手法のロバスト性を理論的に保証し,半合成シミュレーションで高い性能を示し,その有効性を信用リスクタスクで実証する。
関連論文リスト
- Spatial Reasoning with Denoising Models [49.83744014336816]
本稿では,連続変数の集合に対する推論を行うためのフレームワークを提案する。
初めて、その生成順序をデノナイジングネットワーク自体によって予測できる。
これらの結果から,特定の推論タスクの精度を1%から50%に向上させることができる。
論文 参考訳(メタデータ) (2025-02-28T14:08:30Z) - Explanatory Model Monitoring to Understand the Effects of Feature Shifts on Performance [61.06245197347139]
そこで本研究では,機能シフトによるブラックボックスモデルの振る舞いを説明する新しい手法を提案する。
本稿では,最適輸送と共有値の概念を組み合わせた提案手法について,説明的性能推定として紹介する。
論文 参考訳(メタデータ) (2024-08-24T18:28:19Z) - Beyond DAGs: A Latent Partial Causal Model for Multimodal Learning [80.44084021062105]
本稿では,非方向エッジで連結された2つの潜在結合変数を特徴とする,多モーダルデータに対する新しい潜在部分因果モデルを提案する。
特定の統計的仮定の下では、多モーダル・コントラッシブ・ラーニングによって学習された表現が、自明な変換までの潜在結合変数に対応することを示す。
事前トレーニングされたCLIPモデルの実験は、非絡み合った表現を具現化し、数ショットの学習を可能にし、さまざまな現実世界のデータセットにわたるドメインの一般化を改善する。
論文 参考訳(メタデータ) (2024-02-09T07:18:06Z) - The Rashomon Importance Distribution: Getting RID of Unstable, Single Model-based Variable Importance [16.641794438414745]
多様性の重要性の定量化は、遺伝学、公共政策、医学といった分野における高い評価の疑問に答えるのに不可欠である。
本稿では,すべての優れたモデルの集合にまたがる変数の重要性を定量化し,データ分布にまたがって安定な新しい変数重要度フレームワークを提案する。
私たちのフレームワークは非常に柔軟で、既存のモデルクラスやグローバル変数の重要度メトリクスと統合できます。
論文 参考訳(メタデータ) (2023-09-24T23:09:48Z) - Exploring the cloud of feature interaction scores in a Rashomon set [17.775145325515993]
本稿では,Rashomon セットのコンテキストにおける特徴相互作用スコア (FIS) について述べる。
我々は、合成データを用いてFISの特性を実証し、他の統計分野との接続を図示する。
この結果から,提案したFISは,機械学習モデルにおける特徴相互作用の性質に関する貴重な洞察を得られることが示唆された。
論文 参考訳(メタデータ) (2023-05-17T13:05:26Z) - A Generalized Variable Importance Metric and Estimator for Black Box
Machine Learning Models [0.21249247666376617]
我々は、ブラックボックス機械学習手法における予測器の重要性を測定するために、集団パラメータ、一般化可変重要度指標(GVIM)'を定義した。
我々は,定義したGVIMが,任意の種類の予測器に対する条件平均処理効果(CATE)の関数として表現可能であることを示すために,予め公表した結果を拡張した。
論文 参考訳(メタデータ) (2022-12-20T00:50:28Z) - Comparing Test Sets with Item Response Theory [53.755064720563]
我々は,18の事前学習トランスフォーマーモデルから予測した29のデータセットを個別のテスト例で評価した。
Quoref、HellaSwag、MC-TACOは最先端のモデルを区別するのに最適である。
また、QAMRやSQuAD2.0のようなQAデータセットに使用されるスパン選択タスク形式は、強いモデルと弱いモデルとの差別化に有効である。
論文 参考訳(メタデータ) (2021-06-01T22:33:53Z) - Towards Understanding Sample Variance in Visually Grounded Language
Generation: Evaluations and Observations [67.4375210552593]
視覚的基盤言語生成において,重要だがしばしば無視される問題を理解するために実験を設計する。
人間にはさまざまなユーティリティと視覚的注意があるので、マルチ参照データセットのサンプルのばらつきはモデルの性能にどのように影響しますか?
人為的な参照は、異なるデータセットやタスクで大きく変化する可能性があり、それぞれのタスクの性質が明らかになる。
論文 参考訳(メタデータ) (2020-10-07T20:45:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。