論文の概要: Ultra Marginal Feature Importance
- arxiv url: http://arxiv.org/abs/2204.09938v1
- Date: Thu, 21 Apr 2022 07:54:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-22 21:33:55.937240
- Title: Ultra Marginal Feature Importance
- Title(参考訳): Ultra Marginal Feature の重要性
- Authors: Joseph Janssen and Vincent Guan
- Abstract要約: 性能向上のために、限界貢献機能の重要性の枠組みを一般化する。
我々は,超限界特徴重要度が,少なくとも限界寄与特徴重要度と同等であることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scientists frequently prioritize learning from data rather than training the
best possible model; however, research in machine learning often prioritizes
the latter. The development of marginal feature importance methods, such as
marginal contribution feature importance, attempts to break this trend by
providing a useful framework for explaining relationships in data in an
interpretable fashion. In this work, we generalize the framework of marginal
contribution feature importance to improve performance with regards to
detecting correlated interactions and reducing runtime. To do so, we consider
"information subsets" of the set of features $F$ and show that our importance
metric can be computed directly after applying fair representation learning
methods from the AI fairness literature. The methods of optimal transport and
linear regression are considered and explored experimentally for removing all
the information of our feature of interest $f$ from the feature set $F$. Given
these implementations, we show on real and simulated data that ultra marginal
feature importance performs at least as well as marginal contribution feature
importance, with substantially faster computation time and better performance
in the presence of correlated interactions and unrelated features.
- Abstract(参考訳): 科学者はしばしば最善のモデルのトレーニングではなく、データから学習を優先するが、機械学習の研究は後者を優先することが多い。
限界寄与特徴重要度のような限界特徴重要度法の開発は、解釈可能な方法でデータ間の関係を説明するための有用なフレームワークを提供することで、この傾向を破ろうとする。
本研究では,相関したインタラクションの検出とランタイムの削減に関して,パフォーマンスを向上させるために,限界貢献機能のフレームワークを一般化する。
そこで我々は,機能セットの「情報サブセット」を$F$とし,AIフェアネス文献から公正表現学習手法を適用した上で,我々の重要度を直接計算可能であることを示す。
最適輸送法と線形回帰法は、F$という特徴集合からf$という特徴の全ての情報を除去するために実験的に検討・検討されている。
これらの実装から,超限界特徴重要度は,少なくとも限界寄与特徴重要度と同等であり,相関相互作用や非関連特徴の存在下では計算時間が大幅に向上し,性能が向上することを示す。
関連論文リスト
- Random Features Outperform Linear Models: Effect of Strong Input-Label Correlation in Spiked Covariance Data [0.8287206589886879]
入力とラベルの間に高い相関関係があることが,RAMが線形モデルより優れていることを示す。
RFMは,入力とラベルの相関関係の強さに依存する雑音モデルと等価であることを示す。
論文 参考訳(メタデータ) (2024-09-30T12:40:45Z) - Graph-based Unsupervised Disentangled Representation Learning via Multimodal Large Language Models [42.17166746027585]
複素データ内の因子化属性とその相互関係を学習するための双方向重み付きグラフベースフレームワークを提案する。
具体的には、グラフの初期ノードとして要素を抽出する$beta$-VAEベースのモジュールを提案する。
これらの相補的加群を統合することで、我々は細粒度、実用性、教師なしの絡み合いをうまく達成できる。
論文 参考訳(メタデータ) (2024-07-26T15:32:21Z) - Relational Learning in Pre-Trained Models: A Theory from Hypergraph Recovery Perspective [60.64922606733441]
我々は,関係学習をハイパーグラフリカバリとして形式化する数学的モデルを導入し,基礎モデル(FM)の事前学習について検討する。
我々のフレームワークでは、世界はハイパーグラフとして表現され、データはハイパーエッジからランダムなサンプルとして抽象化される。我々は、このハイパーグラフを復元するための事前学習モデル(PTM)の有効性を理論的に検証し、ミニマックスに近い最適スタイルでデータ効率を解析する。
論文 参考訳(メタデータ) (2024-06-17T06:20:39Z) - Multi-modal Causal Structure Learning and Root Cause Analysis [67.67578590390907]
根本原因局所化のためのマルチモーダル因果構造学習手法であるMulanを提案する。
ログ選択言語モデルを利用してログ表現学習を行い、ログシーケンスを時系列データに変換する。
また、モダリティの信頼性を評価し、最終因果グラフを共同学習するための新しいキーパフォーマンスインジケータ対応アテンション機構も導入する。
論文 参考訳(メタデータ) (2024-02-04T05:50:38Z) - SLEM: Machine Learning for Path Modeling and Causal Inference with Super
Learner Equation Modeling [3.988614978933934]
因果推論は科学の重要な目標であり、研究者は観測データを使って意味のある結論に達することができる。
経路モデル、構造方程式モデル(SEM)および指向非巡回グラフ(DAG)は、現象の根底にある因果構造に関する仮定を明確に特定する手段を提供する。
本稿では,機械学習のスーパーラーナーアンサンブルを統合したパスモデリング手法であるSuper Learner Equation Modelingを提案する。
論文 参考訳(メタデータ) (2023-08-08T16:04:42Z) - MFAI: A Scalable Bayesian Matrix Factorization Approach to Leveraging
Auxiliary Information [8.42894516984735]
確率行列因数分解フレームワークに勾配増木木を統合して補助情報(MFAI)を活用することを提案する。
MFAIは自然に、非線形関係を柔軟にモデル化する能力など、勾配を増進した木の健全な特徴を継承する。
MFAIは、変分推論を利用して計算効率が高く、大規模なデータセットにスケーラブルである。
論文 参考訳(メタデータ) (2023-03-05T03:26:14Z) - Confounder Identification-free Causal Visual Feature Learning [84.28462256571822]
本稿では,創始者を特定する必要性を排除した,創始者同定自由因果視覚特徴学習(CICF)手法を提案する。
CICFは、フロントドア基準に基づいて異なるサンプル間の介入をモデル化し、インスタンスレベルの介入に対するグローバルスコープ干渉効果を近似する。
我々は,CICFと一般的なメタラーニング戦略MAMLの関係を明らかにするとともに,MAMLが理論的観点から機能する理由を解釈する。
論文 参考訳(メタデータ) (2021-11-26T10:57:47Z) - SAIS: Supervising and Augmenting Intermediate Steps for Document-Level
Relation Extraction [51.27558374091491]
本稿では,関係抽出のための中間ステップ(SAIS)を監督し,拡張することにより,関連コンテキストやエンティティタイプをキャプチャするモデルを明示的に教えることを提案する。
そこで本提案手法は,より効果的な管理を行うため,より優れた品質の関係を抽出するだけでなく,それに対応する証拠をより正確に抽出する。
論文 参考訳(メタデータ) (2021-09-24T17:37:35Z) - Accurate and Robust Feature Importance Estimation under Distribution
Shifts [49.58991359544005]
PRoFILEは、新しい特徴重要度推定法である。
忠実さと頑健さの両面で、最先端のアプローチよりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2020-09-30T05:29:01Z) - S^3-Rec: Self-Supervised Learning for Sequential Recommendation with
Mutual Information Maximization [104.87483578308526]
本稿では,シーケンスレコメンデーションのための自己改善学習のためのモデルS3-Recを提案する。
そこで本稿では,属性,項目,サブシーケンス,シーケンス間の相関関係を学習するために,4つの補助的自己教師対象を考案する。
6つの実世界のデータセットで実施された大規模な実験は、既存の最先端手法よりも提案手法が優れていることを示す。
論文 参考訳(メタデータ) (2020-08-18T11:44:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。