論文の概要: Ultra Marginal Feature Importance
- arxiv url: http://arxiv.org/abs/2204.09938v1
- Date: Thu, 21 Apr 2022 07:54:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-22 21:33:55.937240
- Title: Ultra Marginal Feature Importance
- Title(参考訳): Ultra Marginal Feature の重要性
- Authors: Joseph Janssen and Vincent Guan
- Abstract要約: 性能向上のために、限界貢献機能の重要性の枠組みを一般化する。
我々は,超限界特徴重要度が,少なくとも限界寄与特徴重要度と同等であることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scientists frequently prioritize learning from data rather than training the
best possible model; however, research in machine learning often prioritizes
the latter. The development of marginal feature importance methods, such as
marginal contribution feature importance, attempts to break this trend by
providing a useful framework for explaining relationships in data in an
interpretable fashion. In this work, we generalize the framework of marginal
contribution feature importance to improve performance with regards to
detecting correlated interactions and reducing runtime. To do so, we consider
"information subsets" of the set of features $F$ and show that our importance
metric can be computed directly after applying fair representation learning
methods from the AI fairness literature. The methods of optimal transport and
linear regression are considered and explored experimentally for removing all
the information of our feature of interest $f$ from the feature set $F$. Given
these implementations, we show on real and simulated data that ultra marginal
feature importance performs at least as well as marginal contribution feature
importance, with substantially faster computation time and better performance
in the presence of correlated interactions and unrelated features.
- Abstract(参考訳): 科学者はしばしば最善のモデルのトレーニングではなく、データから学習を優先するが、機械学習の研究は後者を優先することが多い。
限界寄与特徴重要度のような限界特徴重要度法の開発は、解釈可能な方法でデータ間の関係を説明するための有用なフレームワークを提供することで、この傾向を破ろうとする。
本研究では,相関したインタラクションの検出とランタイムの削減に関して,パフォーマンスを向上させるために,限界貢献機能のフレームワークを一般化する。
そこで我々は,機能セットの「情報サブセット」を$F$とし,AIフェアネス文献から公正表現学習手法を適用した上で,我々の重要度を直接計算可能であることを示す。
最適輸送法と線形回帰法は、F$という特徴集合からf$という特徴の全ての情報を除去するために実験的に検討・検討されている。
これらの実装から,超限界特徴重要度は,少なくとも限界寄与特徴重要度と同等であり,相関相互作用や非関連特徴の存在下では計算時間が大幅に向上し,性能が向上することを示す。
関連論文リスト
- Prospector Heads: Generalized Feature Attribution for Large Models &
Data [63.33062996732212]
本稿では,特徴帰属のための説明に基づく手法の,効率的かつ解釈可能な代替手段であるプロスペクタヘッドを紹介する。
入力データにおけるクラス固有のパターンの解釈と発見を、プロファイラヘッドがいかに改善できるかを実証する。
論文 参考訳(メタデータ) (2024-02-18T23:01:28Z) - Surprisal Driven $k$-NN for Robust and Interpretable Nonparametric
Learning [1.4293924404819704]
我々は情報理論の観点から、隣り合う従来のアルゴリズムに新たな光を当てた。
単一モデルを用いた分類,回帰,密度推定,異常検出などのタスクに対する頑健で解釈可能なフレームワークを提案する。
我々の研究は、分類と異常検出における最先端の成果を達成することによって、アーキテクチャの汎用性を示す。
論文 参考訳(メタデータ) (2023-11-17T00:35:38Z) - RoBoSS: A Robust, Bounded, Sparse, and Smooth Loss Function for
Supervised Learning [0.0]
そこで本研究では,教師あり学習のための,頑健で,有界で,スパースで,スムーズなロス関数(RoBoSS)を提案する。
未確認データの一般化のために,$mathcalL_rbss$-SVMという新しいロバストアルゴリズムを導入する。
提案した$mathcalL_rbss$-SVM を実世界の UCI と KEEL のデータセットで18ドルで評価した。
論文 参考訳(メタデータ) (2023-09-05T13:59:50Z) - How Knowledge Graph and Attention Help? A Quantitative Analysis into
Bag-level Relation Extraction [66.09605613944201]
バッグレベルの関係抽出(RE)における注意と知識グラフの効果を定量的に評価する。
その結果,(1)注目精度の向上は,エンティティ参照特徴を抽出するモデルの性能を損なう可能性があること,(2)注目性能は様々なノイズ分布パターンの影響が大きいこと,(3)KG強化された注目はRE性能を向上するが,その効果は注目度を向上させるだけでなく,先行するエンティティを組み込むことによっても改善することがわかった。
論文 参考訳(メタデータ) (2021-07-26T09:38:28Z) - Robust Representation Learning via Perceptual Similarity Metrics [18.842322467828502]
Contrastive Input Morphing (CIM) はデータの入力空間変換を学習する表現学習フレームワークである。
CIMは他の相互情報に基づく表現学習技術と相補的であることを示す。
論文 参考訳(メタデータ) (2021-06-11T21:45:44Z) - Representation Learning for Weakly Supervised Relation Extraction [19.689433249830465]
本論文では、分散テキスト表現機能を学ぶための教師なし事前学習モデルをいくつか提示する。
実験により,従来の手作りの特徴と組み合わせることで,関係抽出のためのロジスティック分類モデルの性能が向上することが実証された。
論文 参考訳(メタデータ) (2021-04-10T12:22:25Z) - Accurate and Robust Feature Importance Estimation under Distribution
Shifts [49.58991359544005]
PRoFILEは、新しい特徴重要度推定法である。
忠実さと頑健さの両面で、最先端のアプローチよりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2020-09-30T05:29:01Z) - Towards a More Reliable Interpretation of Machine Learning Outputs for
Safety-Critical Systems using Feature Importance Fusion [0.0]
我々は新しい融合距離を導入し、それを最先端技術と比較する。
我々のアプローチは、地上の真実が知られている合成データで検証される。
その結果、我々の機能重要度アンサンブルフレームワークは、既存の方法に比べて、機能重要度エラーが15%少ないことがわかった。
論文 参考訳(メタデータ) (2020-09-11T15:51:52Z) - Provably Efficient Causal Reinforcement Learning with Confounded
Observational Data [135.64775986546505]
オフラインで収集されたデータセット(観測データ)を組み込んで、オンライン環境でのサンプル効率を改善する方法について検討する。
提案手法は,観測データを効率よく組み込んだ,分解された楽観的値反復 (DOVI) アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-22T14:49:33Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z) - Value-driven Hindsight Modelling [68.658900923595]
値推定は強化学習(RL)パラダイムの重要な構成要素である。
モデル学習は、観測系列に存在する豊富な遷移構造を利用することができるが、このアプローチは通常、報酬関数に敏感ではない。
この2つの極点の間に位置するRLにおける表現学習のアプローチを開発する。
これにより、タスクに直接関連し、値関数の学習を加速できる、抽出可能な予測ターゲットが提供される。
論文 参考訳(メタデータ) (2020-02-19T18:10:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。