論文の概要: Variable importance scores
- arxiv url: http://arxiv.org/abs/2102.07765v1
- Date: Sat, 13 Feb 2021 05:08:50 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-17 15:02:26.879273
- Title: Variable importance scores
- Title(参考訳): 可変重要度スコア
- Authors: Wei-Yin Loh and Peigen Zhou
- Abstract要約: 本稿では,GUIDEアルゴリズムに基づく11手法の比較評価と更新手法を用いて,そのギャップを埋める。
値が欠けているデータの場合、8つのメソッドは、異なる種類の変数に対してより高いスコアまたは低いスコアを与えるという偏りが示される。
その結果,多くの手法のスコアは条件付き予測力よりも限界予測力と一致していることがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Scoring of variables for importance in predicting a response is an
ill-defined concept. Several methods have been proposed but little is known of
their performance. This paper fills the gap with a comparative evaluation of
eleven methods and an updated one based on the GUIDE algorithm. For data
without missing values, eight of the methods are shown to be biased in that
they give higher or lower scores to different types of variables, even when all
are independent of the response. Of the remaining four methods, only two are
applicable to data with missing values, with GUIDE the only unbiased one. GUIDE
achieves unbiasedness by using a self-calibrating step that is applicable to
other methods for score de-biasing. GUIDE also yields a threshold for
distinguishing important from unimportant variables at 95 and 99 percent
confidence levels; the technique is applicable to other methods as well.
Finally, the paper studies the relationship of the scores to predictive power
in three data sets. It is found that the scores of many methods are more
consistent with marginal predictive power than conditional predictive power.
- Abstract(参考訳): 応答を予測することの重要性に対する変数のスコア付けは、不明確な概念である。
いくつかの方法が提案されているが、その性能はほとんど知られていない。
本稿では,GUIDEアルゴリズムに基づく11手法の比較評価と更新手法を用いて,そのギャップを埋める。
欠落した値のないデータに対しては、8つのメソッドのバイアスが示され、それぞれが応答から独立している場合でも、異なるタイプの変数に対して高いスコアまたは低いスコアを与える。
残りの4つのメソッドのうち、2つだけが欠落した値を持つデータに適用可能であり、GUIDEだけがバイアスのないデータである。
ガイドは、他のスコア脱バイアス方法に適用可能な自己調整ステップを使用することで、偏りを解消する。
GUIDEはまた、95および99%の信頼性レベルで重要でない変数と重要な変数を区別するためのしきい値を生成します。
最後に,3つのデータセットにおけるスコアと予測力の関係について検討した。
その結果,多くの手法のスコアは条件付き予測力よりも限界予測力と一致していることがわかった。
関連論文リスト
- Model-independent variable selection via the rule-based variable priority [1.2771542695459488]
モデルに依存しない新しいアプローチである可変優先度(VarPro)を導入する。
VarProは、人工データを生成したり、予測エラーを評価することなく、ルールを活用する。
VarProはノイズ変数に対して一貫したフィルタリング特性を持つことを示す。
論文 参考訳(メタデータ) (2024-09-13T17:32:05Z) - Stratified Prediction-Powered Inference for Hybrid Language Model Evaluation [62.2436697657307]
予測駆動推論(英: Prediction-powered Inference, PPI)は、人間ラベル付き限られたデータに基づいて統計的推定を改善する手法である。
我々はStratPPI(Stratified Prediction-Powered Inference)という手法を提案する。
単純なデータ階層化戦略を用いることで,基礎的なPPI推定精度を大幅に向上できることを示す。
論文 参考訳(メタデータ) (2024-06-06T17:37:39Z) - Debiasing Machine Learning Models by Using Weakly Supervised Learning [3.3298048942057523]
アルゴリズムの出力と感度変数の両方が連続的な設定において、アルゴリズム決定のバイアス軽減の問題に取り組む。
典型的な例は、年齢や財政状況に関して行われる不公平な決定である。
我々のバイアス緩和戦略は弱い教師付き学習手法であり、データのごく一部を公平に測定する必要がある。
論文 参考訳(メタデータ) (2024-02-23T18:11:32Z) - Evaluating the Fairness of Discriminative Foundation Models in Computer
Vision [51.176061115977774]
本稿では,CLIP (Contrastive Language-Pretraining) などの差別基盤モデルのバイアス評価のための新しい分類法を提案する。
そして、これらのモデルにおけるバイアスを緩和するための既存の手法を分類学に関して体系的に評価する。
具体的には,ゼロショット分類,画像検索,画像キャプションなど,OpenAIのCLIPとOpenCLIPモデルをキーアプリケーションとして評価する。
論文 参考訳(メタデータ) (2023-10-18T10:32:39Z) - A Bayesian approach to uncertainty in word embedding bias estimation [0.0]
WEAT や MAC のような複数の測度は、単語の埋め込みに存在するバイアスの大きさを1つの数字のメートル法で定量化しようとする。
このような手法を用いて、意図したバイアスを欠いたnullモデルによってデータが生成される場合でも、同様の結果が容易に得られることを示す。
単語埋め込みにおけるバイアスのより不確実性に敏感な検査を可能にする階層型ベイズモデルを提案する。
論文 参考訳(メタデータ) (2023-06-15T11:48:50Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Scalable Personalised Item Ranking through Parametric Density Estimation [53.44830012414444]
暗黙のフィードバックから学ぶことは、一流問題の難しい性質のために困難です。
ほとんどの従来の方法は、一級問題に対処するためにペアワイズランキングアプローチとネガティブサンプラーを使用します。
本論文では,ポイントワイズと同等の収束速度を実現する学習対ランクアプローチを提案する。
論文 参考訳(メタデータ) (2021-05-11T03:38:16Z) - A Statistical Analysis of Summarization Evaluation Metrics using
Resampling Methods [60.04142561088524]
信頼区間は比較的広く,信頼性の高い自動測定値の信頼性に高い不確実性を示す。
多くのメトリクスはROUGEよりも統計的改善を示していないが、QAEvalとBERTScoreという2つの最近の研究は、いくつかの評価設定で行われている。
論文 参考訳(メタデータ) (2021-03-31T18:28:14Z) - Fast Uncertainty Quantification for Deep Object Pose Estimation [91.09217713805337]
深層学習に基づくオブジェクトポーズ推定は、しばしば信頼できない、自信過剰である。
本研究では,6-DoFオブジェクトのポーズ推定のための,シンプルで効率的かつプラグアンドプレイなUQ手法を提案する。
論文 参考訳(メタデータ) (2020-11-16T06:51:55Z) - Online Parameter-Free Learning of Multiple Low Variance Tasks [36.08679456245112]
低分散タスク列の増大に対して共通のバイアスベクトルを学習する手法を提案する。
我々のアプローチは統計的でない設定で示され、2つの変種から成り立つ。
実験により,本手法の有効性が確認された。
論文 参考訳(メタデータ) (2020-07-11T09:52:53Z) - Median regression with differential privacy [11.440028296972734]
第1のアルゴリズムは有限な滑らか化法に基づいており、第2のアルゴリズムは反復的な方法を提供し、最後のアルゴリズムはさらにグリーディ座標降下法を用いる。
これらのアルゴリズムの精度境界や収束特性も提供される。
論文 参考訳(メタデータ) (2020-06-04T16:14:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。