論文の概要: Implications on Feature Detection when using the Benefit-Cost Ratio
- arxiv url: http://arxiv.org/abs/2008.05163v2
- Date: Sat, 15 Aug 2020 16:30:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-31 04:47:08.155672
- Title: Implications on Feature Detection when using the Benefit-Cost Ratio
- Title(参考訳): Benefit-Cost比を用いた特徴検出の意義
- Authors: Rudolf Jagdhuber and J\"org Rahnenf\"uhrer
- Abstract要約: 一般的なトレードオフ選択は、両者の比率であるBCR(benefit-cost ratio)である。
大きなコスト差と小さな効果の大きさの状況では、BCRは関連する特徴を欠き、安価なノイズ特徴を好んだ。
単純な利益-コスト比は、コストを組み込むための簡単なソリューションを提供するが、リスクを認識しておくことが重要です。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In many practical machine learning applications, there are two objectives:
one is to maximize predictive accuracy and the other is to minimize costs of
the resulting model. These costs of individual features may be financial costs,
but can also refer to other aspects, like for example evaluation time. Feature
selection addresses both objectives, as it reduces the number of features and
can improve the generalization ability of the model. If costs differ between
features, the feature selection needs to trade-off the individual benefit and
cost of each feature. A popular trade-off choice is the ratio of both, the BCR
(benefit-cost ratio). In this paper we analyze implications of using this
measure with special focus to the ability to distinguish relevant features from
noise. We perform a simulation study for different cost and data settings and
obtain detection rates of relevant features and empirical distributions of the
trade-off ratio. Our simulation study exposed a clear impact of the cost
setting on the detection rate. In situations with large cost differences and
small effect sizes, the BCR missed relevant features and preferred cheap noise
features. We conclude that a trade-off between predictive performance and costs
without a controlling hyperparameter can easily overemphasize very cheap noise
features. While the simple benefit-cost ratio offers an easy solution to
incorporate costs, it is important to be aware of its risks. Avoiding costs
close to 0, rescaling large cost differences, or using a hyperparameter
trade-off are ways to counteract the adverse effects exposed in this paper.
- Abstract(参考訳): 多くの実用的な機械学習アプリケーションには、予測精度を最大化することと、結果モデルのコストを最小限にすることの2つの目的がある。
個々の特徴のこれらのコストは金銭的なコストであるが、例えば評価時間など他の側面も参照できる。
特徴選択は、特徴の数を減らし、モデルの一般化能力を向上させるため、両方の目的に対処する。
機能間でコストが違う場合、機能の選択は各機能の個々の利益とコストをトレードオフする必要があります。
一般的なトレードオフ選択は、両者の比率であるBCR(benefit-cost ratio)である。
本稿では,ノイズと関連する特徴を識別する能力に特化して,この尺度を用いることの意味を分析する。
コストとデータ設定の異なる場合のシミュレーション研究を行い、関連する特徴の検出率とトレードオフ比の経験的分布を求める。
シミュレーションにより,コスト設定が検出率に与える影響を明らかにした。
大きなコスト差と小さな効果の大きさの状況では、BCRは関連する特徴を欠き、安価なノイズ特徴を好んだ。
ハイパーパラメータを制御せずとも予測性能とコストのトレードオフは、非常に安価にノイズを強調しやすくなると結論づけた。
単純な利益-コスト比は、コストを組み込むための簡単なソリューションを提供するが、リスクを認識しておくことが重要です。
コストを0に近づいたり、大きなコスト差を再スケーリングしたり、ハイパーパラメータトレードオフを使用したりすることは、この論文で明らかになった悪影響を対処する方法である。
関連論文リスト
- Cost-constrained multi-label group feature selection using shadow features [1.87071394890391]
複数ラベル分類における特徴選択の問題について,特徴群に割り当てられたコストを考慮した検討を行った。
このタスクでは、ラベルベクトルを予測するのに有用な機能のサブセットを選択することを目的としているが、同時に、選択した機能に関連するコストは、想定される予算を超えない。
論文 参考訳(メタデータ) (2024-08-03T19:31:59Z) - Cost-Sensitive Multi-Fidelity Bayesian Optimization with Transfer of Learning Curve Extrapolation [55.75188191403343]
各ユーザが事前に定義した機能であるユーティリティを導入し,BOのコストと性能のトレードオフについて述べる。
このアルゴリズムをLCデータセット上で検証した結果,従来のマルチファイルBOや転送BOベースラインよりも優れていた。
論文 参考訳(メタデータ) (2024-05-28T07:38:39Z) - Contextual Linear Optimization with Bandit Feedback [35.692428244561626]
文脈線形最適化(CLO)は、ランダムコスト係数の不確実性を低減するために予測的文脈特徴を用いる。
我々は,帯域幅フィードバックを用いたCLOのためのオフライン学習アルゴリズムのクラスについて検討する。
IERMに対する高速な後悔境界を示し、不特定モデルクラスと最適化推定の柔軟な選択を可能にする。
論文 参考訳(メタデータ) (2024-05-26T13:27:27Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - Efficient Sentiment Analysis: A Resource-Aware Evaluation of Feature Extraction Techniques, Ensembling, and Deep Learning Models [0.0]
我々は,資源コストに着目した文書レベルの感情分析モデルを評価する。
より小さなデータセットでは,資源消費の差が大きくなるにつれて精度の差が小さくなることがわかった。
論文 参考訳(メタデータ) (2023-08-03T20:29:27Z) - Value function estimation using conditional diffusion models for control [62.27184818047923]
拡散値関数(DVF)と呼ばれる単純なアルゴリズムを提案する。
拡散モデルを用いて環境-ロボット相互作用の連成多段階モデルを学ぶ。
本稿では,DVFを用いて複数のコントローラの状態を効率よく把握する方法を示す。
論文 参考訳(メタデータ) (2023-06-09T18:40:55Z) - Error-based Knockoffs Inference for Controlled Feature Selection [49.99321384855201]
本手法では, ノックオフ特徴量, エラーベース特徴重要度統計量, ステップダウン手順を一体化して, エラーベースのノックオフ推定手法を提案する。
提案手法では回帰モデルを指定する必要はなく,理論的保証で特徴選択を処理できる。
論文 参考訳(メタデータ) (2022-03-09T01:55:59Z) - Low-Cost Algorithmic Recourse for Users With Uncertain Cost Functions [74.00030431081751]
本稿では,ユーザ固有のコスト関数の概念を定式化し,ユーザのための行動可能なリコースを識別する新しい手法を提案する。
本手法は,強いベースライン法に比べて最大25.89パーセントのユーザを満足させる。
論文 参考訳(メタデータ) (2021-11-01T19:49:35Z) - Instance-optimality in optimal value estimation: Adaptivity via
variance-reduced Q-learning [99.34907092347733]
本稿では,マルコフ決定過程における最適な$Q$値関数を離散状態と動作で推定する問題を解析する。
局所的なミニマックスフレームワークを用いて、この関数は任意の推定手順の精度の低い境界に現れることを示す。
他方,Q$ラーニングの分散還元版を解析することにより,状態と行動空間の対数的要因まで,下位境界のシャープさを確立する。
論文 参考訳(メタデータ) (2021-06-28T00:38:54Z) - Cost-Effective Federated Learning Design [37.16466118235272]
フェデレーション学習(federated learning, fl)は、多数のデバイスが生のデータを共有することなく、協調的にモデルを学習できる分散学習パラダイムである。
その効率性と有効性にもかかわらず、反復的なオンデバイス学習プロセスは、学習時間とエネルギー消費の面でかなりのコストを伴います。
本稿では,本質的制御変数を最適に選択する適応型flの設計法を分析し,総コストを最小化し,収束性を確保した。
論文 参考訳(メタデータ) (2020-12-15T14:45:11Z) - Cost-aware Feature Selection for IoT Device Classification [6.193853963672491]
私たちは、機能抽出にはコストがあり、異なる機能に対してコストが異なると論じています。
そこで我々は,クロスエントロピー(CE)に基づく最適化手法を用いて,高速かつ効率的な解法を提案する。
論文 参考訳(メタデータ) (2020-09-02T22:16:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。