論文の概要: Implications on Feature Detection when using the Benefit-Cost Ratio
- arxiv url: http://arxiv.org/abs/2008.05163v2
- Date: Sat, 15 Aug 2020 16:30:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-31 04:47:08.155672
- Title: Implications on Feature Detection when using the Benefit-Cost Ratio
- Title(参考訳): Benefit-Cost比を用いた特徴検出の意義
- Authors: Rudolf Jagdhuber and J\"org Rahnenf\"uhrer
- Abstract要約: 一般的なトレードオフ選択は、両者の比率であるBCR(benefit-cost ratio)である。
大きなコスト差と小さな効果の大きさの状況では、BCRは関連する特徴を欠き、安価なノイズ特徴を好んだ。
単純な利益-コスト比は、コストを組み込むための簡単なソリューションを提供するが、リスクを認識しておくことが重要です。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In many practical machine learning applications, there are two objectives:
one is to maximize predictive accuracy and the other is to minimize costs of
the resulting model. These costs of individual features may be financial costs,
but can also refer to other aspects, like for example evaluation time. Feature
selection addresses both objectives, as it reduces the number of features and
can improve the generalization ability of the model. If costs differ between
features, the feature selection needs to trade-off the individual benefit and
cost of each feature. A popular trade-off choice is the ratio of both, the BCR
(benefit-cost ratio). In this paper we analyze implications of using this
measure with special focus to the ability to distinguish relevant features from
noise. We perform a simulation study for different cost and data settings and
obtain detection rates of relevant features and empirical distributions of the
trade-off ratio. Our simulation study exposed a clear impact of the cost
setting on the detection rate. In situations with large cost differences and
small effect sizes, the BCR missed relevant features and preferred cheap noise
features. We conclude that a trade-off between predictive performance and costs
without a controlling hyperparameter can easily overemphasize very cheap noise
features. While the simple benefit-cost ratio offers an easy solution to
incorporate costs, it is important to be aware of its risks. Avoiding costs
close to 0, rescaling large cost differences, or using a hyperparameter
trade-off are ways to counteract the adverse effects exposed in this paper.
- Abstract(参考訳): 多くの実用的な機械学習アプリケーションには、予測精度を最大化することと、結果モデルのコストを最小限にすることの2つの目的がある。
個々の特徴のこれらのコストは金銭的なコストであるが、例えば評価時間など他の側面も参照できる。
特徴選択は、特徴の数を減らし、モデルの一般化能力を向上させるため、両方の目的に対処する。
機能間でコストが違う場合、機能の選択は各機能の個々の利益とコストをトレードオフする必要があります。
一般的なトレードオフ選択は、両者の比率であるBCR(benefit-cost ratio)である。
本稿では,ノイズと関連する特徴を識別する能力に特化して,この尺度を用いることの意味を分析する。
コストとデータ設定の異なる場合のシミュレーション研究を行い、関連する特徴の検出率とトレードオフ比の経験的分布を求める。
シミュレーションにより,コスト設定が検出率に与える影響を明らかにした。
大きなコスト差と小さな効果の大きさの状況では、BCRは関連する特徴を欠き、安価なノイズ特徴を好んだ。
ハイパーパラメータを制御せずとも予測性能とコストのトレードオフは、非常に安価にノイズを強調しやすくなると結論づけた。
単純な利益-コスト比は、コストを組み込むための簡単なソリューションを提供するが、リスクを認識しておくことが重要です。
コストを0に近づいたり、大きなコスト差を再スケーリングしたり、ハイパーパラメータトレードオフを使用したりすることは、この論文で明らかになった悪影響を対処する方法である。
関連論文リスト
- Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - Efficient Sentiment Analysis: A Resource-Aware Evaluation of Feature
Extraction Techniques, Ensembling, and Deep Learning Models [0.0]
我々は,資源コストに着目した文書レベルの感情分析モデルを評価する。
より小さなデータセットでは,資源消費の差が大きくなるにつれて精度の差が小さくなることがわかった。
論文 参考訳(メタデータ) (2023-08-03T20:29:27Z) - Value function estimation using conditional diffusion models for control [62.27184818047923]
拡散値関数(DVF)と呼ばれる単純なアルゴリズムを提案する。
拡散モデルを用いて環境-ロボット相互作用の連成多段階モデルを学ぶ。
本稿では,DVFを用いて複数のコントローラの状態を効率よく把握する方法を示す。
論文 参考訳(メタデータ) (2023-06-09T18:40:55Z) - Rethinking Cost-sensitive Classification in Deep Learning via
Adversarial Data Augmentation [4.479834103607382]
コストに敏感な分類は、誤分類エラーがコストで大きく異なるアプリケーションにおいて重要である。
本稿では,過度パラメータ化モデルにコスト感受性を持たせるために,コスト依存型逆データ拡張フレームワークを提案する。
提案手法は,全体のコストを効果的に最小化し,臨界誤差を低減するとともに,全体的な精度で同等の性能を達成できる。
論文 参考訳(メタデータ) (2022-08-24T19:00:30Z) - Error-based Knockoffs Inference for Controlled Feature Selection [49.99321384855201]
本手法では, ノックオフ特徴量, エラーベース特徴重要度統計量, ステップダウン手順を一体化して, エラーベースのノックオフ推定手法を提案する。
提案手法では回帰モデルを指定する必要はなく,理論的保証で特徴選択を処理できる。
論文 参考訳(メタデータ) (2022-03-09T01:55:59Z) - Low-Cost Algorithmic Recourse for Users With Uncertain Cost Functions [74.00030431081751]
本稿では,ユーザ固有のコスト関数の概念を定式化し,ユーザのための行動可能なリコースを識別する新しい手法を提案する。
本手法は,強いベースライン法に比べて最大25.89パーセントのユーザを満足させる。
論文 参考訳(メタデータ) (2021-11-01T19:49:35Z) - The Efficiency Misnomer [50.69516433266469]
我々は、共通のコスト指標、それらの利点とデメリット、そしてそれらが相互に矛盾する方法について論じる。
コストインジケータの不完全な報告が、どのようにして部分的な結論をもたらすかを示し、異なるモデルの実践的考察の曖昧さや不完全さを図示する。
論文 参考訳(メタデータ) (2021-10-25T12:48:07Z) - Instance-optimality in optimal value estimation: Adaptivity via
variance-reduced Q-learning [99.34907092347733]
本稿では,マルコフ決定過程における最適な$Q$値関数を離散状態と動作で推定する問題を解析する。
局所的なミニマックスフレームワークを用いて、この関数は任意の推定手順の精度の低い境界に現れることを示す。
他方,Q$ラーニングの分散還元版を解析することにより,状態と行動空間の対数的要因まで,下位境界のシャープさを確立する。
論文 参考訳(メタデータ) (2021-06-28T00:38:54Z) - Cost-Effective Federated Learning Design [37.16466118235272]
フェデレーション学習(federated learning, fl)は、多数のデバイスが生のデータを共有することなく、協調的にモデルを学習できる分散学習パラダイムである。
その効率性と有効性にもかかわらず、反復的なオンデバイス学習プロセスは、学習時間とエネルギー消費の面でかなりのコストを伴います。
本稿では,本質的制御変数を最適に選択する適応型flの設計法を分析し,総コストを最小化し,収束性を確保した。
論文 参考訳(メタデータ) (2020-12-15T14:45:11Z) - Pareto-efficient Acquisition Functions for Cost-Aware Bayesian
Optimization [5.459427541271035]
ブラックボックス関数に対するコスト対応ベイズ最適化について述べる。
144個の実世界のブラックボックス関数最適化問題に対して、我々のソリューションは50%のスピードアップをもたらす。
また、ガウスのプロセスコストモデルに対する一般的な選択を再考し、単純で低分散のコストモデルがトレーニング時間を効果的に予測することを示した。
論文 参考訳(メタデータ) (2020-11-23T15:06:07Z) - Cost-aware Feature Selection for IoT Device Classification [6.193853963672491]
私たちは、機能抽出にはコストがあり、異なる機能に対してコストが異なると論じています。
そこで我々は,クロスエントロピー(CE)に基づく最適化手法を用いて,高速かつ効率的な解法を提案する。
論文 参考訳(メタデータ) (2020-09-02T22:16:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。