論文の概要: Cost-constrained multi-label group feature selection using shadow features
- arxiv url: http://arxiv.org/abs/2408.01851v1
- Date: Sat, 3 Aug 2024 19:31:59 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-06 18:11:11.437768
- Title: Cost-constrained multi-label group feature selection using shadow features
- Title(参考訳): シャドー特徴を用いたコスト制約付きマルチラベルグループ特徴選択
- Authors: Tomasz Klonecki, Paweł Teisseyre, Jaesung Lee,
- Abstract要約: 複数ラベル分類における特徴選択の問題について,特徴群に割り当てられたコストを考慮した検討を行った。
このタスクでは、ラベルベクトルを予測するのに有用な機能のサブセットを選択することを目的としているが、同時に、選択した機能に関連するコストは、想定される予算を超えない。
- 参考スコア(独自算出の注目度): 1.87071394890391
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: We consider the problem of feature selection in multi-label classification, considering the costs assigned to groups of features. In this task, the goal is to select a subset of features that will be useful for predicting the label vector, but at the same time, the cost associated with the selected features will not exceed the assumed budget. Solving the problem is of great importance in medicine, where we may be interested in predicting various diseases based on groups of features. The groups may be associated with parameters obtained from a certain diagnostic test, such as a blood test. Because diagnostic test costs can be very high, considering cost information when selecting relevant features becomes crucial to reducing the cost of making predictions. We focus on the feature selection method based on information theory. The proposed method consists of two steps. First, we select features sequentially while maximizing conditional mutual information until the budget is exhausted. In the second step, we select additional cost-free features, i.e., those coming from groups that have already been used in previous steps. Limiting the number of added features is possible using the stop rule based on the concept of so-called shadow features, which are randomized counterparts of the original ones. In contrast to existing approaches based on penalized criteria, in our method, we avoid the need for computationally demanding optimization of the penalty parameter. Experiments conducted on the MIMIC medical database show the effectiveness of the method, especially when the assumed budget is limited.
- Abstract(参考訳): 複数ラベル分類における特徴選択の問題について,特徴群に割り当てられたコストを考慮した検討を行った。
このタスクでは、ラベルベクトルを予測するのに有用な機能のサブセットを選択することを目的としているが、同時に、選択した機能に関連するコストは、想定される予算を超えない。
この問題の解決は医学において非常に重要であり、特徴群に基づく様々な疾患の予測に関心があるかもしれない。
これらのグループは、血液検査のような特定の診断検査から得られたパラメータに関連付けられることがある。
診断テストコストは非常に高いため、関連する特徴を選択する際のコスト情報を考慮することが、予測を行うコストを削減する上で重要である。
情報理論に基づく特徴選択手法に着目する。
提案手法は2つのステップからなる。
まず、予算が尽きるまで条件付き相互情報を最大化しながら、順次特徴を選定する。
2番目のステップでは、既存のステップで既に使用されていたグループから追加のコストフリーの機能、すなわち、それらを選択する。
いわゆるシャドウ機能の概念に基づくストップルールにより,追加機能の数を制限することが可能である。
ペナルティ化基準に基づく既存の手法とは対照的に,本手法ではペナルティパラメータの最適化を計算的に要求する必要がない。
MIMICの医療データベースで実施した実験は,特に予算が限られている場合に,本手法の有効性を示す。
関連論文リスト
- An incremental preference elicitation-based approach to learning potentially non-monotonic preferences in multi-criteria sorting [53.36437745983783]
まず最適化モデルを構築し,非単調な選好をモデル化する。
本稿では,情報量測定手法と質問選択戦略を考案し,各イテレーションにおいて最も情報に富む選択肢を特定する。
2つのインクリメンタルな選好に基づくアルゴリズムは、潜在的に単調な選好を学習するために開発された。
論文 参考訳(メタデータ) (2024-09-04T14:36:20Z) - Feature Selection as Deep Sequential Generative Learning [50.00973409680637]
本研究では, 逐次再構成, 変分, 性能評価器の損失を伴って, 深部変分変圧器モデルを構築した。
提案モデルでは,特徴選択の知識を抽出し,連続的な埋め込み空間を学習し,特徴選択決定シーケンスをユーティリティスコアに関連付けられた埋め込みベクトルにマッピングする。
論文 参考訳(メタデータ) (2024-03-06T16:31:56Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - Large Language Models Are Not Robust Multiple Choice Selectors [117.72712117510953]
複数選択質問(MCQ)は、大規模言語モデル(LLM)の評価において、一般的なが重要なタスク形式として機能する。
この研究は、現代のLLMが、その固有の「選択バイアス」によるオプション位置変化に対して脆弱であることを示している。
そこで本研究では,オプションIDに対する事前バイアスを全体予測分布から分離するPriDeという,ラベルのない推論時間脱バイアス手法を提案する。
論文 参考訳(メタデータ) (2023-09-07T17:44:56Z) - Neural Greedy Pursuit for Feature Selection [72.4121881681861]
我々は,非線形予測問題に対する$P$入力機能のうち,$N$重要な特徴を選択するための欲求アルゴリズムを提案する。
ニューラルネットワークをアルゴリズムの予測子として使用し、損失を計算します。
論文 参考訳(メタデータ) (2022-07-19T16:39:16Z) - Ensemble feature selection with data-driven thresholding for Alzheimer's
disease biomarker discovery [0.0]
この研究は複数のデータ駆動しきい値を開発し、アンサンブル機能セレクタで関連する特徴を自動的に識別する。
臨床データへのこれらの手法の適用性を実証するため、2つの現実世界のアルツハイマー病(AD)研究のデータに適用した。
論文 参考訳(メタデータ) (2022-07-05T05:50:51Z) - Budgeted Classification with Rejection: An Evolutionary Method with
Multiple Objectives [0.0]
予算付きシーケンシャル分類器(BSC)プロセスは、部分的特徴取得と評価ステップのシーケンスを通じて入力を行う。
これにより、不要な特徴取得を防止するための入力の効率的な評価が可能になる。
本稿では,信頼度に基づく拒否オプション付き逐次分類器を構築するための問題固有遺伝的アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-05-01T22:05:16Z) - Parallel feature selection based on the trace ratio criterion [4.30274561163157]
本研究は,PFSTを用いた並列特徴選択という,新しい並列特徴選択手法を提案する。
提案手法は,Fisher's Discriminant Analysisで用いられるクラス分離性の尺度であるトレース基準を用いて特徴的有用性を評価する。
実験により,本手法は,比較対象の他の手法による時間的差のごく一部で,少数の特徴セットを生成できることが確認された。
論文 参考訳(メタデータ) (2022-03-03T10:50:33Z) - Low-Cost Algorithmic Recourse for Users With Uncertain Cost Functions [74.00030431081751]
本稿では,ユーザ固有のコスト関数の概念を定式化し,ユーザのための行動可能なリコースを識別する新しい手法を提案する。
本手法は,強いベースライン法に比べて最大25.89パーセントのユーザを満足させる。
論文 参考訳(メタデータ) (2021-11-01T19:49:35Z) - Active Feature Selection for the Mutual Information Criterion [21.376800678915558]
ラベルなしデータを利用できる新しい特徴選択環境であるアクティブ特徴選択について検討する。
我々は,従来の相互情報基準を用いた特徴選択に焦点を合わせ,ラベルと最大の相互情報を持つ$k$の特徴を選択する。
アクティブな機能選択設定では、データセットのサイズよりもはるかに少ないラベルを使用することが目標であり、Emphentireデータセットに基づいたラベルとの相互情報が大きい$k$の機能を見つけることが目標である。
論文 参考訳(メタデータ) (2020-12-13T06:40:35Z) - Feature Selection Methods for Cost-Constrained Classification in Random
Forests [3.4806267677524896]
コストに敏感な特徴選択は、機能選択の問題であり、モデルに含めるための個々のコストを上昇させる。
ランダムフォレスト(Random Forests)は、機能選択において特に困難な問題を定義している。
小木構造から特徴を選択する新しい高速多変量特徴選択法であるShallow Tree Selectionを提案する。
論文 参考訳(メタデータ) (2020-08-14T11:39:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。