論文の概要: Optimizing Feature Selection for Binary Classification with Noisy
Labels: A Genetic Algorithm Approach
- arxiv url: http://arxiv.org/abs/2401.06546v1
- Date: Fri, 12 Jan 2024 12:42:26 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-15 19:33:53.968310
- Title: Optimizing Feature Selection for Binary Classification with Noisy
Labels: A Genetic Algorithm Approach
- Title(参考訳): 雑音ラベルを用いた二項分類における特徴選択の最適化:遺伝的アルゴリズムによるアプローチ
- Authors: Vandad Imani, Elaheh Moradi, Carlos Sevilla-Salcedo, Vittorio Fortino,
Jussi Tohka
- Abstract要約: 雑音ラベル付き二項分類における最適な特徴部分集合を選択するための遺伝的アルゴリズムに基づく新しい手法を提案する。
NMFS-GAは、正確かつ解釈可能な機能サブセットを選択するための統一されたフレームワークを提供する。
- 参考スコア(独自算出の注目度): 0.24735591075006394
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Feature selection in noisy label scenarios remains an understudied topic. We
propose a novel genetic algorithm-based approach, the Noise-Aware
Multi-Objective Feature Selection Genetic Algorithm (NMFS-GA), for selecting
optimal feature subsets in binary classification with noisy labels. NMFS-GA
offers a unified framework for selecting feature subsets that are both accurate
and interpretable. We evaluate NMFS-GA on synthetic datasets with label noise,
a Breast Cancer dataset enriched with noisy features, and a real-world ADNI
dataset for dementia conversion prediction. Our results indicate that NMFS-GA
can effectively select feature subsets that improve the accuracy and
interpretability of binary classifiers in scenarios with noisy labels.
- Abstract(参考訳): ノイズの多いラベルシナリオにおける機能選択は、まだ未検討のトピックである。
本稿では,雑音ラベル付きバイナリ分類における最適特徴集合を選択するための,新しい遺伝的アルゴリズムに基づくノイズ対応多目的特徴選択遺伝的アルゴリズム(nmfs-ga)を提案する。
NMFS-GAは、正確かつ解釈可能な機能サブセットを選択するための統一されたフレームワークを提供する。
nmfs-gaをラベルノイズのある合成データセット、ノイズの多い乳がんデータセット、認知症変換予測のための実世界adniデータセットで評価する。
以上の結果から,NMFS-GAは,雑音ラベル付きシナリオにおけるバイナリ分類器の精度と解釈性を向上させる機能サブセットを効果的に選択できることが示唆された。
関連論文リスト
- Dual-Decoupling Learning and Metric-Adaptive Thresholding for Semi-Supervised Multi-Label Learning [81.83013974171364]
半教師付きマルチラベル学習(SSMLL)は、正確なマルチラベルアノテーションを収集するコストを削減するために、ラベルのないデータを活用する強力なフレームワークである。
半教師付き学習とは異なり、インスタンスに含まれる複数のセマンティクスのため、SSMLLの擬似ラベルとして最も確率の高いラベルを選択することはできない。
本稿では,高品質な擬似ラベルを生成するための二重パースペクティブ手法を提案する。
論文 参考訳(メタデータ) (2024-07-26T09:33:53Z) - Feature Selection via Robust Weighted Score for High Dimensional Binary
Class-Imbalanced Gene Expression Data [1.2891210250935148]
非平衡データに対する頑健な重み付けスコア (ROWSU) は, クラス不均衡問題を用いた高次元遺伝子発現二項分類における最も識別性の高い特徴を選択するために提案される。
ROWSU法の性能を6ドルの遺伝子発現データセットで評価した。
論文 参考訳(メタデータ) (2024-01-23T11:22:03Z) - Towards Automated Imbalanced Learning with Deep Hierarchical
Reinforcement Learning [57.163525407022966]
不均衡学習はデータマイニングにおいて基本的な課題であり、各クラスにトレーニングサンプルの不均等な比率が存在する。
オーバーサンプリングは、少数民族のための合成サンプルを生成することによって、不均衡な学習に取り組む効果的な手法である。
我々は,異なるレベルの意思決定を共同で最適化できる自動オーバーサンプリングアルゴリズムであるAutoSMOTEを提案する。
論文 参考訳(メタデータ) (2022-08-26T04:28:01Z) - Fair Feature Subset Selection using Multiobjective Genetic Algorithm [0.0]
フェアネスと精度を両立させる特徴部分選択手法を提案する。
モデル性能の指標としてF1-Scoreを用いる。
最も一般的なフェアネスベンチマークデータセットの実験では、進化的アルゴリズムを用いることで、フェアネスと精度のトレードオフを効果的に探索できることが示されている。
論文 参考訳(メタデータ) (2022-04-30T22:51:19Z) - S3: Supervised Self-supervised Learning under Label Noise [53.02249460567745]
本稿では,ラベルノイズの存在下での分類の問題に対処する。
提案手法の核心は,サンプルのアノテートラベルと特徴空間内のその近傍のラベルの分布との整合性に依存するサンプル選択機構である。
提案手法は,CIFARCIFAR100とWebVisionやANIMAL-10Nなどの実環境ノイズデータセットの両方で,従来の手法をはるかに上回っている。
論文 参考訳(メタデータ) (2021-11-22T15:49:20Z) - Gated recurrent units and temporal convolutional network for multilabel
classification [122.84638446560663]
本研究は,マルチラベル分類を管理するための新しいアンサンブル手法を提案する。
提案手法のコアは,Adamグラデーション最適化アプローチの変種で訓練された,ゲート再帰単位と時間畳み込みニューラルネットワークの組み合わせである。
論文 参考訳(メタデータ) (2021-10-09T00:00:16Z) - Group-aware Label Transfer for Domain Adaptive Person Re-identification [179.816105255584]
Unsupervised Adaptive Domain (UDA) Person Re-identification (ReID) は、ラベル付きソースドメインデータセットで訓練されたモデルを、さらなるアノテーションなしでターゲットドメインデータセットに適応することを目的としている。
最も成功したUDA-ReIDアプローチは、クラスタリングに基づく擬似ラベル予測と表現学習を組み合わせて、2つのステップを交互に実行する。
疑似ラベル予測と表現学習のオンラインインタラクションと相互促進を可能にするグループ認識ラベル転送(GLT)アルゴリズムを提案します。
論文 参考訳(メタデータ) (2021-03-23T07:57:39Z) - Optimizing Speech Emotion Recognition using Manta-Ray Based Feature
Selection [1.4502611532302039]
既存の特徴抽出手法を用いて抽出した特徴の連結により,分類精度が向上することを示す。
また,音声感情認識タスクにおけるマンタレイ最適化の新たな応用を行い,その結果を得た。
論文 参考訳(メタデータ) (2020-09-18T16:09:34Z) - SPL-MLL: Selecting Predictable Landmarks for Multi-Label Learning [87.27700889147144]
我々は、入力(予測可能)に応じて予測しやすく、他の可能なラベル(表現可能)をうまく回復できるランドマークとして、ラベルの小さなサブセットを選択することを提案する。
我々は,ADM(Alternating Direction Method)を用いてこの問題を解決する。実世界のデータセットに関する実証研究により,本手法が他の最先端手法よりも優れた分類性能を実現することを示す。
論文 参考訳(メタデータ) (2020-08-16T11:07:44Z) - A Novel Community Detection Based Genetic Algorithm for Feature
Selection [3.8848561367220276]
著者らは3つのステップで機能するコミュニティ検出に基づく遺伝的アルゴリズムを提案する。
提案手法の性能から,9つのベンチマーク分類問題を解析した。
論文 参考訳(メタデータ) (2020-08-08T15:39:30Z) - Atom Search Optimization with Simulated Annealing -- a Hybrid
Metaheuristic Approach for Feature Selection [29.765647724007827]
ハイブリッドメタヒューリスティックス(Hybrid meta-heuristics)は、最適化と特徴選択(FS)分野における最も興味深いトレンドの1つである。
我々は、ASO-SA(Atom Search Optimization)のバイナリ版と、FSのためのASO-SA(ASO-SA)技術と呼ばれるSimulated Annealing(Simulated Annealing)によるハイブリッドを提案した。
提案手法は, UCI, Handwriting digit recognition, Text, non-text separation, Facial emotion Recognitionの4つのカテゴリから25のデータセットに対して適用した。
論文 参考訳(メタデータ) (2020-05-10T07:56:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。