論文の概要: Feature Selection Based on Wasserstein Distance
- arxiv url: http://arxiv.org/abs/2411.07217v2
- Date: Tue, 12 Nov 2024 06:14:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-13 13:20:55.248394
- Title: Feature Selection Based on Wasserstein Distance
- Title(参考訳): Wasserstein距離に基づく特徴選択
- Authors: Fuwei Li,
- Abstract要約: 本稿では,ワッサースタイン距離を利用した特徴選択手法を提案する。
我々の手法はワッサースタイン距離を用いて特徴の類似性を評価し、本質的にクラス関係を捉え、うるさいラベルに頑健にする。
分析の結果,ワッサースタイン距離に基づく特徴選択法は,特定の雑音モデルに依存することなく,ノイズラベルの影響を効果的に低減できることがわかった。
- 参考スコア(独自算出の注目度): 1.450405446885067
- License:
- Abstract: This paper presents a novel feature selection method leveraging the Wasserstein distance to improve feature selection in machine learning. Unlike traditional methods based on correlation or Kullback-Leibler (KL) divergence, our approach uses the Wasserstein distance to assess feature similarity, inherently capturing class relationships and making it robust to noisy labels. We introduce a Markov blanket-based feature selection algorithm and demonstrate its effectiveness. Our analysis shows that the Wasserstein distance-based feature selection method effectively reduces the impact of noisy labels without relying on specific noise models. We provide a lower bound on its effectiveness, which remains meaningful even in the presence of noise. Experimental results across multiple datasets demonstrate that our approach consistently outperforms traditional methods, particularly in noisy settings.
- Abstract(参考訳): 本稿では,ワッサースタイン距離を利用した特徴選択手法を提案する。
相関やKL(Kulback-Leibler)の発散に基づく従来の手法とは異なり、我々の手法はワッサーシュタイン距離を用いて特徴的類似性を評価し、本質的にクラス関係を捉え、ノイズの多いラベルに頑健にする。
マルコフ毛布を用いた特徴選択アルゴリズムを導入し,その有効性を実証する。
分析の結果,ワッサースタイン距離に基づく特徴選択法は,特定の雑音モデルに依存することなく,ノイズラベルの影響を効果的に低減できることがわかった。
ノイズの存在下でも有意義な有効性は低く抑えられる。
複数のデータセットにまたがる実験結果から、我々のアプローチは従来の手法、特にノイズの多い設定よりも一貫して優れています。
関連論文リスト
- Extracting Clean and Balanced Subset for Noisy Long-tailed Classification [66.47809135771698]
そこで我々は,分布マッチングの観点から,クラスプロトタイプを用いた新しい擬似ラベリング手法を開発した。
手動で特定の確率尺度を設定することで、ノイズと長い尾を持つデータの副作用を同時に減らすことができる。
本手法は, クリーンなラベル付きクラスバランスサブセットを抽出し, ラベルノイズ付きロングテール分類において, 効果的な性能向上を実現する。
論文 参考訳(メタデータ) (2024-04-10T07:34:37Z) - Skeleton-Based Human Action Recognition with Noisy Labels [43.58994208412764]
ラベルノイズはモデルのトレーニングに悪影響を及ぼし、認識品質が低下する。
NoiseEraSARは、グローバルなサンプル選択、コティーチング、クロスモーダル・ミックス・オブ・エキスパート戦略を統合している。
提案手法は,確立されたベンチマークの性能向上を実証し,新しい最先端標準を設定した。
論文 参考訳(メタデータ) (2024-03-15T02:42:28Z) - Towards stable real-world equation discovery with assessing
differentiating quality influence [52.2980614912553]
一般的に用いられる有限差分法に代わる方法を提案する。
我々は,これらの手法を実問題と類似した問題に適用可能であること,および方程式発見アルゴリズムの収束性を確保する能力の観点から評価する。
論文 参考訳(メタデータ) (2023-11-09T23:32:06Z) - Bandit-Driven Batch Selection for Robust Learning under Label Noise [20.202806541218944]
本稿では,SGD(Gradient Descent)トレーニングにおけるバッチ選択のための新しい手法を提案する。
本手法は,ラベルノイズの存在下での学習過程の最適化に重点を置いている。
論文 参考訳(メタデータ) (2023-10-31T19:19:01Z) - Combating Label Noise With A General Surrogate Model For Sample
Selection [84.61367781175984]
本稿では,視覚言語サロゲートモデルCLIPを用いて,雑音の多いサンプルを自動的にフィルタリングする手法を提案する。
提案手法の有効性を実世界および合成ノイズデータセットで検証した。
論文 参考訳(メタデータ) (2023-10-16T14:43:27Z) - Score-based Source Separation with Applications to Digital Communication
Signals [72.6570125649502]
拡散モデルを用いた重畳音源の分離手法を提案する。
高周波(RF)システムへの応用によって、我々は、基礎となる離散的な性質を持つ情報源に興味を持っている。
提案手法は,最近提案されたスコア蒸留サンプリング方式のマルチソース拡張と見なすことができる。
論文 参考訳(メタデータ) (2023-06-26T04:12:40Z) - Robust Meta-learning with Sampling Noise and Label Noise via
Eigen-Reptile [78.1212767880785]
Meta-learnerは、利用可能なサンプルがわずかしかないため、過度に適合する傾向がある。
ノイズの多いラベルでデータを扱う場合、メタラーナーはラベルノイズに対して非常に敏感になる可能性がある。
本稿では,タスク固有のパラメータの主要な方向でメタパラメータを更新するEigen-Reptile(ER)を提案する。
論文 参考訳(メタデータ) (2022-06-04T08:48:02Z) - UNICON: Combating Label Noise Through Uniform Selection and Contrastive
Learning [89.56465237941013]
UNICONは,高ラベル雑音に対して頑健な,シンプルで効果的なサンプル選択法である。
90%のノイズレートでCIFAR100データセットの最先端データよりも11.4%改善した。
論文 参考訳(メタデータ) (2022-03-28T07:36:36Z) - Optimizing Speech Emotion Recognition using Manta-Ray Based Feature
Selection [1.4502611532302039]
既存の特徴抽出手法を用いて抽出した特徴の連結により,分類精度が向上することを示す。
また,音声感情認識タスクにおけるマンタレイ最適化の新たな応用を行い,その結果を得た。
論文 参考訳(メタデータ) (2020-09-18T16:09:34Z) - Differentiable Unsupervised Feature Selection based on a Gated Laplacian [7.970954821067042]
本稿では,低周波特徴を優先するラプラシアンスコアと,特徴選択のためのゲーティング機構を組み合わせた識別可能な損失関数を提案する。
我々は,提案手法を数学的に動機付け,高雑音条件下では,全特徴集合ではなく,ゲート入力上でラプラシアンを計算することが重要であることを示す。
論文 参考訳(メタデータ) (2020-07-09T11:58:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。