論文の概要: Feature Selection Based on Wasserstein Distance
- arxiv url: http://arxiv.org/abs/2411.07217v3
- Date: Wed, 13 Nov 2024 23:09:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-15 11:44:46.044858
- Title: Feature Selection Based on Wasserstein Distance
- Title(参考訳): Wasserstein距離に基づく特徴選択
- Authors: Fuwei Li,
- Abstract要約: 本稿では,ワッサースタイン距離を利用した特徴選択手法を提案する。
我々の手法はワッサースタイン距離を用いて特徴の類似性を評価し、本質的にクラス関係を捉え、うるさいラベルに頑健にする。
分析の結果,ワッサースタイン距離に基づく特徴選択法は,特定の雑音モデルに依存することなく,ノイズラベルの影響を効果的に低減できることがわかった。
- 参考スコア(独自算出の注目度): 1.450405446885067
- License:
- Abstract: This paper presents a novel feature selection method leveraging the Wasserstein distance to improve feature selection in machine learning. Unlike traditional methods based on correlation or Kullback-Leibler (KL) divergence, our approach uses the Wasserstein distance to assess feature similarity, inherently capturing class relationships and making it robust to noisy labels. We introduce a Markov blanket-based feature selection algorithm and demonstrate its effectiveness. Our analysis shows that the Wasserstein distance-based feature selection method effectively reduces the impact of noisy labels without relying on specific noise models. We provide a lower bound on its effectiveness, which remains meaningful even in the presence of noise. Experimental results across multiple datasets demonstrate that our approach consistently outperforms traditional methods, particularly in noisy settings.
- Abstract(参考訳): 本稿では,ワッサースタイン距離を利用した特徴選択手法を提案する。
相関やKL(Kulback-Leibler)の発散に基づく従来の手法とは異なり、我々の手法はワッサーシュタイン距離を用いて特徴的類似性を評価し、本質的にクラス関係を捉え、ノイズの多いラベルに頑健にする。
マルコフ毛布を用いた特徴選択アルゴリズムを導入し,その有効性を実証する。
分析の結果,ワッサースタイン距離に基づく特徴選択法は,特定の雑音モデルに依存することなく,ノイズラベルの影響を効果的に低減できることがわかった。
ノイズの存在下でも有意義な有効性は低く抑えられる。
複数のデータセットにまたがる実験結果から、我々のアプローチは従来の手法、特にノイズの多い設定よりも一貫して優れています。
関連論文リスト
- Feature Selection Based on Orthogonal Constraints and Polygon Area [10.587608254638667]
特徴選択の目的は、各特徴の重要性を評価することにより、認識タスクにおける特徴の最適なサブセットを選択することである。
本稿では,特徴ラベルを拡張した依存関係間の非単調線形探索を提案する。
実験結果から,本手法は識別依存を効果的にとらえるだけでなく,次元分類性能を低下させる従来の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-02-25T08:20:05Z) - Feature Selection via Maximizing Distances between Class Conditional
Distributions [9.596923373834093]
積分確率測定(IPMs)により測定されたクラス条件分布間の距離に基づく新しい特徴選択フレームワークを提案する。
本フレームワークは, 教師付き分類のための分布感覚における特徴の識別的情報を直接探索する。
実験により,本フレームワークは,摂動に対する分類精度とロバスト性の観点から,最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2024-01-15T06:10:10Z) - A Contrast Based Feature Selection Algorithm for High-dimensional Data
set in Machine Learning [9.596923373834093]
本稿では,異なるクラス間で示される相違点に基づいて識別的特徴を抽出する新しいフィルタ特徴選択手法であるContrastFSを提案する。
提案手法の有効性と有効性について検証し,提案手法が無視可能な計算で良好に動作することを示す。
論文 参考訳(メタデータ) (2024-01-15T05:32:35Z) - Towards stable real-world equation discovery with assessing
differentiating quality influence [52.2980614912553]
一般的に用いられる有限差分法に代わる方法を提案する。
我々は,これらの手法を実問題と類似した問題に適用可能であること,および方程式発見アルゴリズムの収束性を確保する能力の観点から評価する。
論文 参考訳(メタデータ) (2023-11-09T23:32:06Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - Robust Outlier Rejection for 3D Registration with Variational Bayes [70.98659381852787]
我々は、ロバストアライメントのための新しい変分非局所ネットワークベース外乱除去フレームワークを開発した。
そこで本稿では, 投票に基づく不整合探索手法を提案し, 変換推定のための高品質な仮説的不整合をクラスタリングする。
論文 参考訳(メタデータ) (2023-04-04T03:48:56Z) - Compactness Score: A Fast Filter Method for Unsupervised Feature
Selection [66.84571085643928]
本稿では,CSUFS (Compactness Score) と呼ばれる高速な教師なし特徴選択手法を提案する。
提案アルゴリズムは既存のアルゴリズムよりも正確で効率的である。
論文 参考訳(メタデータ) (2022-01-31T13:01:37Z) - Learning Conditional Invariance through Cycle Consistency [60.85059977904014]
本稿では,データセットの変動の有意義な要因と独立な要因を識別する新しい手法を提案する。
提案手法は,対象プロパティと残りの入力情報に対する2つの別個の潜在部分空間を含む。
我々は,より意味のある因子を同定し,よりスペーサーや解釈可能なモデルに導く合成および分子データについて実証する。
論文 参考訳(メタデータ) (2021-11-25T17:33:12Z) - Post-selection inference with HSIC-Lasso [19.928884107444908]
本稿では,多面体補題と混在するガウスの枠組みを用いた選択的推論手法を提案する。
次に,計算コストの低いアルゴリズムを開発し,正規化パラメータの選択を行う。
提案手法の性能は, 実世界のデータベース実験と実世界のデータベース実験の両方で説明され, サンプルサイズが小さい場合でも, タイプI誤差の厳密な制御を強調した。
論文 参考訳(メタデータ) (2020-10-29T15:10:21Z) - Differentiable Unsupervised Feature Selection based on a Gated Laplacian [7.970954821067042]
本稿では,低周波特徴を優先するラプラシアンスコアと,特徴選択のためのゲーティング機構を組み合わせた識別可能な損失関数を提案する。
我々は,提案手法を数学的に動機付け,高雑音条件下では,全特徴集合ではなく,ゲート入力上でラプラシアンを計算することが重要であることを示す。
論文 参考訳(メタデータ) (2020-07-09T11:58:16Z) - Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking
Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。
学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。
本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-15T10:08:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。