論文の概要: Marginal Laplacian Score
- arxiv url: http://arxiv.org/abs/2311.17795v2
- Date: Fri, 2 Feb 2024 08:06:51 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-05 19:17:52.022092
- Title: Marginal Laplacian Score
- Title(参考訳): 辺縁ラプラシアンスコア
- Authors: Guy Hay and Ohad Volk
- Abstract要約: 不均衡なデータに対処するために、Marginal Laplacian Score (MLS)を導入します。
MLSはデータセットのマージンの局所的な構造を維持することを目的としている。
本稿では,ラプラシアンスコアを用いた最新の特徴選択手法への統合を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: High-dimensional imbalanced data poses a machine learning challenge. In the
absence of sufficient or high-quality labels, unsupervised feature selection
methods are crucial for the success of subsequent algorithms. Therefore, we
introduce a Marginal Laplacian Score (MLS), a modification of the well known
Laplacian Score (LS) tailored to better address imbalanced data. We introduce
an assumption that the minority class or anomalous appear more frequently in
the margin of the features. Consequently, MLS aims to preserve the local
structure of the dataset's margin. We propose its integration into modern
feature selection methods that utilize the Laplacian score. We integrate the
MLS algorithm into the Differentiable Unsupervised Feature Selection (DUFS),
resulting in DUFS-MLS. The proposed methods demonstrate robust and improved
performance on synthetic and public datasets.
- Abstract(参考訳): 高次元の不均衡データは機械学習に挑戦する。
十分なラベルや高品質のラベルがない場合、教師なしの機能選択手法はその後のアルゴリズムの成功に不可欠である。
そこで我々は,不均衡なデータに対処するために,よく知られたラプラシアンスコア (LS) の修正であるMarginal Laplacian Score (MLS) を導入する。
マイノリティクラスや異常が特徴の限界で頻繁に現れるという仮定を導入する。
その結果、MLSはデータセットのマージンの局所的な構造を維持することを目指している。
ラプラシアンスコアを利用した現代特徴選択手法への統合を提案する。
我々は、MLSアルゴリズムを微分不可能な特徴選択(DUFS)に統合し、DUFS-MLSを生成する。
提案手法は,合成および公開データセットにおけるロバストで改良された性能を示す。
関連論文リスト
- CalibraEval: Calibrating Prediction Distribution to Mitigate Selection Bias in LLMs-as-Judges [21.580762639442913]
推論中に選択バイアスを緩和する新しいラベルフリー手法であるCalibraEvalを紹介する。
CalibraEvalは、バイアスのない予測分布に合わせて観測された予測分布を調整するための最適化タスクとしてデバイアスを再構成する。
本稿では,CalibraEvalが選択バイアスを効果的に軽減し,既存のデバイアス法と比較して性能を向上させることを示す。
論文 参考訳(メタデータ) (2024-10-20T13:47:39Z) - Generalizing Few Data to Unseen Domains Flexibly Based on Label Smoothing Integrated with Distributionally Robust Optimization [0.9374652839580183]
大規模なデータセットにディープニューラルネットワーク(DNN)を適用する場合、一般的にオーバーフィッティングが発生する。
ラベル平滑化 (LS) は, 1ホットラベルと一様ラベルベクトルを混合することにより, オーバーフィッティングを防止する効果的な正規化手法である。
本稿では、LSに分散ロバスト最適化(DRO)を導入し、既存のデータ分布を柔軟に未確認領域にシフトさせる。
論文 参考訳(メタデータ) (2024-08-09T14:13:33Z) - Generalized Semi-Supervised Learning via Self-Supervised Feature Adaptation [87.17768598044427]
従来の半教師付き学習は、ラベル付きデータとラベルなしデータの特徴分布が一貫したものであると仮定する。
本稿では,ラベル付きおよびラベルなしデータの分散によるSSL性能向上のための汎用フレームワークであるセルフ・スーパービジョン・フィーチャー・アダプテーション(SSFA)を提案する。
提案するSSFAは擬似ラベルベースのSSL学習者に適用可能であり,ラベル付き,ラベルなし,さらには目に見えない分布における性能を著しく向上させる。
論文 参考訳(メタデータ) (2024-05-31T03:13:45Z) - Dirichlet-Based Prediction Calibration for Learning with Noisy Labels [40.78497779769083]
雑音ラベルによる学習はディープニューラルネットワーク(DNN)の一般化性能を著しく損なう
既存のアプローチでは、損失補正やサンプル選択手法によってこの問題に対処している。
そこで我々は,textitDirichlet-based Prediction (DPC) 法を解法として提案する。
論文 参考訳(メタデータ) (2024-01-13T12:33:04Z) - Tackling Diverse Minorities in Imbalanced Classification [80.78227787608714]
不均衡データセットは、様々な現実世界のアプリケーションで一般的に見られ、分類器の訓練において重要な課題が提示されている。
マイノリティクラスとマイノリティクラスの両方のデータサンプルを混合することにより、反復的に合成サンプルを生成することを提案する。
提案するフレームワークの有効性を,7つの公開ベンチマークデータセットを用いて広範な実験により実証する。
論文 参考訳(メタデータ) (2023-08-28T18:48:34Z) - Complementing Semi-Supervised Learning with Uncertainty Quantification [6.612035830987296]
そこで本研究では,アレータ性およびてんかん性不確実性定量化に依存する,教師なし不確実性認識の新たな目的を提案する。
CIFAR-100やMini-ImageNetのような複雑なデータセットでは,結果が最先端の成果よりも優れています。
論文 参考訳(メタデータ) (2022-07-22T00:15:02Z) - A Unified Joint Maximum Mean Discrepancy for Domain Adaptation [73.44809425486767]
本論文は,最適化が容易なjmmdの統一形式を理論的に導出する。
統合JMMDから、JMMDは分類に有利な特徴ラベル依存を低下させることを示す。
本稿では,その依存を促進する新たなmmd行列を提案し,ラベル分布シフトにロバストな新しいラベルカーネルを考案する。
論文 参考訳(メタデータ) (2021-01-25T09:46:14Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Revisiting LSTM Networks for Semi-Supervised Text Classification via
Mixed Objective Function [106.69643619725652]
我々は,単純なBiLSTMモデルであっても,クロスエントロピー損失でトレーニングした場合に,競争的な結果が得られるようなトレーニング戦略を開発する。
いくつかのベンチマークデータセット上で,テキスト分類タスクの最先端結果について報告する。
論文 参考訳(メタデータ) (2020-09-08T21:55:22Z) - Least Squares Regression with Markovian Data: Fundamental Limits and
Algorithms [69.45237691598774]
マルコフ連鎖からデータポイントが依存しサンプリングされる最小二乗線形回帰問題について検討する。
この問題を$tau_mathsfmix$という観点から、鋭い情報理論のミニマックス下限を確立する。
本稿では,経験的リプレイに基づくアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-16T04:26:50Z) - Robust Locality-Aware Regression for Labeled Data Classification [5.432221650286726]
本稿では,ロバスト局所性認識回帰(RLAR)という特徴抽出フレームワークを提案する。
本モデルでは,クラス間の平均差を使わずに,適応的に境界表現学習を行うために再ターゲット回帰を導入する。
外れ値の乱れを緩和し、過度な適合を防止するため、L2,1ノルムによる正規化項とともに回帰項と局所性を考慮した項を計測する。
論文 参考訳(メタデータ) (2020-06-15T11:36:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。