論文の概要: Beyond Images: Label Noise Transition Matrix Estimation for Tasks with
Lower-Quality Features
- arxiv url: http://arxiv.org/abs/2202.01273v1
- Date: Wed, 2 Feb 2022 20:36:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-04 13:52:10.125082
- Title: Beyond Images: Label Noise Transition Matrix Estimation for Tasks with
Lower-Quality Features
- Title(参考訳): beyond images:低品質なタスクに対するラベルノイズ遷移行列の推定
- Authors: Zhaowei Zhu, Jialu Wang, Yang Liu
- Abstract要約: そこで我々は,低品質特徴の低情報部分の重み付けに対する実践的な情報理論的アプローチを提案する。
我々は,有望な$f$ミューチュアル情報尺度が,ノイズラベルを用いて計算した場合の順序をよく保持できることを証明した。
- 参考スコア(独自算出の注目度): 13.659465403114766
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The label noise transition matrix, denoting the transition probabilities from
clean labels to noisy labels, is crucial knowledge for designing statistically
robust solutions. Existing estimators for noise transition matrices, e.g.,
using either anchor points or clusterability, focus on computer vision tasks
that are relatively easier to obtain high-quality representations. However, for
other tasks with lower-quality features, the uninformative variables may
obscure the useful counterpart and make anchor-point or clusterability
conditions hard to satisfy. We empirically observe the failures of these
approaches on a number of commonly used datasets. In this paper, to handle this
issue, we propose a generally practical information-theoretic approach to
down-weight the less informative parts of the lower-quality features. The
salient technical challenge is to compute the relevant information-theoretical
metrics using only noisy labels instead of clean ones. We prove that the
celebrated $f$-mutual information measure can often preserve the order when
calculated using noisy labels. The necessity and effectiveness of the proposed
method is also demonstrated by evaluating the estimation error on a varied set
of tabular data and text classification tasks with lower-quality features. Code
is available at github.com/UCSC-REAL/Est-T-MI.
- Abstract(参考訳): クリーンラベルからノイズラベルへの遷移確率を表すラベルノイズ遷移行列は、統計的に堅牢な解を設計するための重要な知識である。
雑音遷移行列の既存の推定器、例えばアンカー点またはクラスタ性を用いて、高品質表現を得るのが比較的容易なコンピュータビジョンタスクに焦点を当てている。
しかし、低品質の機能を持つ他のタスクでは、非形式変数は有用な変数を曖昧にし、アンカーポイントやクラスタビリティの条件を満たすのが困難になる。
我々は、これらのアプローチの失敗を、よく使われるデータセットで実証的に観察する。
本稿では,この課題に対処するために,低品質特徴の低情報部分の重み付けを行う,汎用的な情報理論手法を提案する。
健全な技術的課題は、クリーンなラベルの代わりにノイズのあるラベルのみを使用して関連する情報理論メトリクスを計算することである。
我々は,有望な$f$ミューチュアル情報尺度が,ノイズラベルを用いて計算された順序を保存できることを証明した。
また,様々な表データおよびテキスト分類タスクにおける推定誤差を低品質で評価し,提案手法の必要性と有効性を示した。
コードはgithub.com/UCSC-REAL/Est-T-MIで入手できる。
関連論文リスト
- Multi-Label Noise Transition Matrix Estimation with Label Correlations:
Theory and Algorithm [73.94839250910977]
ノイズの多いマルチラベル学習は、大規模な正確なラベルの収集によって生じる課題により、注目を集めている。
遷移行列の導入は、マルチラベルノイズをモデル化し、統計的に一貫したアルゴリズムの開発に役立つ。
そこで本稿では, アンカーポイントを必要とせずに, ラベル相関を利用した新しい推定器を提案する。
論文 参考訳(メタデータ) (2023-09-22T08:35:38Z) - Rethinking the Value of Labels for Instance-Dependent Label Noise
Learning [43.481591776038144]
実世界のアプリケーションにおけるノイズの多いラベルは、しばしば真のラベルと機能の両方に依存します。
本研究では、ノイズ遷移行列を明示的にモデル化しない新しい深層生成モデルを用いて、インスタンス依存ラベルノイズに対処する。
提案アルゴリズムは,カジュアルな表現学習を活用し,データから高レベルのコンテンツとスタイルの潜伏要素を同時に識別する。
論文 参考訳(メタデータ) (2023-05-10T15:29:07Z) - Improved Adaptive Algorithm for Scalable Active Learning with Weak
Labeler [89.27610526884496]
Weak Labeler Active Cover (WL-AC)は、要求される精度を維持しながら、クエリの複雑さを低減するために、低品質の弱いラベルを堅牢に活用することができる。
受動学習と同一の精度を維持しつつラベル数を著しく削減し, 劣化したMNISTデータセット上での有効性を示す。
論文 参考訳(メタデータ) (2022-11-04T02:52:54Z) - Robust Meta-learning with Sampling Noise and Label Noise via
Eigen-Reptile [78.1212767880785]
Meta-learnerは、利用可能なサンプルがわずかしかないため、過度に適合する傾向がある。
ノイズの多いラベルでデータを扱う場合、メタラーナーはラベルノイズに対して非常に敏感になる可能性がある。
本稿では,タスク固有のパラメータの主要な方向でメタパラメータを更新するEigen-Reptile(ER)を提案する。
論文 参考訳(メタデータ) (2022-06-04T08:48:02Z) - Semi-Supervised Cascaded Clustering for Classification of Noisy Label
Data [0.3441021278275805]
教師付き分類技術の性能は、データがノイズのあるラベルを持つと劣化することが多い。
ノイズの多いラベルデータに対処するアプローチのほとんどは、分類タスクに巨大なデータセットを必要とするディープニューラルネットワーク(DNN)に依存している。
パターンを抽出し、そのようなデータセットのクラスをカスケード木として生成する半教師付きカスケードクラスタリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-05-04T17:42:22Z) - Clusterability as an Alternative to Anchor Points When Learning with
Noisy Labels [7.920797564912219]
本稿では,クラスタ可能性条件に基づく効率的な推定手法を提案する。
アンカーポイントを使った手法と比較して、我々のアプローチはより多くのインスタンスを使用し、より優れたサンプル複雑さの恩恵を受ける。
論文 参考訳(メタデータ) (2021-02-10T07:22:56Z) - Tackling Instance-Dependent Label Noise via a Universal Probabilistic
Model [80.91927573604438]
本稿では,ノイズラベルをインスタンスに明示的に関連付ける,単純かつ普遍的な確率モデルを提案する。
合成および実世界のラベルノイズを用いたデータセット実験により,提案手法がロバスト性に大きな改善をもたらすことを確認した。
論文 参考訳(メタデータ) (2021-01-14T05:43:51Z) - Extended T: Learning with Mixed Closed-set and Open-set Noisy Labels [86.5943044285146]
ラベルノイズ遷移行列$T$は、真のラベルがノイズのあるものへと反転する確率を反映する。
本稿では,閉集合と開集合の混在したラベル雑音下での学習に着目した。
本手法は,従来の最先端のラベル雑音学習法よりも頑健な性能を追求し,混合ラベル雑音をモデル化する。
論文 参考訳(メタデータ) (2020-12-02T02:42:45Z) - Meta Transition Adaptation for Robust Deep Learning with Noisy Labels [61.8970957519509]
本研究では,新しいメタ遷移学習戦略を提案する。
具体的には、クリーンなラベル付きメタデータの小さなセットのサウンドガイダンスにより、ノイズ遷移行列と分類器パラメータを相互に改善することができる。
本手法は, 従来技術よりも頑健な性能で, 遷移行列をより正確に抽出することができる。
論文 参考訳(メタデータ) (2020-06-10T07:27:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。