Fugu-MT 論文翻訳(概要): Improved Algorithm for Deep Active Learning under Imbalance via Optimal Separation

論文の概要: Improved Algorithm for Deep Active Learning under Imbalance via Optimal Separation

arxiv url: http://arxiv.org/abs/2312.09196v4
Date: Thu, 12 Jun 2025 07:17:19 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-13 15:37:21.9665
Title: Improved Algorithm for Deep Active Learning under Imbalance via Optimal Separation
Title（参考訳）: 最適分離による不均衡下での深層能動学習アルゴリズムの改良
Authors: Shyam Nuggehalli, Jifan Zhang, Lalit Jain, Robert Nowak,
Abstract要約: クラス不均衡は、機械学習のパフォーマンスが現実世界のアプリケーションにおけるマイノリティクラスに深刻な影響を与える。 DIRECTは,クラス分離境界を識別し,アノテーションの最も不確実な例を選択するアルゴリズムである。本研究は,クラス不均衡とラベルノイズの両条件下でのアクティブラーニングの総合的研究である。
参考スコア（独自算出の注目度）: 15.571923343398657
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Class imbalance severely impacts machine learning performance on minority classes in real-world applications. While various solutions exist, active learning offers a fundamental fix by strategically collecting balanced, informative labeled examples from abundant unlabeled data. We introduce DIRECT, an algorithm that identifies class separation boundaries and selects the most uncertain nearby examples for annotation. By reducing the problem to one-dimensional active learning, DIRECT leverages established theory to handle batch labeling and label noise -- another common challenge in data annotation that particularly affects active learning methods. Our work presents the first comprehensive study of active learning under both class imbalance and label noise. Extensive experiments on imbalanced datasets show DIRECT reduces annotation costs by over 60\% compared to state-of-the-art active learning methods and over 80\% versus random sampling, while maintaining robustness to label noise.
Abstract（参考訳）: クラス不均衡は、機械学習のパフォーマンスが現実世界のアプリケーションにおけるマイノリティクラスに深刻な影響を与える。様々なソリューションが存在するが、アクティブラーニングは、豊富なラベル付きデータから、バランスのとれた情報付きラベル付き例を戦略的に収集することで、根本的な修正を提供する。 DIRECTは,クラス分離境界を識別し,アノテーションの最も不確実な例を選択するアルゴリズムである。問題を1次元のアクティブラーニングに還元することで、DIRECTは確立した理論を利用してバッチラベリングとラベルノイズを処理する。本研究は,クラス不均衡とラベルノイズの両条件下でのアクティブラーニングの総合的研究である。不均衡データセットに対する大規模な実験により、DIRECTは、最先端のアクティブラーニング手法と比較してアノテーションコストを60%以上削減し、80%以上をランダムサンプリングと比較し、ラベルノイズに対するロバスト性を維持している。

関連論文リスト

Correcting Noisy Multilabel Predictions: Modeling Label Noise through Latent Space Shifts [4.795811957412855]
ほとんどの現実世界の機械学習アプリケーションでは、データのノイズは避けられないように思える。マルチラベル分類における雑音ラベル学習の分野について検討した。我々のモデルは、雑音のラベル付けは潜伏変数の変化から生じると仮定し、より堅牢で有益な学習手段を提供する。
論文参考訳（メタデータ） (2025-02-20T05:41:52Z)
Active Label Refinement for Robust Training of Imbalanced Medical Image Classification Tasks in the Presence of High Label Noise [10.232537737211098]
雑音ラベル(LNL)とアクティブラーニングを組み合わせた2段階のアプローチを提案する。提案手法は,少数クラスからのクリーンなサンプルをノイズの多いサンプルとして誤識別しないことで,クラス不均衡を扱う従来の手法よりも優れていることを示す。
論文参考訳（メタデータ） (2024-07-08T14:16:05Z)
Multiclass Learning from Noisy Labels for Non-decomposable Performance Measures [15.358504449550013]
非分解性性能尺度の2つのクラスに対して雑音ラベルから学習するアルゴリズムを設計する。どちらの場合も、広範に研究されているクラス条件雑音モデルの下で、アルゴリズムのノイズ補正バージョンを開発する。実験では,ラベルノイズ処理におけるアルゴリズムの有効性を実証した。
論文参考訳（メタデータ） (2024-02-01T23:03:53Z)
BAL: Balancing Diversity and Novelty for Active Learning [53.289700543331925]
多様な不確実なデータのバランスをとるために適応的なサブプールを構築する新しいフレームワークであるBalancing Active Learning (BAL)を導入する。我々のアプローチは、広く認識されているベンチマークにおいて、確立されたすべてのアクティブな学習方法より1.20%優れています。
論文参考訳（メタデータ） (2023-12-26T08:14:46Z)
Combating Label Noise With A General Surrogate Model For Sample Selection [77.45468386115306]
本稿では,視覚言語サロゲートモデルCLIPを用いて,雑音の多いサンプルを自動的にフィルタリングする手法を提案する。提案手法の有効性を実世界および合成ノイズデータセットで検証した。
論文参考訳（メタデータ） (2023-10-16T14:43:27Z)
Robust Assignment of Labels for Active Learning with Sparse and Noisy Annotations [0.17188280334580192]
監視された分類アルゴリズムは、世界中の多くの現実の問題を解決するために使用される。残念なことに、多くのタスクに対して良質なアノテーションを取得することは、実際に行うには不可能か、あるいはコストがかかりすぎます。サンプル空間のラベルのない部分を利用する2つの新しいアノテーション統一アルゴリズムを提案する。
論文参考訳（メタデータ） (2023-07-25T19:40:41Z)
Unleashing the Potential of Regularization Strategies in Learning with Noisy Labels [65.92994348757743]
クロスエントロピー損失を用いた単純なベースラインと、広く使われている正規化戦略を組み合わせることで、最先端の手法より優れていることを示す。この結果から,正規化戦略の組み合わせは,ノイズラベルを用いた学習の課題に対処する上で,複雑なアルゴリズムよりも効果的であることが示唆された。
論文参考訳（メタデータ） (2023-07-11T05:58:20Z)
Co-Learning Meets Stitch-Up for Noisy Multi-label Visual Recognition [70.00984078351927]
本稿では,多ラベル分類と長期学習の特徴に基づく雑音の低減に焦点をあてる。よりクリーンなサンプルを合成し,マルチラベルノイズを直接低減するStitch-Up拡張を提案する。ヘテロジニアス・コラーニング・フレームワークは、長い尾の分布とバランスの取れた分布の不整合を活用するためにさらに設計されている。
論文参考訳（メタデータ） (2023-07-03T09:20:28Z)
Learning with Noisy Labels through Learnable Weighting and Centroid Similarity [5.187216033152917]
ノイズラベルは、医学診断や自律運転などの領域で一般的である。本稿では,雑音ラベルの存在下で機械学習モデルを訓練するための新しい手法を提案する。以上の結果から,本手法は既存の最先端技術よりも一貫して優れていることがわかった。
論文参考訳（メタデータ） (2023-03-16T16:43:24Z)
PercentMatch: Percentile-based Dynamic Thresholding for Multi-Label Semi-Supervised Classification [64.39761523935613]
トレーニング中の各クラスに対する正と負の擬似ラベルのスコア閾値を動的に変更するためのパーセンタイルベースのしきい値調整手法を提案する。近年のSSL方式と比較して, Pascal VOC2007 と MS-COCO のデータセットの性能は高い。
論文参考訳（メタデータ） (2022-08-30T01:27:48Z)
L2B: Learning to Bootstrap Robust Models for Combating Label Noise [52.02335367411447]
本稿では,Learning to Bootstrap (L2B) という,シンプルで効果的な手法を提案する。モデルは、誤った擬似ラベルの影響を受けずに、自身の予測を使ってブートストラップを行うことができる。これは、実際の観測されたラベルと生成されたラベル間の重みを動的に調整し、メタラーニングを通じて異なるサンプル間の重みを動的に調整することで実現される。
論文参考訳（メタデータ） (2022-02-09T05:57:08Z)
Prototypical Classifier for Robust Class-Imbalanced Learning [64.96088324684683]
埋め込みネットワークに付加的なパラメータを必要としないtextitPrototypealを提案する。プロトタイプは、訓練セットがクラス不均衡であるにもかかわらず、すべてのクラスに対してバランスと同等の予測を生成する。我々は, CIFAR-10LT, CIFAR-100LT, Webvision のデータセットを用いて, プロトタイプが芸術の状況と比較した場合, サブスタンスの改善が得られることを検証した。
論文参考訳（メタデータ） (2021-10-22T01:55:01Z)
Robust Long-Tailed Learning under Label Noise [50.00837134041317]
本研究では,長期ラベル分布におけるラベルノイズ問題について検討する。本稿では,長期学習のための雑音検出を実現する頑健なフレームワークAlgoを提案する。我々のフレームワークは、半教師付き学習アルゴリズムを自然に活用して一般化をさらに改善することができる。
論文参考訳（メタデータ） (2021-08-26T03:45:00Z)
Learning From Long-Tailed Data With Noisy Labels [0.0]
クラス不均衡とノイズラベルは多くの大規模分類データセットの標準である。本稿では,近年の自己教師型学習の進歩をもとに,簡単な2段階のアプローチを提案する。自己指導型学習アプローチは,重度のクラス不均衡に効果的に対処できることが判明した。
論文参考訳（メタデータ） (2021-08-25T07:45:40Z)
Open-set Label Noise Can Improve Robustness Against Inherent Label Noise [27.885927200376386]
オープンセットノイズラベルは非毒性であり, 固有ノイズラベルに対するロバスト性にも寄与することを示した。本研究では,動的雑音ラベル(ODNL)を用いたオープンセットサンプルをトレーニングに導入することで,シンプルかつ効果的な正規化を提案する。
論文参考訳（メタデータ） (2021-06-21T07:15:50Z)
A Second-Order Approach to Learning with Instance-Dependent Label Noise [58.555527517928596]
ラベルノイズの存在は、しばしばディープニューラルネットワークのトレーニングを誤解させる。人間による注釈付きラベルのエラーは、タスクの難易度レベルに依存する可能性が高いことを示しています。
論文参考訳（メタデータ） (2020-12-22T06:36:58Z)
Efficient PAC Learning from the Crowd with Pairwise Comparison [7.594050968868919]
PAC学習しきい値関数の問題を,アノテータが(騒々しい)ラベルやペア比較タグを付与できる群から検討する。我々は、学習とアノテーションをインターリーブするラベル効率のアルゴリズムを設計し、アルゴリズムの一定のオーバーヘッドをもたらす。
論文参考訳（メタデータ） (2020-11-02T16:37:55Z)
Active Learning under Label Shift [80.65643075952639]
重要度とクラスバランスサンプリングのトレードオフを取り入れた「メディカル分布」を導入する。ラベルシフト(MALLS)下でのメディア型アクティブラーニングの複雑さと一般化保証を実証する。我々は、MALLSスケールを高次元データセットに実証的に示し、深層学習タスクにおいて、アクティブラーニングのサンプル複雑性を60%削減することができる。
論文参考訳（メタデータ） (2020-07-16T17:30:02Z)
A Graph-Based Approach for Active Learning in Regression [37.42533189350655]
アクティブラーニングは、ラベルのないプールから最も重要なデータポイントに注釈を付けることで、ラベル付けの労力を減らすことを目的としている。回帰法における既存のアクティブラーニングのほとんどは、各アクティブラーニングイテレーションで学習した回帰関数を使用して、クエリする次の情報ポイントを選択する。本稿では,新しい二部グラフ最適化問題として,逐次およびバッチモードのアクティブレグレッションを定式化する特徴に着目したアプローチを提案する。
論文参考訳（メタデータ） (2020-01-30T00:59:43Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。