論文の概要: Reliable Active Learning from Unreliable Labels via Neural Collapse Geometry
- arxiv url: http://arxiv.org/abs/2510.09740v1
- Date: Fri, 10 Oct 2025 17:50:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:29.605763
- Title: Reliable Active Learning from Unreliable Labels via Neural Collapse Geometry
- Title(参考訳): ニューラルネットワークによる信頼できないラベルからの信頼度の高いアクティブラーニング
- Authors: Atharv Goel, Sharat Agarwal, Saket Anand, Chetan Arora,
- Abstract要約: アクティブラーニング(AL)は、情報的なサンプルを優先順位付けすることでアノテーションのコストを削減することを約束するが、ラベルがうるさい場合やデータ分散がシフトした場合、その信頼性は低下する。
本稿では,深層ネットワークの創発的幾何学的規則性を活用し,信頼できない監視に対処するフレームワークである能動学習(NCAL-R)を提案する。
- 参考スコア(独自算出の注目度): 5.1511135538176
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Active Learning (AL) promises to reduce annotation cost by prioritizing informative samples, yet its reliability is undermined when labels are noisy or when the data distribution shifts. In practice, annotators make mistakes, rare categories are ambiguous, and conventional AL heuristics (uncertainty, diversity) often amplify such errors by repeatedly selecting mislabeled or redundant samples. We propose Reliable Active Learning via Neural Collapse Geometry (NCAL-R), a framework that leverages the emergent geometric regularities of deep networks to counteract unreliable supervision. Our method introduces two complementary signals: (i) a Class-Mean Alignment Perturbation score, which quantifies how candidate samples structurally stabilize or distort inter-class geometry, and (ii) a Feature Fluctuation score, which captures temporal instability of representations across training checkpoints. By combining these signals, NCAL-R prioritizes samples that both preserve class separation and highlight ambiguous regions, mitigating the effect of noisy or redundant labels. Experiments on ImageNet-100 and CIFAR100 show that NCAL-R consistently outperforms standard AL baselines, achieving higher accuracy with fewer labels, improved robustness under synthetic label noise, and stronger generalization to out-of-distribution data. These results suggest that incorporating geometric reliability criteria into acquisition decisions can make Active Learning less brittle to annotation errors and distribution shifts, a key step toward trustworthy deployment in real-world labeling pipelines. Our code is available at https://github.com/Vision-IIITD/NCAL.
- Abstract(参考訳): アクティブラーニング(AL)は、情報的なサンプルを優先順位付けすることでアノテーションのコストを削減することを約束するが、ラベルがうるさい場合やデータ分散がシフトした場合、その信頼性は低下する。
実際には、アノテーションはミスを犯し、まれなカテゴリは曖昧であり、従来のALヒューリスティック(不確かさ、多様性)は、誤ってラベル付けされたサンプルや冗長なサンプルを何度も選択することで、そのようなエラーを増幅する。
本稿では,深層ネットワークの創発的幾何学的規則性を活用し,信頼できない監視に対処するフレームワークであるNCAL-Rを提案する。
本手法では2つの補完信号を導入する。
一 候補試料がクラス間幾何を構造的に安定させたり歪んだりする方法を定量化し、等平均アライメント摂動スコア
(ii) トレーニングチェックポイント間の表現の時間的不安定をキャプチャする特徴ゆらぎスコア。
これらのシグナルを組み合わせることで、NCAL-Rはクラス分離と曖昧な領域の強調の両方を優先し、ノイズや冗長なラベルの効果を緩和する。
ImageNet-100とCIFAR100の実験では、NCAL-Rは標準ALベースラインを一貫して上回り、ラベルの少ない精度で高い精度を実現し、合成ラベルノイズ下での堅牢性を改善し、配布外データへのより強力な一般化を実現している。
これらの結果は、幾何的信頼性基準を取得決定に組み込むことで、実世界のラベリングパイプラインにおける信頼性の高いデプロイメントに向けた重要なステップである、Active Learningのアノテーションエラーや分散シフトの脆さを軽減できることを示唆している。
私たちのコードはhttps://github.com/Vision-IIITD/NCALで公開されています。
関連論文リスト
- Mitigating Instance-Dependent Label Noise: Integrating Self-Supervised Pretraining with Pseudo-Label Refinement [3.272177633069322]
実世界のデータセットは、アノテーションプロセス中にヒューマンエラー、あいまいさ、リソース制約のために、ノイズの多いラベルを含むことが多い。
そこで本研究では,SimCLRを用いた自己教師型学習と反復的擬似ラベル改良を組み合わせた新しいフレームワークを提案する。
提案手法は,特に高騒音条件下では,いくつかの最先端手法よりも優れる。
論文 参考訳(メタデータ) (2024-12-06T09:56:49Z) - Typicalness-Aware Learning for Failure Detection [26.23185979968123]
ディープニューラルネットワーク(DNN)は、しばしば自信過剰な問題に悩まされる。
そこで本研究では,本問題に対処し,故障検出性能を向上させるために,S typicalness-Aware Learning (TAL) と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2024-11-04T11:09:47Z) - Trusted Multi-view Learning under Noisy Supervision [20.668620759102115]
本稿では,ノイズラベルのガイダンスに基づき,信頼度の高い多視点学習モデルを構築する手法を提案する。
TMNRは明らかなディープニューラルネットワークを使用して、信念と不確実性の両方を捉えるビュー固有の意見を構築する。
TMNR2は、エビデンスラベルの整合性を通じて、潜在的に誤ラベルされたサンプルを特定し、近隣の情報から擬似ラベルを生成する。
論文 参考訳(メタデータ) (2024-04-18T06:47:30Z) - Decoupled Prototype Learning for Reliable Test-Time Adaptation [50.779896759106784]
テスト時間適応(TTA)は、推論中にトレーニング済みのソースモデルをターゲットドメインに継続的に適応させるタスクである。
1つの一般的なアプローチは、推定擬似ラベルによるクロスエントロピー損失を伴う微調整モデルである。
本研究は, 各試料の分類誤差を最小化することで, クロスエントロピー損失の脆弱性がラベルノイズを引き起こすことを明らかにした。
本稿では,プロトタイプ中心の損失計算を特徴とする新しいDPL法を提案する。
論文 参考訳(メタデータ) (2024-01-15T03:33:39Z) - ERASE: Error-Resilient Representation Learning on Graphs for Label Noise
Tolerance [53.73316938815873]
本稿では, ERASE (Error-Resilient representation learning on graphs for lAbel noiSe tolerancE) という手法を提案する。
ERASEは、プロトタイプの擬似ラベルとプロパゲーションされた識別ラベルを組み合わせて、表現をエラーレジリエンスで更新する。
提案手法は, 広い雑音レベルにおいて, 複数のベースラインをクリアマージンで上回り, 高いスケーラビリティを享受できる。
論文 参考訳(メタデータ) (2023-12-13T17:59:07Z) - All Points Matter: Entropy-Regularized Distribution Alignment for
Weakly-supervised 3D Segmentation [67.30502812804271]
擬似ラベルは、弱い教師付き3Dセグメンテーションタスクに広く使われており、学習に使えるのはスパース・グラウンド・トラス・ラベルのみである。
本稿では,生成した擬似ラベルを正規化し,擬似ラベルとモデル予測とのギャップを効果的に狭めるための新しい学習戦略を提案する。
論文 参考訳(メタデータ) (2023-05-25T08:19:31Z) - S3: Supervised Self-supervised Learning under Label Noise [53.02249460567745]
本稿では,ラベルノイズの存在下での分類の問題に対処する。
提案手法の核心は,サンプルのアノテートラベルと特徴空間内のその近傍のラベルの分布との整合性に依存するサンプル選択機構である。
提案手法は,CIFARCIFAR100とWebVisionやANIMAL-10Nなどの実環境ノイズデータセットの両方で,従来の手法をはるかに上回っている。
論文 参考訳(メタデータ) (2021-11-22T15:49:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。