論文の概要: MIND: Decoupling Model-Induced Label Noise via Latent Manifold Disentanglement
- arxiv url: http://arxiv.org/abs/2605.16081v1
- Date: Fri, 15 May 2026 15:44:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-18 21:22:26.346094
- Title: MIND: Decoupling Model-Induced Label Noise via Latent Manifold Disentanglement
- Title(参考訳): MIND: ラテント・マニフォールド・ディタングルメントによるモデル誘起ラベルノイズのデカップリング
- Authors: Dayong Ren,
- Abstract要約: モデルによるラベルノイズは古典的ロバスト学習においてノイズを支配している。
このジレンマに対処する理論的な基盤となるフレームワークであるモデル誘導ノイズデカップリング(MIND)を提案する。
MINDは複雑なベンチマークで最先端の手法を著しく上回っている。
- 参考スコア(独自算出の注目度): 3.626013617212667
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The paradigm of learning from automatic annotations driven by pre-trained experts and Foundation Models dominates data-hungry applications. However, it introduces a critical challenge: model-induced label noise. Unlike stochastic noise in classical robust learning, this noise stems from annotator inductive biases, manifesting as systematic errors tightly coupled with local feature manifolds. Existing methods relying on global transition matrices underfit these structural patterns, while learning instance-specific matrices remains mathematically intractable. We propose Model-Induced Noise Decoupling (MIND), a theoretically grounded framework addressing this dilemma. We demonstrate that the high-dimensional noise manifold can be decoupled into tractable, subspace-dependent components via Latent Manifold Disentanglement. Specifically, our Latent Decoupling Estimator (LDE) dynamically projects samples into latent structural clusters with consistent error modes, facilitating noise identifiability without ground-truth anchor points. To rigorously evaluate robustness, we adopt a hierarchical protocol: moving from controlled noise on CIFAR-100 to a structural stress test on large-scale real-world 3D datasets (S3DIS, ScanNet), where error patterns explicitly couple with geometric manifolds. Empirically, MIND significantly outperforms state-of-the-art methods on these complex benchmarks and effectively corrects zero-shot hallucinations from Vision-Language Models (e.g., OpenSeg), highlighting its potential as a robust distillation framework for Foundation Models.
- Abstract(参考訳): 事前訓練された専門家とファンデーションモデルによって駆動される自動アノテーションからの学習のパラダイムは、データハングリーアプリケーションを支配している。
しかし、これは重要な課題であるモデル誘発ラベルノイズを導入している。
古典的な頑健な学習における確率的ノイズとは異なり、このノイズはアノテータの帰納的バイアスに起因し、局所的特徴多様体と密結合した体系的誤りとして現れる。
グローバルな遷移行列に依存する既存の手法はこれらの構造パターンに不適合であり、一方、インスタンス固有の行列の学習は数学的に難解である。
このジレンマに対処する理論的な基盤となるフレームワークであるモデル誘導ノイズデカップリング(MIND)を提案する。
本研究では,高次元雑音多様体をラテント・マニフォールド・ディスタングルメント(英語版)を介して,トラクタブルな部分空間依存成分に分解できることを実証する。
具体的には、Latent Decoupling Estimator (LDE) は、サンプルを一貫したエラーモードを持つ潜在構造体クラスタに動的に投影し、グランドトルースアンカーポイントなしでノイズ識別を容易にする。
CIFAR-100の制御ノイズから大規模実世界の3Dデータセット(S3DIS, ScanNet)の構造的ストレステストへ移行し, 誤差パターンを幾何多様体と明示的に結合する階層的プロトコルを採用する。
実証的には、MINDはこれらの複雑なベンチマークで最先端の手法を大幅に上回り、Vision-Language Models(例えばOpenSeg)からのゼロショット幻覚を効果的に補正し、ファンデーションモデルのための堅牢な蒸留フレームワークとしての可能性を強調している。
関連論文リスト
- Provable Sparse Inversion and Token Relabel Enhanced One-shot Federated Learning with ViTs [77.42033827176806]
ワンショットフェデレートラーニング(One-Shot Federated Learning)は、単一のコミュニケーションラウンドでグローバルモデルを学ぶ中央サーバが、有望なパラダイムとして登場したものだ。
本稿では,合成画像の全パッチをフル活用してグローバルモデルをトレーニングする,新しいフェデレーションモデルインバージョンとトークンリラベルフレームワークを提案する。
論文 参考訳(メタデータ) (2026-05-11T15:49:08Z) - One CT Unified Model Training Framework to Rule All Scanning Protocols [32.68329101435685]
NICT(Non-ideal Measurement Computed Tomography)はCTの臨床的使用を拡大している。
ほとんどの方法はペアデータを必要とするが、これは避けられない臓器の動きによる非現実的な要求である。
サブマニフォールド間のギャップを埋めるために,不確実誘導マニフォールド平滑化(UMS)フレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-16T09:26:32Z) - Guided Verifier: Collaborative Multimodal Reasoning via Dynamic Process Supervision [11.159231524113764]
マルチモーダル大規模言語モデル(MLLM)の複雑な推論能力を高めるための重要なメカニズムとして強化学習(RL)が登場した。
本稿では,これらの構造的制約に対処する textbfGuided Verifier フレームワークを提案する。
我々は,マルチモーダル幻覚をターゲットとした特殊なデータ合成パイプラインを開発し,プロセスレベルの負の textbfCoRe データセットとtextbfCorrect-guide textbfReasoning トラジェクトリを構築し,ガイド付き検証器を訓練する。
論文 参考訳(メタデータ) (2026-02-04T07:38:42Z) - Noise-Robust Tiny Object Localization with Flows [63.60972031108944]
フレキシブルなエラーモデリングと不確実性誘導最適化に正規化フローを活用するノイズローバストローカライゼーションフレームワークを提案する。
本手法は,フローベース誤差モデルを用いて,複雑な非ガウス予測分布を抽出し,ノイズの多い監視下で頑健な学習を可能にする。
不確実性を考慮した勾配変調機構は、トレーニングを安定化しながら過度な適合を緩和し、高不確実でノイズの強いサンプルからの学習をさらに抑制する。
論文 参考訳(メタデータ) (2026-01-02T09:16:55Z) - Towards Robust Image Denoising with Scale Equivariance [10.894808298340994]
我々は,空間的一様雑音のトレーニングから,空間的非一様劣化の推論まで,モデルがより適応できるようになることを論じる。
本稿では,HNM (Heterogeneous Normalization Module) とIGM (Interactive Gating Module) の2つの主要コンポーネントを備える頑健なブラインド認知フレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-05T00:06:28Z) - Robust Learning under Hybrid Noise [24.36707245704713]
本稿では,データリカバリの観点からハイブリッドノイズに対処するため,新たな統合学習フレームワーク"Feature and Label Recovery"(FLR)を提案する。
論文 参考訳(メタデータ) (2024-07-04T16:13:25Z) - Disentanglement via Latent Quantization [60.37109712033694]
本研究では,組織化された潜在空間からの符号化と復号化に向けた帰納的バイアスを構築する。
本稿では,基本データレコーダ (vanilla autoencoder) と潜時再構成 (InfoGAN) 生成モデルの両方に追加することで,このアプローチの広範な適用性を実証する。
論文 参考訳(メタデータ) (2023-05-28T06:30:29Z) - Latent Class-Conditional Noise Model [54.56899309997246]
本稿では,ベイズ的枠組みの下での雑音遷移をパラメータ化するためのLatent Class-Conditional Noise Model (LCCN)を提案する。
次に、Gibs sampler を用いて遅延真のラベルを効率的に推測できる LCCN の動的ラベル回帰法を導出する。
提案手法は,サンプルのミニバッチから事前の任意チューニングを回避するため,ノイズ遷移の安定な更新を保護している。
論文 参考訳(メタデータ) (2023-02-19T15:24:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。