論文の概要: Test-time Adaptive Hierarchical Co-enhanced Denoising Network for Reliable Multimodal Classification
- arxiv url: http://arxiv.org/abs/2601.07163v1
- Date: Mon, 12 Jan 2026 03:14:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-13 19:08:01.194247
- Title: Test-time Adaptive Hierarchical Co-enhanced Denoising Network for Reliable Multimodal Classification
- Title(参考訳): 信頼性マルチモーダル分類のためのテスト時間適応階層型階層型デノイングネットワーク
- Authors: Shu Shen, C. L. Philip Chen, Tong Zhang,
- Abstract要約: マルチモーダルデータを用いた信頼性学習のためのTAHCD(Test-time Adaptive Hierarchical Co-enhanced Denoising Network)を提案する。
提案手法は,最先端の信頼性の高いマルチモーダル学習手法と比較して,優れた分類性能,堅牢性,一般化を実現する。
- 参考スコア(独自算出の注目度): 55.56234913868664
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reliable learning on low-quality multimodal data is a widely concerning issue, especially in safety-critical applications. However, multimodal noise poses a major challenge in this domain and leads existing methods to suffer from two key limitations. First, they struggle to reliably remove heterogeneous data noise, hindering robust multimodal representation learning. Second, they exhibit limited adaptability and generalization when encountering previously unseen noise. To address these issues, we propose Test-time Adaptive Hierarchical Co-enhanced Denoising Network (TAHCD). On one hand, TAHCD introduces the Adaptive Stable Subspace Alignment and Sample-Adaptive Confidence Alignment to reliably remove heterogeneous noise. They account for noise at both global and instance levels and enable jointly removal of modality-specific and cross-modality noise, achieving robust learning. On the other hand, TAHCD introduces test-time cooperative enhancement, which adaptively updates the model in response to input noise in a label-free manner, improving adaptability and generalization. This is achieved by collaboratively enhancing the joint removal process of modality-specific and cross-modality noise across global and instance levels according to sample noise. Experiments on multiple benchmarks demonstrate that the proposed method achieves superior classification performance, robustness, and generalization compared with state-of-the-art reliable multimodal learning approaches.
- Abstract(参考訳): 低品質マルチモーダルデータに対する信頼性のある学習は、特に安全クリティカルなアプリケーションにおいて、広く問題となっている。
しかし、マルチモーダルノイズはこの領域において大きな課題となり、既存の手法は2つの重要な制限に悩まされる。
まず、不均一なデータノイズを確実に除去するのに苦労し、堅牢なマルチモーダル表現学習を妨げる。
第二に、以前は見えなかった雑音に遭遇したときの適応性と一般化が制限される。
これらの問題に対処するため,テスト時間適応型階層型階層型Denoising Network (TAHCD)を提案する。
一方、TAHCDは、異種ノイズを確実に除去するために、適応安定部分空間アライメントとサンプル適応信頼アライメントを導入している。
グローバルレベルとインスタンスレベルのノイズを考慮し、モダリティ固有のノイズとクロスモダリティノイズを共同で除去し、堅牢な学習を実現する。
一方、TAHCDは、ラベルなしの方法で入力ノイズに応答してモデルを適応的に更新し、適応性と一般化を改善するテスト時協調強化を導入している。
これは、サンプルノイズに応じて、グローバルおよびインスタンスレベルにわたるモダリティ固有ノイズとクロスモダリティノイズのジョイント除去プロセスを協調的に強化することで達成される。
複数のベンチマーク実験により,提案手法は最先端の信頼性の高いマルチモーダル学習手法と比較して,優れた分類性能,堅牢性,一般化を実現することが示された。
関連論文リスト
- Mitigating the Noise Shift for Denoising Generative Models via Noise Awareness Guidance [54.88271057438763]
ノイズアウェアネスガイダンス (NAG) は、事前に定義された騒音スケジュールと整合性を保つために、サンプリング軌道を明示的に制御する補正手法である。
NAGは一貫してノイズシフトを緩和し、主流拡散モデルの生成品質を大幅に改善する。
論文 参考訳(メタデータ) (2025-10-14T13:31:34Z) - Modality-Specific Speech Enhancement and Noise-Adaptive Fusion for Acoustic and Body-Conduction Microphone Framework [0.0]
体導マイクロホン信号(BMS)は空中音をバイパスし、強い耐雑音性を提供する。
本稿では,BMSと音響マイクロホン信号(AMS)を組み合わせた新しいマルチモーダルフレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-24T12:45:34Z) - Stable Neighbor Denoising for Source-free Domain Adaptive Segmentation [91.83820250747935]
擬似ラベルノイズは主に不安定なサンプルに含まれており、ほとんどのピクセルの予測は自己学習中に大きく変化する。
我々は, 安定・不安定な試料を効果的に発見する, SND(Stable Neighbor Denoising)アプローチを導入する。
SNDは、様々なSFUDAセマンティックセグメンテーション設定における最先端メソッドよりも一貫して優れている。
論文 参考訳(メタデータ) (2024-06-10T21:44:52Z) - Trusted Multi-view Learning under Noisy Supervision [20.668620759102115]
本稿では,ノイズラベルのガイダンスに基づき,信頼度の高い多視点学習モデルを構築する手法を提案する。
TMNRは明らかなディープニューラルネットワークを使用して、信念と不確実性の両方を捉えるビュー固有の意見を構築する。
TMNR2は、エビデンスラベルの整合性を通じて、潜在的に誤ラベルされたサンプルを特定し、近隣の情報から擬似ラベルを生成する。
論文 参考訳(メタデータ) (2024-04-18T06:47:30Z) - Effective Causal Discovery under Identifiable Heteroscedastic Noise Model [45.98718860540588]
因果DAG学習は、最近精度と効率の両面で有望な性能を達成した。
本稿では,変数間のノイズ分散の変動を考慮したDAG学習のための新しい定式化を提案する。
次に、最適化の難しさに対処する効果的な2相反復DAG学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-12-20T08:51:58Z) - Improve Noise Tolerance of Robust Loss via Noise-Awareness [60.34670515595074]
本稿では,NARL-Adjuster(NARL-Adjuster for brevity)と呼ばれる,ハイパーパラメータ予測関数を適応的に学習するメタラーニング手法を提案する。
4つのSOTAロバストな損失関数を我々のアルゴリズムに統合し,提案手法の一般性および性能をノイズ耐性と性能の両面で検証した。
論文 参考訳(メタデータ) (2023-01-18T04:54:58Z) - Noise-Tolerant Learning for Audio-Visual Action Recognition [31.641972732424463]
ビデオデータセットは通常、粗い注釈付きまたはインターネットから収集される。
本稿では,雑音ラベルと雑音対応の両方に対して,反干渉モデルパラメータを求めるための耐雑音性学習フレームワークを提案する。
本手法は,動作認識モデルのロバスト性を大幅に向上し,ベースラインをクリアマージンで越える。
論文 参考訳(メタデータ) (2022-05-16T12:14:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。