論文の概要: UGG-ReID: Uncertainty-Guided Graph Model for Multi-Modal Object Re-Identification
- arxiv url: http://arxiv.org/abs/2507.04638v2
- Date: Tue, 08 Jul 2025 02:49:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-09 12:20:17.821735
- Title: UGG-ReID: Uncertainty-Guided Graph Model for Multi-Modal Object Re-Identification
- Title(参考訳): UGG-ReID:マルチモーダル物体再同定のための不確かさ誘導グラフモデル
- Authors: Xixi Wan, Aihua Zheng, Bo Jiang, Beibei Wang, Chenglong Li, Jin Tang,
- Abstract要約: マルチモーダルオブジェクトReID(UGG-ReID)に対する不確実性誘導グラフモデルというロバストなアプローチを提案する。
UGG-ReIDは、ノイズ干渉を緩和し、効果的なマルチモーダル融合を促進するように設計されている。
実験結果から,提案手法は全データセットに対して優れた性能を示すことがわかった。
- 参考スコア(独自算出の注目度): 26.770271366177603
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-modal object Re-IDentification (ReID) has gained considerable attention with the goal of retrieving specific targets across cameras using heterogeneous visual data sources. Existing methods primarily aim to improve identification performance, but often overlook the uncertainty arising from inherent defects, such as intra-modal noise and inter-modal conflicts. This uncertainty is particularly significant in the case of fine-grained local occlusion and frame loss, which becomes a challenge in multi-modal learning. To address the above challenge, we propose a robust approach named Uncertainty-Guided Graph model for multi-modal object ReID (UGG-ReID). UGG-ReID is designed to mitigate noise interference and facilitate effective multi-modal fusion by estimating both local and sample-level aleatoric uncertainty and explicitly modeling their dependencies. Specifically, we first propose the Gaussian patch-graph representation model that leverages uncertainty to quantify fine-grained local cues and capture their structural relationships. This process boosts the expressiveness of modal-specific information, ensuring that the generated embeddings are both more informative and robust. Subsequently, we design an uncertainty-guided mixture of experts strategy that dynamically routes samples to experts exhibiting low uncertainty. This strategy effectively suppresses noise-induced instability, leading to enhanced robustness. Meanwhile, we design an uncertainty-guided routing to strengthen the multi-modal interaction, improving the performance. UGG-ReID is comprehensively evaluated on five representative multi-modal object ReID datasets, encompassing diverse spectral modalities. Experimental results show that the proposed method achieves excellent performance on all datasets and is significantly better than current methods in terms of noise immunity. Our code will be made public upon acceptance.
- Abstract(参考訳): ReID(Multi-modal object Re-IDentification)は、不均一な視覚データソースを用いて、カメラ間で特定のターゲットを取得することを目的としている。
既存の手法は主に識別性能を改善することを目的としているが、しばしば、モーダル内ノイズやモーダル間衝突のような固有の欠陥から生じる不確実性を見落としている。
この不確実性は、きめ細かい局所閉塞やフレームロスの場合において特に重要であり、これはマルチモーダル学習における課題となっている。
上記の課題に対処するため,マルチモーダルオブジェクトReID(UGG-ReID)に対するUncertainty-Guided Graphモデルという頑健なアプローチを提案する。
UGG-ReIDはノイズ干渉を緩和し、局所的およびサンプルレベルのアレタリック不確かさを推定し、依存関係を明示的にモデル化することにより、効果的なマルチモーダル融合を促進するように設計されている。
具体的には,不確実性を利用して局所的な微細なキューを定量化し,それらの構造的関係を捉えるガウスパッチグラフ表現モデルを提案する。
このプロセスは、モーダル固有情報の表現性を高め、生成された埋め込みがより情報的かつ堅牢であることを保証する。
次に,不確実性の低い専門家に動的にサンプルをルーティングする,不確実性の誘導された専門家戦略を設計する。
この戦略は、雑音による不安定性を効果的に抑制し、堅牢性を高める。
一方,マルチモーダルインタラクションを強化し,性能を向上させるため,不確実性誘導型ルーティングを設計する。
UGG-ReIDは5つの代表的なマルチモーダルオブジェクトReIDデータセットに対して包括的に評価され、スペクトルの多様さを包含する。
実験の結果,提案手法はすべてのデータセットにおいて優れた性能を示し,ノイズ免疫の点で現在の手法よりもかなり優れていることがわかった。
私たちのコードは受け入れ次第公開します。
関連論文リスト
- Confidence-Aware Self-Distillation for Multimodal Sentiment Analysis with Incomplete Modalities [15.205192581534973]
マルチモーダル感情分析は、マルチモーダルデータを通して人間の感情を理解することを目的としている。
既存のモダリティの欠如を扱う方法は、データ再構成や共通部分空間投影に基づいている。
マルチモーダルな確率的埋め込みを効果的に組み込んだ信頼性認識型自己蒸留(CASD)戦略を提案する。
論文 参考訳(メタデータ) (2025-06-02T09:48:41Z) - RODEO: Robust Outlier Detection via Exposing Adaptive Out-of-Distribution Samples [4.76428036044684]
本稿では,データ中心のアプローチであるRODEOを導入し,ロバストな外乱検出のための効果的な外乱検出手法を提案する。
我々は,OE(outlier exposure)と対人訓練を取り入れることが,この目的に有効な戦略であることを示す。
我々は,我々の適応型OE法が「多様」および「ほぼ分布」のアウトリーチを効果的に生成できることを定量的かつ定性的に証明した。
論文 参考訳(メタデータ) (2025-01-28T14:13:17Z) - Uncertainty Quantification via Hölder Divergence for Multi-View Representation Learning [18.076966572539547]
本稿では,H"older Divergence (HD)に基づく新しいアルゴリズムを導入し,多視点学習の信頼性を高める。
デンプスター・シェーファー理論を通じて、異なるモダリティからの不確実性の統合により、包括的な結果が生成される。
数学的には、HDは実際のデータ分布とモデルの予測分布の間の距離'をよりよく測定できることを証明している。
論文 参考訳(メタデータ) (2024-10-29T04:29:44Z) - A Study of Dropout-Induced Modality Bias on Robustness to Missing Video
Frames for Audio-Visual Speech Recognition [53.800937914403654]
AVSR(Advanced Audio-Visual Speech Recognition)システムは、欠落したビデオフレームに敏感であることが観察されている。
ビデオモダリティにドロップアウト技術を適用することで、フレーム不足に対するロバスト性が向上する一方、完全なデータ入力を扱う場合、同時に性能損失が発生する。
本稿では,MDA-KD(Multimodal Distribution Approximation with Knowledge Distillation)フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-07T06:06:55Z) - The Risk of Federated Learning to Skew Fine-Tuning Features and
Underperform Out-of-Distribution Robustness [50.52507648690234]
フェデレートされた学習は、微調整された特徴をスキイングし、モデルの堅牢性を損なうリスクがある。
3つのロバスト性指標を導入し、多様なロバストデータセットで実験を行う。
提案手法は,パラメータ効率のよい微調整手法を含む多種多様なシナリオにまたがるロバスト性を著しく向上させる。
論文 参考訳(メタデータ) (2024-01-25T09:18:51Z) - Model Stealing Attack against Graph Classification with Authenticity, Uncertainty and Diversity [80.16488817177182]
GNNは、クエリ許可を通じてターゲットモデルを複製するための悪行であるモデル盗難攻撃に対して脆弱である。
異なるシナリオに対応するために,3つのモデルステルス攻撃を導入する。
論文 参考訳(メタデータ) (2023-12-18T05:42:31Z) - Informative Data Selection with Uncertainty for Multi-modal Object
Detection [25.602915381482468]
普遍的不確実性を考慮したマルチモーダル融合モデルを提案する。
本モデルでは,融合時のランダム性を低減し,信頼性の高い出力を生成する。
我々の核融合モデルでは、ガウス、運動のぼやけ、凍土のような激しいノイズ干渉に対してわずかにしか耐えられないことが証明されている。
論文 参考訳(メタデータ) (2023-04-23T16:36:13Z) - Trustworthy Multimodal Regression with Mixture of Normal-inverse Gamma
Distributions [91.63716984911278]
このアルゴリズムは、異なるモードの適応的統合の原理における不確かさを効率的に推定し、信頼できる回帰結果を生成する。
実世界のデータと実世界のデータの両方に対する実験結果から,多モード回帰タスクにおける本手法の有効性と信頼性が示された。
論文 参考訳(メタデータ) (2021-11-11T14:28:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。