論文の概要: Memory Regulation and Alignment toward Generalizer RGB-Infrared Person
- arxiv url: http://arxiv.org/abs/2109.08843v1
- Date: Sat, 18 Sep 2021 05:55:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-21 16:31:25.657467
- Title: Memory Regulation and Alignment toward Generalizer RGB-Infrared Person
- Title(参考訳): rgb-infrared personに対する記憶制御とアライメント
- Authors: Feng Chen, Fei Wu, Qi Wu, Zhiguo Wan
- Abstract要約: RGB-IR ReIDは、常に差別的機能を必要としており、見受けられるクラスの過度な機能感度をもたらす。
本稿では,この問題を解決するために,新しい多粒性メモリ制御およびアライメントモジュール(MG-MRA)を提案する。
本手法は,授業の識別的特徴に関するモデルの過度な信頼を緩和する。
- 参考スコア(独自算出の注目度): 26.46821443401331
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The domain shift, coming from unneglectable modality gap and non-overlapped
identity classes between training and test sets, is a major issue of
RGB-Infrared person re-identification. A key to tackle the inherent issue --
domain shift -- is to enforce the data distributions of the two domains to be
similar. However, RGB-IR ReID always demands discriminative features, leading
to over-rely feature sensitivity of seen classes, \textit{e.g.}, via
attention-based feature alignment or metric learning. Therefore, predicting the
unseen query category from predefined training classes may not be accurate and
leads to a sub-optimal adversarial gradient. In this paper, we uncover it in a
more explainable way and propose a novel multi-granularity memory regulation
and alignment module (MG-MRA) to solve this issue. By explicitly incorporating
a latent variable attribute, from fine-grained to coarse semantic granularity,
into intermediate features, our method could alleviate the over-confidence of
the model about discriminative features of seen classes. Moreover, instead of
matching discriminative features by traversing nearest neighbor, sparse
attributes, \textit{i.e.}, global structural pattern, are recollected with
respect to features and assigned to measure pair-wise image similarity in
hashing. Extensive experiments on RegDB \cite{RegDB} and SYSU-MM01 \cite{SYSU}
show the superiority of the proposed method that outperforms existing
state-of-the-art methods. Our code is available in
https://github.com/Chenfeng1271/MGMRA.
- Abstract(参考訳): トレーニングとテストセットの間の不要なモダリティギャップとオーバーラップされていないidクラスから生じるドメインシフトは、rgb-infrared person re-identificationの重要な問題である。
ドメインシフトという本質的な問題に取り組む鍵は、2つのドメインのデータ分散を同じようなものに強制することだ。
しかし、RGB-IR ReIDは常に差別的特徴を要求しており、注意に基づく特徴アライメントやメートル法学習を通じて、見受けられるクラスの過剰な特徴感度である \textit{e.g.} が生じる。
したがって、事前定義されたトレーニングクラスから見当たらないクエリカテゴリを予測することは正確ではなく、最適な逆勾配をもたらす可能性がある。
本稿では、より説明しやすい方法でこれを明らかにし、この問題を解決するための新しい多粒性メモリ制御およびアライメントモジュール(MG-MRA)を提案する。
細粒度から粗い意味的粒度まで,潜在変数属性を明示的に中間的特徴に組み込むことで,参照クラスの識別的特徴に関するモデルの過信を緩和できる。
さらに、最寄りの近傍を横切ることで識別的特徴をマッチングする代わりに、グローバル構造パターンであるスパース属性を特徴に関して再集計し、ハッシュ化において対方向の画像類似度を測定するように割り当てる。
RegDB \cite{RegDB} と SYSU-MM01 \cite{SYSU} の広範な実験は、既存の最先端手法よりも優れていることを示す。
私たちのコードはhttps://github.com/Chenfeng1271/MGMRAで利用可能です。
関連論文リスト
- Semantic-aware Representation Learning for Homography Estimation [28.70450397793246]
本研究では,検出不要な特徴マッチング手法であるSRMatcherを提案する。
マッチングペアにおける意味的不整合に起因するエラーを減らすことで、提案したSRMatcherはより正確で現実的な結果をもたらすことができる。
論文 参考訳(メタデータ) (2024-07-18T08:36:28Z) - Relevant Intrinsic Feature Enhancement Network for Few-Shot Semantic
Segmentation [34.257289290796315]
本稿では,フォアグラウンドインスタンスのセマンティック一貫性を改善するために,RiFeNet(Relevant Intrinsic Feature Enhancement Network)を提案する。
RiFeNetはPASCAL-5iとCOCOベンチマークの最先端メソッドを上回っている。
論文 参考訳(メタデータ) (2023-12-11T16:02:57Z) - Dual Feature Augmentation Network for Generalized Zero-shot Learning [14.410978100610489]
ゼロショット学習 (ZSL) は,見知らぬクラスから知識を伝達することによって,サンプルを訓練せずに新しいクラスを推論することを目的としている。
ZSLの既存の埋め込みベースのアプローチは、画像上の属性を見つけるために注意機構を用いるのが一般的である。
本稿では,2つの機能拡張モジュールからなる新しいDual Feature Augmentation Network (DFAN)を提案する。
論文 参考訳(メタデータ) (2023-09-25T02:37:52Z) - Exploring Fine-Grained Representation and Recomposition for Cloth-Changing Person Re-Identification [78.52704557647438]
補助的なアノテーションやデータなしに両方の制約に対処するために,新しいFIne-fine Representation and Recomposition (FIRe$2$) フレームワークを提案する。
FIRe$2$は、広く使われている5つのRe-IDベンチマークで最先端のパフォーマンスを実現することができる。
論文 参考訳(メタデータ) (2023-08-21T12:59:48Z) - Regularizing Self-training for Unsupervised Domain Adaptation via
Structural Constraints [14.593782939242121]
本稿では,従来の自己学習目標を正規化するために,奥行きなどの補助的モーダルから構造的手がかりを取り入れることを提案する。
具体的には、オブジェクトインスタンスの近い領域内でピクセル表現をプルする、対照的なピクセルレベルのオブジェクト性制約を導入する。
セマンティックセグメンテーションのための様々な UDA ベンチマークにおいて,正則化器は最上位の自己学習手法を大幅に改善することを示す。
論文 参考訳(メタデータ) (2023-04-29T00:12:26Z) - Complementary Random Masking for RGB-Thermal Semantic Segmentation [63.93784265195356]
RGB-熱的セマンティックセグメンテーションは、悪天候や照明条件における信頼性の高いセマンティックセマンティックセマンティック理解を実現するための潜在的ソリューションである。
本稿では,1)RGB-T画像の相補的ランダムマスキング戦略,2)クリーンモードとマスク入力モードの自己蒸留損失を提案する。
3つのRGB-Tセマンティックセマンティックセグメンテーションベンチマークで最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-03-30T13:57:21Z) - Triplet Contrastive Learning for Unsupervised Vehicle Re-identification [55.445358749042384]
部分的特徴学習は、車両の再識別におけるセマンティック理解にとって重要な技術である。
本稿では,クラスタ機能を活用したTCL(Triplet Contrastive Learning framework)を提案する。
論文 参考訳(メタデータ) (2023-01-23T15:52:12Z) - PatchMix Augmentation to Identify Causal Features in Few-shot Learning [55.64873998196191]
少ないショット学習は、十分なカテゴリをラベル付けしたデータに基づいて学習した知識を、少ない既知の情報を持つ新しいカテゴリに転送することを目的としている。
我々はPatchMixと呼ばれる新しいデータ拡張戦略を提案し、この急激な依存関係を壊すことができる。
このような拡張メカニズムが,既存のメカニズムと異なり,因果的特徴を識別可能であることを示す。
論文 参考訳(メタデータ) (2022-11-29T08:41:29Z) - Measuring the Interpretability of Unsupervised Representations via
Quantized Reverse Probing [97.70862116338554]
本稿では,自己教師付き表現の解釈可能性の測定問題について検討する。
我々は、後者を、表現と手動でラベル付けされた概念の空間の間の相互情報を推定するものとして定式化する。
提案手法は,多人数の自己教師付き表現の評価に利用し,解釈可能性による評価を行う。
論文 参考訳(メタデータ) (2022-09-07T16:18:50Z) - SPCL: A New Framework for Domain Adaptive Semantic Segmentation via
Semantic Prototype-based Contrastive Learning [6.705297811617307]
ドメイン適応は、ラベル付けされたソースドメインからラベル付けされていないターゲットドメインに知識を転送するのに役立ちます。
本稿では,クラスアライメントを微粒化するための新しい意味的プロトタイプに基づくコントラスト学習フレームワークを提案する。
我々の手法は実装が容易であり、最先端の手法と比較して優れた結果が得られる。
論文 参考訳(メタデータ) (2021-11-24T09:26:07Z) - Bi-directional Cross-Modality Feature Propagation with
Separation-and-Aggregation Gate for RGB-D Semantic Segmentation [59.94819184452694]
深度情報はRGBD画像のセマンティックセグメンテーションにおいて有用であることが証明されている。
既存のほとんどの研究は、深度測定がRGBピクセルと正確で整合していると仮定し、問題をモーダルな特徴融合としてモデル化している。
本稿では,RGB特徴量応答を効果的に再検討するだけでなく,複数の段階を通して正確な深度情報を抽出し,代わりに2つの補正表現を集約する,統一的で効率的なクロスモダリティガイドを提案する。
論文 参考訳(メタデータ) (2020-07-17T18:35:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。