論文の概要: Devil's in the Details: Aligning Visual Clues for Conditional Embedding
in Person Re-Identification
- arxiv url: http://arxiv.org/abs/2009.05250v2
- Date: Mon, 7 Dec 2020 11:07:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-19 21:34:11.778467
- Title: Devil's in the Details: Aligning Visual Clues for Conditional Embedding
in Person Re-Identification
- Title(参考訳): Devil's in the details: Aligning Visual Clues for Conditional Embedding in Person Re-Identification
- Authors: Fufu Yu, Xinyang Jiang, Yifei Gong, Shizhen Zhao, Xiaowei Guo, Wei-Shi
Zheng, Feng Zheng, Xing Sun
- Abstract要約: 歩行者画像の詳細な情報をよりよく活用するための2つの重要な認識パターンを提案する。
CACE-Netは3つの公開データセット上で最先端のパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 94.77172127405846
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Although Person Re-Identification has made impressive progress, difficult
cases like occlusion, change of view-pointand similar clothing still bring
great challenges. Besides overall visual features, matching and comparing
detailed information is also essential for tackling these challenges. This
paper proposes two key recognition patterns to better utilize the detail
information of pedestrian images, that most of the existing methods are unable
to satisfy. Firstly, Visual Clue Alignment requires the model to select and
align decisive regions pairs from two images for pair-wise comparison, while
existing methods only align regions with predefined rules like high feature
similarity or same semantic labels. Secondly, the Conditional Feature Embedding
requires the overall feature of a query image to be dynamically adjusted based
on the gallery image it matches, while most of the existing methods ignore the
reference images. By introducing novel techniques including correspondence
attention module and discrepancy-based GCN, we propose an end-to-end ReID
method that integrates both patterns into a unified framework, called
CACE-Net((C)lue(A)lignment and (C)onditional (E)mbedding). The experiments show
that CACE-Net achieves state-of-the-art performance on three public datasets.
- Abstract(参考訳): Person Re-Identificationは目覚ましい進歩を遂げてきたが、オクルージョン、ビューポイントや類似の衣服の変更といった難しいケースは依然として大きな課題をもたらしている。
全体的なビジュアル機能に加えて、詳細な情報のマッチングと比較もこれらの課題に取り組む上で不可欠である。
本稿では,歩行者画像の詳細な情報をよりよく活用するための2つの重要な認識パターンを提案する。
まず、視覚的な手がかりアライメントでは、2つの画像から決定的な領域ペアを選択してアライメントする必要があるが、既存の手法では、高機能類似性や同じ意味ラベルのような事前定義されたルールのみをアライメントする必要がある。
第二に、条件付き特徴埋め込みでは、問い合わせ画像の全体的な特徴を、一致するギャラリー画像に基づいて動的に調整する必要があるが、既存の方法のほとんどは参照画像を無視している。
対応注意モジュールや不一致に基づくgcnといった新しい手法を導入することで、両パターンをcace-net((c)lue(a)lignmentと(c)onditional(e)mbeddingと呼ばれる統一フレームワークに統合するエンドツーエンドreid手法を提案する。
実験により、CACE-Netは3つの公開データセット上で最先端のパフォーマンスを達成することが示された。
関連論文リスト
- VSFormer: Visual-Spatial Fusion Transformer for Correspondence Pruning [22.0082111649259]
対応プルーニング(英: Cor correspondence pruning)は、初期セットの仮定対応から正しい一致(不整合)を見つけることを目的としている。
Inlier を同定し,カメラのポーズを正確に復元する Visual-Spatial Fusion Transformer (VSFormer) を提案する。
論文 参考訳(メタデータ) (2023-12-14T09:50:09Z) - Noisy-Correspondence Learning for Text-to-Image Person Re-identification [50.07634676709067]
本稿では,雑音対応においても頑健な視覚関係を学習するための新しいロバスト二重埋め込み法(RDE)を提案する。
提案手法は,3つのデータセット上での合成ノイズ対応と非合成ノイズ対応を両立させる。
論文 参考訳(メタデータ) (2023-08-19T05:34:13Z) - Occ$^2$Net: Robust Image Matching Based on 3D Occupancy Estimation for
Occluded Regions [14.217367037250296]
Occ$2$Netは、3D占有率を用いて閉塞関係をモデル化し、閉塞領域の一致点を推測する画像マッチング手法である。
本手法は実世界とシミュレーションデータセットの両方で評価し,いくつかの指標における最先端手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2023-08-14T13:09:41Z) - Single Stage Virtual Try-on via Deformable Attention Flows [51.70606454288168]
仮想試行は、ショップ内服と基準人物画像が与えられた写真リアルなフィッティング結果を生成することを目的としている。
マルチフロー推定に変形性アテンションスキームを適用した,変形性アテンションフロー(DAFlow)を新たに開発した。
提案手法は,定性的かつ定量的に最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-07-19T10:01:31Z) - Share With Thy Neighbors: Single-View Reconstruction by Cross-Instance
Consistency [59.427074701985795]
単一ビューの再構築は通常、視点アノテーション、シルエット、背景の欠如、同じインスタンスの複数のビュー、テンプレートの形状、対称性に依存する。
異なるオブジェクトインスタンスのイメージ間の一貫性を明確に活用することで、これらの監督と仮説をすべて回避します。
i)プログレッシブ・コンディショニング(プログレッシブ・コンディショニング)、(ii)類似の形状やテクスチャを持つインスタンス間の一貫性の喪失、(ii)モデルのカテゴリからインスタンスへと徐々に専門化するためのトレーニング戦略。
論文 参考訳(メタデータ) (2022-04-21T17:47:35Z) - Co-Attention for Conditioned Image Matching [91.43244337264454]
照明, 視点, コンテキスト, 素材に大きな変化がある場合, 野生のイメージペア間の対応性を決定するための新しい手法を提案する。
他のアプローチでは、イメージを個別に扱うことで、画像間の対応を見出すが、その代わりに、画像間の差異を暗黙的に考慮するよう、両画像に条件を付ける。
論文 参考訳(メタデータ) (2020-07-16T17:32:00Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。