論文の概要: Disentangled Representations for Short-Term and Long-Term Person Re-Identification
- arxiv url: http://arxiv.org/abs/2409.05277v1
- Date: Mon, 9 Sep 2024 02:09:49 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-10 16:00:52.371405
- Title: Disentangled Representations for Short-Term and Long-Term Person Re-Identification
- Title(参考訳): 短期的・長期的人物再同定のための不整合表現
- Authors: Chanho Eom, Wonkyung Lee, Geon Lee, Bumsub Ham,
- Abstract要約: アイデンティティシャッフルGAN(Identity shuffle GAN:IS-GAN)と呼ばれる新たな生成対向ネットワークを提案する。
それは、アイデンティティシャッフル技術によって、個人画像からアイデンティティ関連および非関連の特徴を解き放つ。
実験により,IS-GANの有効性が検証され,標準reIDベンチマークにおける最先端性能が示された。
- 参考スコア(独自算出の注目度): 33.76874948187976
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We address the problem of person re-identification (reID), that is, retrieving person images from a large dataset, given a query image of the person of interest. A key challenge is to learn person representations robust to intra-class variations, as different persons could have the same attribute, and persons' appearances look different, e.g., with viewpoint changes. Recent reID methods focus on learning person features discriminative only for a particular factor of variations (e.g., human pose), which also requires corresponding supervisory signals (e.g., pose annotations). To tackle this problem, we propose to factorize person images into identity-related and unrelated features. Identity-related features contain information useful for specifying a particular person (e.g., clothing), while identity-unrelated ones hold other factors (e.g., human pose). To this end, we propose a new generative adversarial network, dubbed identity shuffle GAN (IS-GAN). It disentangles identity-related and unrelated features from person images through an identity-shuffling technique that exploits identification labels alone without any auxiliary supervisory signals. We restrict the distribution of identity-unrelated features or encourage the identity-related and unrelated features to be uncorrelated, facilitating the disentanglement process. Experimental results validate the effectiveness of IS-GAN, showing state-of-the-art performance on standard reID benchmarks, including Market-1501, CUHK03, and DukeMTMC-reID. We further demonstrate the advantages of disentangling person representations on a long-term reID task, setting a new state of the art on a Celeb-reID dataset.
- Abstract(参考訳): 興味ある人物の問い合わせ画像から人像を抽出する「人物再識別(reID)」の問題に対処する。
主な課題は、異なる人物が同じ属性を持つことができるため、クラス内の変動に頑健な人物表現を学習することであり、例えば、視点の変化を伴う人物の外観が異なるように見える。
近年のreID法では,変化の特定の要因(例えば,人間のポーズ)に対してのみ差別的特徴が注目されており,それには対応する監視信号(例えば,ポーズアノテーション)が必要である。
この問題に対処するために,人物画像を識別関連・非関連機能に分類することを提案する。
アイデンティティ関連の特徴には、特定の人物(例えば衣服)を特定するのに有用な情報が含まれている。
そこで本研究では,IDシャッフルGAN(Identity shuffle GAN)と呼ばれる,新たな生成的敵ネットワークを提案する。
個人画像から識別関連や無関係な特徴を、補助的な監視信号なしで識別ラベルのみを活用するアイデンティティシャッフル技術で切り離す。
同一性非関連特徴の分布を制限するか、同一性非関連特徴の非関連性を奨励し、非絡み合いプロセスを容易にする。
実験によりIS-GANの有効性が検証され, Market-1501, CUHK03, DukeMTMC-reIDなどの標準reIDベンチマークにおける最先端性能が示された。
さらに,Celeb-reIDデータセット上で,長期のreIDタスク上での人物表現のアンタングル化のメリットを実証する。
関連論文リスト
- Keypoint Promptable Re-Identification [76.31113049256375]
Occluded Person Re-Identification (ReID) は、その外見に基づいて隠蔽された個人をマッチングするメトリクス学習タスクである。
本稿では、入力バウンディングボックスを意味キーポイントの集合で明示的に補完する新しいReID問題の定式化であるKeypoint Promptable ReID(KPR)を紹介する。
我々は4つの人気のあるReIDベンチマークのためのカスタムキーポイントラベルをリリースした。人物検索の実験だけでなく、ポーズトラッキングの実験も、我々の手法が従来の最先端手法を体系的に超越していることを示す。
論文 参考訳(メタデータ) (2024-07-25T15:20:58Z) - Synthesizing Efficient Data with Diffusion Models for Person Re-Identification Pre-Training [51.87027943520492]
本稿では,既知の同一性に基づく多様な画像の効率向上と生成を行う新しいパラダイムDiffusion-ReIDを提案する。
提案したパラダイムに適合して,まず,5,183個のIDから777K以上の画像で構成された,大規模なRe-IDデータセットDiff-Personを新たに作成する。
論文 参考訳(メタデータ) (2024-06-10T06:26:03Z) - X-ReID: Cross-Instance Transformer for Identity-Level Person
Re-Identification [53.047542904329866]
Cross-Identity Instancesモジュール(IntraX)は、ID-Levelの知識を転送するために、異なるIdentityインスタンスをフューズする。
Cross Inter-Identity Instancesモジュール(InterX)は、同じアイデンティティに対する注意応答を改善するために、ハードポジティとハードポジティのインスタンスを含む。
論文 参考訳(メタデータ) (2023-02-04T03:16:18Z) - FaceDancer: Pose- and Occlusion-Aware High Fidelity Face Swapping [62.38898610210771]
そこで我々は,FaceDancerという顔のスワップとID転送のための新しい単一ステージ手法を提案する。
アダプティブ・フィーチャー・フュージョン・アテンション(AFFA)と解釈的特徴類似性規則化(IFSR)の2つの主要なコントリビューションがある。
論文 参考訳(メタデータ) (2022-10-19T11:31:38Z) - Towards Privacy-Preserving Person Re-identification via Person Identify
Shift [19.212691296927165]
人物再識別(ReID)は、ReID法で使用される歩行者画像のプライバシーを維持する必要がある。
本稿では、人物識別シフト(PIS)と呼ばれる、人物ReID用に明示的に設計された新しい非識別手法を提案する。
PISは、それぞれの歩行者画像を現在の身元から別の身元にシフトさせ、その結果、相対的な身元を保存している。
論文 参考訳(メタデータ) (2022-07-15T06:58:41Z) - Semantic Consistency and Identity Mapping Multi-Component Generative
Adversarial Network for Person Re-Identification [39.605062525247135]
本稿では,1つのドメインから複数のドメインへのスタイル適応を提供する,意味一貫性とアイデンティティマッピングの多成分生成対向ネットワーク(SC-IMGAN)を提案する。
提案手法は,6つの挑戦的人物リidデータセットにおける最先端技術よりも優れている。
論文 参考訳(メタデータ) (2021-04-28T14:12:29Z) - Pose-driven Attention-guided Image Generation for Person
Re-Identification [39.605062525247135]
複数人のポーズを生成するために,エンドツーエンドのポーズ駆動型ジェネレーション対人ネットワークを提案する。
ポーズ転送中の人のセマンティック情報を保存するためにセマンティック一貫性損失が提案される。
提案手法を人物再識別フレームワークに組み込むことにより,リアルなポーズ転送画像と最先端の再識別結果を実現できることを示した。
論文 参考訳(メタデータ) (2021-04-28T14:02:24Z) - Graph-based Person Signature for Person Re-Identifications [17.181807593574764]
詳細な人物の記述(ラベルの属性)と視覚的特徴(ボディパーツとグローバル機能)をグラフに効果的に集約する新しい方法を提案します。
グラフは、人物の再識別のためのマルチブランチマルチタスクフレームワークに統合されます。
提案手法は,技術状況間での競争結果を達成し,他の属性ベースの手法やマスク誘導手法よりも優れる。
論文 参考訳(メタデータ) (2021-04-14T10:54:36Z) - PoseTrackReID: Dataset Description [97.7241689753353]
詩情報は、背景や閉塞音から有用な特徴情報を遠ざけるのに役立つ。
PoseTrackReIDでは、人物のリIDと複数人のポーズトラッキングのギャップを埋めたいと考えています。
このデータセットは、マルチフレームの人物のre-IDに関する現在の最先端メソッドに対する優れたベンチマークを提供する。
論文 参考訳(メタデータ) (2020-11-12T07:44:25Z) - Taking Modality-free Human Identification as Zero-shot Learning [46.51413603352702]
我々は、新しいモダリティフリーヒューマン識別(MFHI)タスクを、スケーラブルな方法で汎用的なゼロショット学習モデルとして開発する。
各アイデンティティの識別プロトタイプを学習することで、視覚的および意味的なモダリティをブリッジすることができる。
さらに、意味論に基づく空間的注意は、高グローバルなカテゴリーレベルと局所的な属性レベルを区別した表現を得るために、視覚的モダリティに強制される。
論文 参考訳(メタデータ) (2020-10-02T13:08:27Z) - Intra-Camera Supervised Person Re-Identification [87.88852321309433]
本稿では,カメラごとの個人識別アノテーションに基づく新しい人物識別パラダイムを提案する。
これにより、最も時間がかかり、面倒なカメラ間IDラベリングプロセスがなくなる。
MATE(Multi-tAsk mulTi-labEl)Deep Learning method for intra-Camera Supervised (ICS) person re-id。
論文 参考訳(メタデータ) (2020-02-12T15:26:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。