論文の概要: Thinking Before Matching: A Reinforcement Reasoning Paradigm Towards General Person Re-Identification
- arxiv url: http://arxiv.org/abs/2604.19218v1
- Date: Tue, 21 Apr 2026 08:24:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.686423
- Title: Thinking Before Matching: A Reinforcement Reasoning Paradigm Towards General Person Re-Identification
- Title(参考訳): マッチングに先立って考える - 一般人再同定に向けた強化推論パラダイム
- Authors: Quan Zhang, Jingze Wu, Jialong Wang, Xiaohua Xie, Jianhuang Lai, Hongbo Chen,
- Abstract要約: ReID-Rは、明確なアイデンティティ理解と推論を実現する新しい推論駆動パラダイムとして提案されている。
複数のReIDベンチマークの実験では、ReID-Rは優れた手法として、競争力のある識別性を達成している。
- 参考スコア(独自算出の注目度): 77.51622646061314
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning identity-discriminative representations with multi-scene generality has become a critical objective in person re-identification (ReID). However, mainstream perception-driven paradigms tend to identify fitting from massive annotated data rather than identity-causal cues understanding, which presents a fragile representation against multiple disruptions. In this work, ReID-R is proposed as a novel reasoning-driven paradigm that achieves explicit identity understanding and reasoning by incorporating chain-of-thought into the ReID pipeline. Specifically, ReID-R consists of a two-stage contribution: (i) Discriminative reasoning warm-up, where a model is trained in a CoT label-free manner to acquire identity-aware feature understanding; and (ii) Efficient reinforcement learning, which proposes a non-trivial sampling to construct scene-generalizable data. On this basis, ReID-R leverages high-quality reward signals to guide the model toward focusing on ID-related cues, achieving accurate reasoning and correct responses. Extensive experiments on multiple ReID benchmarks demonstrate that ReID-R achieves competitive identity discrimination as superior methods using only 14.3K non-trivial data (20.9% of the existing data scale). Furthermore, benefit from inherent reasoning, ReID-R can provide high-quality interpretation for results.
- Abstract(参考訳): 多段階の一般性を持つアイデンティティ識別表現を学習することは、個人再識別(ReID)において重要な目標となっている。
しかし、主流の知覚駆動のパラダイムは、複数の破壊に対して脆弱な表現を示すアイデンティティ・因果理解よりも、大量の注釈付きデータからの適合を識別する傾向にある。
本研究では、ReIDパイプラインにチェーン・オブ・ソートを組み込むことにより、明確なアイデンティティ理解と推論を実現する新しい推論駆動パラダイムとしてReID-Rを提案する。
具体的には、ReID-Rは2段階のコントリビューションから構成される。
一 同一性を考慮した特徴理解を得るために、CoTラベルフリーでモデルを訓練する差別的推論ウォームアップ
二 シーン一般化可能なデータを構築するための非自明なサンプリングを提案する、効率的な強化学習。
このベースで、ReID-Rは高品質な報酬信号を利用して、モデルがID関連の手がかりに焦点を合わせ、正確な推論と正しい応答を達成するよう誘導する。
複数のReIDベンチマークの大規模な実験により、ReID-Rは14.3Kの非自明なデータ(既存のデータスケールの20.9%)しか使用しない優れた方法として、競合する識別性を達成していることが示された。
さらに、ReID-Rは本質的な推論の恩恵を受け、結果に対する高品質な解釈を提供することができる。
関連論文リスト
- Search-R2: Enhancing Search-Integrated Reasoning via Actor-Refiner Collaboration [49.9937230730202]
本稿では,新たなアクター・リファイナ・コラボレーション・フレームワークであるSearch-R2を提案する。
提案手法は,生成過程をアクターに分解し,最初の推論軌道を生成する。
本稿では,検索-R2がモデルスケール全体にわたって強力なRAGとRLベースのベースラインを一貫して上回ることを示す。
論文 参考訳(メタデータ) (2026-02-03T15:32:09Z) - Identity Clue Refinement and Enhancement for Visible-Infrared Person Re-Identification [20.544872117860915]
Visible-Infrared Person Re-Identification (VI-ReID) は、重要なモダリティの相違による、異種間マッチングの課題である。
本稿では,モダリティ固有の属性に固有の暗黙的な識別的知識をマイニングし,活用するために,ICRE(Identity Clue Refinement and Enhancement)ネットワークを提案する。
論文 参考訳(メタデータ) (2025-12-04T07:13:38Z) - Unleashing the Potential of Pre-Trained Diffusion Models for Generalizable Person Re-Identification [14.03857911886461]
ドメイン一般化可能な再識別(DG Re-ID)は、1つ以上のソースドメインでモデルをトレーニングし、目に見えないターゲットドメインのパフォーマンスを評価することを目的としている。
相関型条件付スキームを用いた拡散モデル支援表現学習法を提案する。
本手法は,相関型条件付スキームを用いて,差別的でコントラストのあるRe-IDモデルと事前学習した拡散モデルを統合する。
論文 参考訳(メタデータ) (2025-02-10T16:16:34Z) - Exploring Stronger Transformer Representation Learning for Occluded Person Re-Identification [2.552131151698595]
我々はトランスフォーマーに基づく人物識別フレームワークであるSSSC-TransReIDを組み合わせた新しい自己監督・監督手法を提案した。
我々は、ネガティブなサンプルや追加の事前学習なしに、人物の再識別のための特徴表現を強化することができる自己教師付きコントラスト学習ブランチを設計した。
提案モデルでは, 平均平均精度(mAP) とランク1の精度において, 最先端のReID手法よりも優れたRe-ID性能が得られ, 高いマージンで性能が向上する。
論文 参考訳(メタデータ) (2024-10-21T03:17:25Z) - VILLS -- Video-Image Learning to Learn Semantics for Person Re-Identification [51.89551385538251]
VILLS (Video-Image Learning to Learn Semantics) は画像やビデオから空間的特徴と時間的特徴を共同で学習する自己教師型手法である。
VILLSはまず、意味的一貫性と頑健な空間的特徴を適応的に抽出する局所意味抽出モジュールを設計する。
そして、VILLSは、一貫した特徴空間における画像とビデオのモダリティを表現するために、統合された特徴学習および適応モジュールを設計する。
論文 参考訳(メタデータ) (2023-11-27T19:30:30Z) - Learning Domain Invariant Representations for Generalizable Person
Re-Identification [71.35292121563491]
ReID(Generalizable person Re-Identification)は、最近のコンピュータビジョンコミュニティで注目を集めている。
DIR-ReID(Domain Invariant Representations for Generalizable Person Re-Identification)という新しい一般化フレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-29T18:59:48Z) - Style Normalization and Restitution for Generalizable Person
Re-identification [89.482638433932]
我々は、ソースドメイン上でモデルをトレーニングするが、ターゲットドメイン上での一般化や性能をよく行うことのできる、一般化可能な人物ReIDフレームワークを設計する。
本稿では,シンプルで効果的なスタイル正規化・再構成(SNR)モジュールを提案する。
SNRモジュールによって強化された我々のモデルは、複数の広く使われているReIDベンチマークにおいて最先端のドメイン一般化アプローチよりも大幅に優れている。
論文 参考訳(メタデータ) (2020-05-22T07:15:10Z) - Cross-Resolution Adversarial Dual Network for Person Re-Identification
and Beyond [59.149653740463435]
人物再識別(re-ID)は、同一人物の画像をカメラビューでマッチングすることを目的としている。
カメラと関心のある人の距離が異なるため、解像度ミスマッチが期待できる。
本稿では,クロスレゾリューションな人物のリIDに対処する新たな生成的対向ネットワークを提案する。
論文 参考訳(メタデータ) (2020-02-19T07:21:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。