論文の概要: Resolution-invariant Person ReID Based on Feature Transformation and
Self-weighted Attention
- arxiv url: http://arxiv.org/abs/2101.04544v2
- Date: Mon, 18 Jan 2021 02:50:42 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-04 01:43:41.933366
- Title: Resolution-invariant Person ReID Based on Feature Transformation and
Self-weighted Attention
- Title(参考訳): 特徴変換と自己重み付け注意に基づくレゾリューション不変人物reid
- Authors: Ziyue Zhang, Shuai Jiang, Congzhentao Huang, Richard Yi Da Xu
- Abstract要約: Person Re-identification (ReID) は、画像やビデオのシーケンスで同一人物と一致することを目的としたコンピュータビジョンタスクである。
本研究では,ReID特徴変換(RAFT)モジュールとSWA(Self-weighted attention)ReIDモジュールを備えた,新しい2ストリームネットワークを提案する。
どちらのモジュールも、解決不変表現を得るために共同で訓練される。
- 参考スコア(独自算出の注目度): 14.777001614779806
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Person Re-identification (ReID) is a critical computer vision task which aims
to match the same person in images or video sequences. Most current works focus
on settings where the resolution of images is kept the same. However, the
resolution is a crucial factor in person ReID, especially when the cameras are
at different distances from the person or the camera's models are different
from each other. In this paper, we propose a novel two-stream network with a
lightweight resolution association ReID feature transformation (RAFT) module
and a self-weighted attention (SWA) ReID module to evaluate features under
different resolutions. RAFT transforms the low resolution features to
corresponding high resolution features. SWA evaluates both features to get
weight factors for the person ReID. Both modules are jointly trained to get a
resolution-invariant representation. Extensive experiments on five benchmark
datasets show the effectiveness of our method. For instance, we achieve Rank-1
accuracy of 43.3% and 83.2% on CAVIAR and MLR-CUHK03, outperforming the
state-of-the-art.
- Abstract(参考訳): Person Re-identification (ReID) は、画像やビデオのシーケンスで同一人物と一致することを目的としたコンピュータビジョンタスクである。
現在の作品のほとんどは、画像の解像度が同じである設定に焦点を当てている。
しかし、この解像度は人物のReIDにおいて重要な要素であり、特にカメラが人物と異なる距離にある場合や、カメラのモデルが異なる場合などである。
本稿では,RID特徴変換(RAFT)モジュールと自己重み付きアテンション(SWA)ReIDモジュールを組み合わせた2ストリームネットワークを提案する。
RAFTは低解像度特徴を対応する高解像度特徴に変換する。
SWAは、両方の特徴を評価して、ReIDの重み付けを行う。
どちらのモジュールも解像度不変表現を得るために共同で訓練されている。
5つのベンチマークデータセットの大規模な実験により,本手法の有効性が示された。
例えば、caviar と mlr-cuhk03 における rank-1 の精度は43.3% と 83.2% である。
関連論文リスト
- Multi-task Image Restoration Guided By Robust DINO Features [88.74005987908443]
DINOv2から抽出したロバストな特徴を利用したマルチタスク画像復元手法であるmboxtextbfDINO-IRを提案する。
まず,DINOV2の浅い特徴を動的に融合するPSF (Pixel-semantic fusion) モジュールを提案する。
これらのモジュールを統一された深層モデルに定式化することにより、モデルトレーニングを制約するために、DINO知覚の対照的な損失を提案する。
論文 参考訳(メタデータ) (2023-12-04T06:59:55Z) - ResFormer: Scaling ViTs with Multi-Resolution Training [100.01406895070693]
私たちはResFormerを紹介します。ResFormerは、広く、ほとんど目に見えない、テストの解像度でパフォーマンスを改善するフレームワークです。
特にResFormerは、異なる解像度の再現されたイメージを実行し、さまざまなスケールでインタラクティブな情報をエンゲージするスケール一貫性の損失を強制する。
さらに、ResFormerは柔軟性があり、セマンティックセグメンテーション、オブジェクト検出、ビデオアクション認識に容易に拡張できることを示す。
論文 参考訳(メタデータ) (2022-12-01T18:57:20Z) - Learning Resolution-Adaptive Representations for Cross-Resolution Person
Re-Identification [49.57112924976762]
低解像度(LR)クエリIDイメージと高解像度(HR)ギャラリーイメージとの整合性を実現する。
実際のカメラとの違いにより、クエリ画像が分解能の低下に悩まされることがしばしばあるため、これは困難かつ実用的な問題である。
本稿では,問合せ画像の解像度に適応する動的計量を用いて,HRとLRの画像を直接比較するためのSRフリーなパラダイムについて検討する。
論文 参考訳(メタデータ) (2022-07-09T03:49:51Z) - Resolution based Feature Distillation for Cross Resolution Person
Re-Identification [17.86505685442293]
人物の再識別(re-id)は、異なるカメラビューで同一人物の画像を取得することを目的としている。
解像度のミスマッチは、興味のある人とカメラの間の距離が異なるため起こる。
本稿では,複数の解像度の問題を克服するために,分解能に基づく特徴蒸留(RFD)アプローチを提案する。
論文 参考訳(メタデータ) (2021-09-16T11:07:59Z) - Robust Reference-based Super-Resolution via C2-Matching [77.51610726936657]
超解像(Ref-SR)は、最近、高分解能(HR)参照画像を導入して、低分解能(LR)入力画像を強化するための有望なパラダイムとして登場した。
既存のRef-SR法は主に暗黙の対応に頼り、参照画像からHRテクスチャを借用し、入力画像の情報損失を補う。
本稿では,C2-Matchingを提案する。
論文 参考訳(メタデータ) (2021-06-03T16:40:36Z) - Deep High-Resolution Representation Learning for Cross-Resolution Person
Re-identification [22.104449922937338]
人物再識別(re-ID)は、異なるカメラから同一人物像と同一人物像をマッチングする問題に取り組む。
この問題を解決するために,PS-HRNet(Deep High-Resolution Pseudo-Siamese Framework)を提案する。
提案したPS-HRNetは,MLR-Market-1501,MLR-CUHK03,MLR-VIPeR,MLR-DukeMTMC-reID,CAVIARデータセット上でRan-1で3.4%,6.2%,2.5%,1.1%,4.2%の改善を行った。
論文 参考訳(メタデータ) (2021-05-25T07:45:38Z) - Pose Invariant Person Re-Identification using Robust Pose-transformation
GAN [11.338815177557645]
人物再識別(re-ID)は、興味ある人物の単一の事例から、画像ギャラリーから人物の画像を検索することを目的としている。
いくつかの進歩にもかかわらず、ロバストな人物再同定のための識別的アイデンティティ感と視点不変特徴の学習は、人間のポーズの変化が大きいため、大きな課題である。
本稿では,ポーズ回帰と特徴融合を組み合わせた生成逆数ネットワークの画像生成機能を利用して,ポーズ不変な特徴学習を実現するre-IDパイプラインを提案する。
論文 参考訳(メタデータ) (2021-04-11T15:47:03Z) - DDet: Dual-path Dynamic Enhancement Network for Real-World Image
Super-Resolution [69.2432352477966]
実画像超解像(Real-SR)は、実世界の高分解能画像(HR)と低分解能画像(LR)の関係に焦点を当てている。
本稿では,Real-SRのためのデュアルパス動的拡張ネットワーク(DDet)を提案する。
特徴表現のための大規模な畳み込みブロックを積み重ねる従来の手法とは異なり、非一貫性のある画像対を研究するためのコンテンツ認識フレームワークを導入する。
論文 参考訳(メタデータ) (2020-02-25T18:24:51Z) - Cross-Resolution Adversarial Dual Network for Person Re-Identification
and Beyond [59.149653740463435]
人物再識別(re-ID)は、同一人物の画像をカメラビューでマッチングすることを目的としている。
カメラと関心のある人の距離が異なるため、解像度ミスマッチが期待できる。
本稿では,クロスレゾリューションな人物のリIDに対処する新たな生成的対向ネットワークを提案する。
論文 参考訳(メタデータ) (2020-02-19T07:21:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。