論文の概要: Learning to Disentangle Scenes for Person Re-identification
- arxiv url: http://arxiv.org/abs/2111.05476v1
- Date: Wed, 10 Nov 2021 01:17:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-11 15:03:17.591556
- Title: Learning to Disentangle Scenes for Person Re-identification
- Title(参考訳): 人物再識別のためのシーンの切り離し学習
- Authors: Xianghao Zang, Ge Li, Wei Gao, Xiujun Shu
- Abstract要約: 本稿では,人物再識別タスク(ReID)の分割・調整を提案する。
我々は複数の自己超越操作を用いて、異なる課題をシミュレートし、異なるネットワークを用いて各課題に対処する。
1つのマスターブランチと2つのサーヴァントブランチを含む一般的なマルチブランチネットワークが、異なるシーンを扱うために導入された。
- 参考スコア(独自算出の注目度): 15.378033331385312
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: There are many challenging problems in the person re-identification (ReID)
task, such as the occlusion and scale variation. Existing works usually tried
to solve them by employing a one-branch network. This one-branch network needs
to be robust to various challenging problems, which makes this network
overburdened. This paper proposes to divide-and-conquer the ReID task. For this
purpose, we employ several self-supervision operations to simulate different
challenging problems and handle each challenging problem using different
networks. Concretely, we use the random erasing operation and propose a novel
random scaling operation to generate new images with controllable
characteristics. A general multi-branch network, including one master branch
and two servant branches, is introduced to handle different scenes. These
branches learn collaboratively and achieve different perceptive abilities. In
this way, the complex scenes in the ReID task are effectively disentangled, and
the burden of each branch is relieved. The results from extensive experiments
demonstrate that the proposed method achieves state-of-the-art performances on
three ReID benchmarks and two occluded ReID benchmarks. Ablation study also
shows that the proposed scheme and operations significantly improve the
performance in various scenes.
- Abstract(参考訳): 人物再同定(reid:person re-identification)タスクには、咬合やスケールの変動など、多くの課題がある。
既存の作品は通常、ワンブランチネットワークを使用することで解決しようとした。
このワンブランチネットワークは、様々な困難な問題に対して堅牢でなければならない。
本稿では,ReIDタスクの分割と分割を提案する。
本研究では,複数の自己超越操作を用いて,異なる課題をシミュレートし,異なるネットワークを用いて各課題に対処する。
具体的には, ランダム消去操作を用いて, 制御可能な特徴を持つ新しい画像を生成するために, 新たなランダムスケーリング演算を提案する。
異なるシーンを扱うために、1つのマスターブランチと2つのサーヴァントブランチを含む一般的なマルチブランチネットワークが導入される。
これらの分枝は協調的に学習し、異なる知覚能力を達成する。
このようにして、reidタスクの複雑なシーンを効果的に分離し、各ブランチの負担を軽減させる。
実験結果から,提案手法は3つのReIDベンチマークと2つの隠蔽されたReIDベンチマークに対して,最先端の性能を実現することを示した。
アブレーション研究は,提案手法と操作により,様々な場面における性能が著しく向上することを示した。
関連論文リスト
- RepVF: A Unified Vector Fields Representation for Multi-task 3D Perception [64.80760846124858]
本稿では,様々な知覚タスクの表現を調和させる新しい統一表現RepVFを提案する。
RepVFは、ベクトル場を通じてシーン内の異なるターゲットの構造を特徴付け、シングルヘッドでマルチタスクの学習モデルを可能にする。
RepVF 上に構築された RFTR は,タスク間の固有性を利用したネットワークである。
論文 参考訳(メタデータ) (2024-07-15T16:25:07Z) - A Versatile Framework for Multi-scene Person Re-identification [30.74494316484783]
人物再識別(ReID)は、重複しないカメラビュー間で同一人物の画像の関連を学習するために、10年間にわたって広く開発されてきた。
多くのReID変種の性能にもかかわらず、これらの変種は典型的には明確に機能し、他の問題にも適用できない。
この研究は、このような問題を解決するために多目的ReIDモデルを学習する最初の試みに寄与する。
論文 参考訳(メタデータ) (2024-03-17T07:04:09Z) - A Dynamic Feature Interaction Framework for Multi-task Visual Perception [100.98434079696268]
複数の共通認識課題を解決するための効率的な統合フレームワークを考案する。
これらのタスクには、インスタンスセグメンテーション、セマンティックセグメンテーション、モノクル3D検出、深さ推定が含まれる。
提案するフレームワークはD2BNetと呼ばれ,マルチタスク認識のためのパラメータ効率予測に一意なアプローチを示す。
論文 参考訳(メタデータ) (2023-06-08T09:24:46Z) - Single-branch Network for Multimodal Training [19.690844799632327]
本稿では,ネットワークを変更することなく,一助詞の識別表現とマルチモーダルタスクを学習できる新しい単一ブランチネットワークを提案する。
本提案手法は,クロスモーダル検証と各種損失定式化タスクの整合性に挑戦するマルチモーダル問題(対面音声アソシエーション)に基づいて,提案したシングルブランチネットワークの評価を行う。
論文 参考訳(メタデータ) (2023-03-10T18:48:40Z) - Transformer Based Multi-Grained Features for Unsupervised Person
Re-Identification [9.874360118638918]
視覚変換器(ViT)を改良したデュアルブランチネットワークアーキテクチャを構築した。
各ブランチで出力されるローカルトークンをリフォームし、その後一様に複数のストライプに分割して、部分レベルの特徴を生成する。
2つのブランチのグローバルトークンは、グローバル機能を生成するために平均化されます。
論文 参考訳(メタデータ) (2022-11-22T13:51:17Z) - Multi-Task Learning with Sequence-Conditioned Transporter Networks [67.57293592529517]
シーケンスコンディショニングと重み付きサンプリングのレンズによるマルチタスク学習の実現を目指している。
合成タスクを対象とした新しいベンチマークであるMultiRavensを提案する。
次に,視覚に基づくエンドツーエンドシステムアーキテクチャであるSequence-Conditioned Transporter Networksを提案する。
論文 参考訳(メタデータ) (2021-09-15T21:19:11Z) - Semantic Consistency and Identity Mapping Multi-Component Generative
Adversarial Network for Person Re-Identification [39.605062525247135]
本稿では,1つのドメインから複数のドメインへのスタイル適応を提供する,意味一貫性とアイデンティティマッピングの多成分生成対向ネットワーク(SC-IMGAN)を提案する。
提案手法は,6つの挑戦的人物リidデータセットにおける最先端技術よりも優れている。
論文 参考訳(メタデータ) (2021-04-28T14:12:29Z) - Decoupled and Memory-Reinforced Networks: Towards Effective Feature
Learning for One-Step Person Search [65.51181219410763]
歩行者検出と識別サブタスクを1つのネットワークで処理するワンステップ方式を開発しました。
現在のワンステップアプローチには2つの大きな課題があります。
本稿では,これらの問題を解決するために,分離メモリ強化ネットワーク(DMRNet)を提案する。
論文 参考訳(メタデータ) (2021-02-22T06:19:45Z) - Recurrent Multi-view Alignment Network for Unsupervised Surface
Registration [79.72086524370819]
非厳格な登録をエンドツーエンドで学習することは、本質的に高い自由度とラベル付きトレーニングデータの欠如により困難である。
我々は、いくつかの剛性変換のポイントワイドな組み合わせで、非剛性変換を表現することを提案する。
また,投影された多視点2次元深度画像上での3次元形状の類似度を計測する可微分損失関数も導入する。
論文 参考訳(メタデータ) (2020-11-24T14:22:42Z) - Challenge-Aware RGBT Tracking [32.88141817679821]
本稿では,モダリティに偏った課題と,モダリティに特有の課題に対処する,新たな課題認識ニューラルネットワークを提案する。
提案手法は,3つのベンチマークデータセット上での最先端手法に対して高い性能を保ちながら,リアルタイムに動作可能であることを示す。
論文 参考訳(メタデータ) (2020-07-26T15:11:44Z) - Reparameterizing Convolutions for Incremental Multi-Task Learning
without Task Interference [75.95287293847697]
マルチタスクモデルを開発する際の2つの一般的な課題は、しばしば文献で見過ごされる。
まず、モデルを本質的に漸進的に可能にし、以前に学んだことを忘れずに新しいタスクから情報を継続的に取り入れる(インクリメンタルラーニング)。
第二に、タスク間の有害な相互作用を排除し、マルチタスク設定(タスク干渉)においてシングルタスクのパフォーマンスを著しく低下させることが示されている。
論文 参考訳(メタデータ) (2020-07-24T14:44:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。