論文の概要: Decoupled and Memory-Reinforced Networks: Towards Effective Feature
Learning for One-Step Person Search
- arxiv url: http://arxiv.org/abs/2102.10795v1
- Date: Mon, 22 Feb 2021 06:19:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-23 15:21:23.125568
- Title: Decoupled and Memory-Reinforced Networks: Towards Effective Feature
Learning for One-Step Person Search
- Title(参考訳): decoupled and memory-reinforced network : one-step person searchのための効果的な特徴学習に向けて
- Authors: Chuchu Han, Zhedong Zheng, Changxin Gao, Nong Sang, Yi Yang
- Abstract要約: 歩行者検出と識別サブタスクを1つのネットワークで処理するワンステップ方式を開発しました。
現在のワンステップアプローチには2つの大きな課題があります。
本稿では,これらの問題を解決するために,分離メモリ強化ネットワーク(DMRNet)を提案する。
- 参考スコア(独自算出の注目度): 65.51181219410763
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The goal of person search is to localize and match query persons from scene
images. For high efficiency, one-step methods have been developed to jointly
handle the pedestrian detection and identification sub-tasks using a single
network. There are two major challenges in the current one-step approaches. One
is the mutual interference between the optimization objectives of multiple
sub-tasks. The other is the sub-optimal identification feature learning caused
by small batch size when end-to-end training. To overcome these problems, we
propose a decoupled and memory-reinforced network (DMRNet). Specifically, to
reconcile the conflicts of multiple objectives, we simplify the standard
tightly coupled pipelines and establish a deeply decoupled multi-task learning
framework. Further, we build a memory-reinforced mechanism to boost the
identification feature learning. By queuing the identification features of
recently accessed instances into a memory bank, the mechanism augments the
similarity pair construction for pairwise metric learning. For better encoding
consistency of the stored features, a slow-moving average of the network is
applied for extracting these features. In this way, the dual networks reinforce
each other and converge to robust solution states. Experimentally, the proposed
method obtains 93.2% and 46.9% mAP on CUHK-SYSU and PRW datasets, which exceeds
all the existing one-step methods.
- Abstract(参考訳): 人物検索のゴールは、シーンイメージから質問者をローカライズし、マッチングすることである。
高効率のために、単一ネットワークを用いて歩行者検出と識別サブタスクを共同処理するワンステップ手法が開発されている。
現在のワンステップアプローチには2つの大きな課題があります。
1つは、複数のサブタスクの最適化目標間の相互干渉である。
もう1つは、エンドツーエンドのトレーニング時に小さなバッチサイズによって引き起こされる最適の識別機能学習です。
これらの問題を解決するために,分離型メモリ強化ネットワーク(DMRNet)を提案する。
具体的には、複数の目的の矛盾を解決するために、標準の密結合パイプラインを簡素化し、深く分離されたマルチタスク学習フレームワークを確立する。
さらに,認識機能学習を促進するために,メモリ強化機構を構築する。
最近アクセスされたインスタンスの識別機能をメモリバンクにキューすることで、このメカニズムはペアワイズメトリックラーニングの類似性ペア構築を増強する。
保存された特徴の一貫性をより良くエンコードするために、これらの特徴を抽出するために、ネットワークの遅い移動平均が適用される。
このように、二重ネットワークは互いに強化し、堅牢な解状態に収束する。
提案手法は、CUHK-SYSUおよびPRWデータセット上で93.2%および46.9%のmAPを得る。
関連論文リスト
- GSSF: Generalized Structural Sparse Function for Deep Cross-modal Metric Learning [51.677086019209554]
ペアワイド類似性学習のためのモダリティ間の強力な関係を捕捉する汎用構造スパースを提案する。
距離メートル法は、対角線とブロック対角線の2つの形式を微妙にカプセル化する。
クロスモーダルと2つの余分なユニモーダル検索タスクの実験は、その優位性と柔軟性を検証した。
論文 参考訳(メタデータ) (2024-10-20T03:45:50Z) - AMFD: Distillation via Adaptive Multimodal Fusion for Multispectral Pedestrian Detection [23.91870504363899]
マルチスペクトル検出におけるダブルストリームネットワークは、マルチモーダルデータに2つの異なる特徴抽出枝を用いる。
これにより、組み込みデバイスにおける多スペクトル歩行者検出が自律システムに広く採用されるのを妨げている。
本稿では,教師ネットワークの本来のモーダル特徴を完全に活用できる適応型モーダル核融合蒸留(AMFD)フレームワークについて紹介する。
論文 参考訳(メタデータ) (2024-05-21T17:17:17Z) - Object Segmentation by Mining Cross-Modal Semantics [68.88086621181628]
マルチモーダル特徴の融合と復号を導くために,クロスモーダル・セマンティックスをマイニングする手法を提案する。
具体的には,(1)全周減衰核融合(AF),(2)粗大デコーダ(CFD),(3)多層自己超越からなる新しいネットワークXMSNetを提案する。
論文 参考訳(メタデータ) (2023-05-17T14:30:11Z) - Learning to Learn with Indispensable Connections [6.040904021861969]
本稿では,メタ-LTHと呼ばれるメタ-LTHと呼ばれるメタ-ラーニング手法を提案する。
本手法は,オムニグロットデータセットの分類精度を約2%向上させる。
論文 参考訳(メタデータ) (2023-04-06T04:53:13Z) - OFA$^2$: A Multi-Objective Perspective for the Once-for-All Neural
Architecture Search [79.36688444492405]
once-for-All(OFA)は、異なるリソース制約を持つデバイスのための効率的なアーキテクチャを探索する問題に対処するために設計された、ニューラルネットワーク検索(NAS)フレームワークである。
我々は,探索段階を多目的最適化問題として明示的に考えることにより,効率の追求を一歩進めることを目指している。
論文 参考訳(メタデータ) (2023-03-23T21:30:29Z) - Transformer-based assignment decision network for multiple object
tracking [0.0]
本稿では,データアソシエーションに取り組むトランスフォーマーベースのアサインメント決定ネットワーク(TADN)について,推論中に明示的な最適化を必要とせずに紹介する。
提案手法は,トラッカーとしての単純な性質にもかかわらず,ほとんどの評価指標において最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2022-08-06T19:47:32Z) - Multi-object Tracking with a Hierarchical Single-branch Network [31.680667324595557]
階層的な単一ブランチネットワークに基づくオンライン多目的追跡フレームワークを提案する。
新たなiHOIM損失関数は,2つのサブタスクの目的を統一し,より優れた検出性能を実現する。
MOT16とMOT20データセットの実験結果から,最先端のトラッキング性能が達成できた。
論文 参考訳(メタデータ) (2021-01-06T12:14:58Z) - Diverse Knowledge Distillation for End-to-End Person Search [81.4926655119318]
人物検索は、画像ギャラリーから特定の人物をローカライズし識別することを目的としている。
最近の手法は2つのグループ、すなわち2段階とエンドツーエンドのアプローチに分類できる。
ボトルネックを解消するために、多様な知識蒸留を備えたシンプルで強力なエンドツーエンドネットワークを提案します。
論文 参考訳(メタデータ) (2020-12-21T09:04:27Z) - MetaGater: Fast Learning of Conditional Channel Gated Networks via
Federated Meta-Learning [46.79356071007187]
本稿では,バックボーンネットワークとチャネルゲーティングを協調的にトレーニングするための総合的なアプローチを提案する。
我々は,バックボーンネットワークとゲーティングモジュールの両方において,優れたメタ初期化を共同で学習するための,連携型メタ学習手法を開発した。
論文 参考訳(メタデータ) (2020-11-25T04:26:23Z) - FairMOT: On the Fairness of Detection and Re-Identification in Multiple
Object Tracking [92.48078680697311]
マルチオブジェクトトラッキング(MOT)はコンピュータビジョンにおいて重要な問題である。
本稿では,FairMOTと呼ばれる,アンカーフリーなオブジェクト検出アーキテクチャCenterNetをベースとした,シンプルかつ効果的なアプローチを提案する。
このアプローチは、検出と追跡の両方において高い精度を達成する。
論文 参考訳(メタデータ) (2020-04-04T08:18:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。