論文の概要: Neural Feature Search for RGB-Infrared Person Re-Identification
- arxiv url: http://arxiv.org/abs/2104.02366v1
- Date: Tue, 6 Apr 2021 08:40:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-07 14:06:44.507097
- Title: Neural Feature Search for RGB-Infrared Person Re-Identification
- Title(参考訳): rgb-infrared person再同定のための神経特徴探索
- Authors: Yehansen Chen, Lin Wan, Zhihang Li, Qianyan Jing, Zongyuan Sun
- Abstract要約: 我々はニューラル・フィーチャー・サーチ(NFS)と呼ばれる一般的なパラダイムを研究し、特徴選択のプロセスを自動化する。
NFSは、二重レベルの特徴探索空間と微分可能な探索戦略を組み合わせて、粗粒度チャネルと細粒度空間画素のアイデンティティ関連キューを共同で選択する。
本手法は,主流ベンチマークにおける最先端の手法よりも優れる。
- 参考スコア(独自算出の注目度): 3.499870393443268
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: RGB-Infrared person re-identification (RGB-IR ReID) is a challenging
cross-modality retrieval problem, which aims at matching the person-of-interest
over visible and infrared camera views. Most existing works achieve performance
gains through manually-designed feature selection modules, which often require
significant domain knowledge and rich experience. In this paper, we study a
general paradigm, termed Neural Feature Search (NFS), to automate the process
of feature selection. Specifically, NFS combines a dual-level feature search
space and a differentiable search strategy to jointly select identity-related
cues in coarse-grained channels and fine-grained spatial pixels. This
combination allows NFS to adaptively filter background noises and concentrate
on informative parts of human bodies in a data-driven manner. Moreover, a
cross-modality contrastive optimization scheme further guides NFS to search
features that can minimize modality discrepancy whilst maximizing inter-class
distance. Extensive experiments on mainstream benchmarks demonstrate that our
method outperforms state-of-the-arts, especially achieving better performance
on the RegDB dataset with significant improvement of 11.20% and 8.64% in Rank-1
and mAP, respectively.
- Abstract(参考訳): RGB-赤外線人物再識別(RGB-IR ReID)は、可視・赤外線カメラビューに対して興味のある人物をマッチングすることを目的とした、異質性検索問題である。
既存の作業の多くは,手作業で設計した機能選択モジュールを通じてパフォーマンス向上を実現している。
本稿では,ニューラル・フィーチャー・サーチ(nfs)と呼ばれる汎用パラダイムを用いて,特徴選択のプロセスを自動化する。
具体的には、NFSは二重レベルの特徴探索空間と微分可能な探索戦略を組み合わせて、粗粒度チャネルと細粒度空間画素のアイデンティティ関連キューを共同で選択する。
この組み合わせにより、NFSはバックグラウンドノイズを適応的にフィルタリングし、データ駆動方式で人体の情報的部分に集中することができる。
さらに、クロスモダリティコントラスト最適化スキームは、クラス間距離を最大化しながらモダリティの不一致を最小化できる検索特徴にnfsをさらに導く。
メインストリームベンチマークでの広範な実験により、この手法は最先端のデータベースよりも優れており、特にregdbデータセットでパフォーマンスが向上し、rank-1とmapでそれぞれ11.20%と8.64%の改善が得られた。
関連論文リスト
- High-Order Structure Based Middle-Feature Learning for Visible-Infrared
Person Re-Identification [37.954344873390106]
Visible-Infrared person re-identification (VI-ReID) は、可視光(VIS)と赤外線(IR)カメラで捉えた人物の画像を取得することを目的としている。
既存のVI-ReID法では,特徴の高次構造情報を無視すると同時に,適切な共通特徴空間の学習が比較的困難である。
実効的なVI-ReIDのための新しい高次構造に基づく中高次学習ネットワーク(HOS-Net)を提案する。
論文 参考訳(メタデータ) (2023-12-13T02:48:03Z) - Point-aware Interaction and CNN-induced Refinement Network for RGB-D
Salient Object Detection [95.84616822805664]
我々は,CNNによるトランスフォーマーアーキテクチャを導入し,ポイント・アウェア・インタラクションとCNNによるリファインメントを備えた新しいRGB-D SODネットワークを提案する。
トランスフォーマーがもたらすブロック効果とディテール破壊問題を自然に軽減するために,コンテンツリファインメントとサプリメントのためのCNNRユニットを設計する。
論文 参考訳(メタデータ) (2023-08-17T11:57:49Z) - CIR-Net: Cross-modality Interaction and Refinement for RGB-D Salient
Object Detection [144.66411561224507]
本稿では,CIR-Netと呼ばれる畳み込みニューラルネットワーク(CNN)モデルを提案する。
我々のネットワークは、定性的かつ定量的に最先端の塩分濃度検出器より優れています。
論文 参考訳(メタデータ) (2022-10-06T11:59:19Z) - Dual Swin-Transformer based Mutual Interactive Network for RGB-D Salient
Object Detection [67.33924278729903]
本研究では,Dual Swin-Transformerを用いたMutual Interactive Networkを提案する。
視覚入力における長距離依存をモデル化するために,RGBと奥行きモードの両方の機能抽出器としてSwin-Transformerを採用している。
5つの標準RGB-D SODベンチマークデータセットに関する総合的な実験は、提案手法の優位性を実証している。
論文 参考訳(メタデータ) (2022-06-07T08:35:41Z) - Enhanced Exploration in Neural Feature Selection for Deep Click-Through
Rate Prediction Models via Ensemble of Gating Layers [7.381829794276824]
神経機能選択(NFS)の目標は、最も説明力のある比較的小さな機能のサブセットを選択することである。
ゲーティングアプローチは、情報の少ない特徴をドロップするために、識別可能なバイナリゲートのセットを挿入する。
勾配に基づく解の探索能力を向上させるために,単純だが効果的なアンサンブル学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-07T04:37:05Z) - MSO: Multi-Feature Space Joint Optimization Network for RGB-Infrared
Person Re-Identification [35.97494894205023]
RGB-infrared cross-modality person re-identification (ReID) タスクは、可視モダリティと赤外線モダリティの同一性の画像を認識することを目的としている。
既存の手法は主に2ストリームアーキテクチャを使用して、最終的な共通特徴空間における2つのモード間の相違を取り除く。
単一モダリティ空間と共通空間の両方において、モダリティ調和可能な特徴を学習できる新しい多機能空間共同最適化(MSO)ネットワークを提案する。
論文 参考訳(メタデータ) (2021-10-21T16:45:23Z) - CM-NAS: Cross-Modality Neural Architecture Search for Visible-Infrared
Person Re-Identification [102.89434996930387]
VI-ReIDは、暗い環境での単一モダリティ人物ReIDの制限を突破し、クロスモダリティ歩行者のイメージを一致させることを目指しています。
既存の作品は、さまざまな2ストリームアーキテクチャを手動で設計して、モダリティ固有およびモダリティシャーブル表現を別々に学習する。
CM-NAS(Cross-Modality Neural Architecture Search)という手法を提案する。
論文 参考訳(メタデータ) (2021-01-21T07:07:00Z) - RGB-D Salient Object Detection with Cross-Modality Modulation and
Selection [126.4462739820643]
本稿では, RGB-D Salient Object Detection (SOD) において, モジュール間相補性を段階的に統合し, 改良する有効な方法を提案する。
提案するネットワークは,1)RGB画像とそれに対応する深度マップからの補完情報を効果的に統合する方法,および2)より精度の高い特徴を適応的に選択する方法の2つの課題を主に解決する。
論文 参考訳(メタデータ) (2020-07-14T14:22:50Z) - Skeleton Focused Human Activity Recognition in RGB Video [11.521107108725188]
骨格とRGBの両モードを併用したマルチモーダル特徴融合モデルを提案する。
モデルは、エンドツーエンドの方法で、バックプロパゲーションアルゴリズムによって個別または均一にトレーニングすることができる。
論文 参考訳(メタデータ) (2020-04-29T06:40:42Z) - ASFD: Automatic and Scalable Face Detector [129.82350993748258]
ASFD(Automatic and Scalable Face Detector)を提案する。
ASFDはニューラルアーキテクチャ検索技術の組み合わせと新たな損失設計に基づいている。
ASFD-D0は120FPS以上で動作し、MobilenetはVGA解像度の画像を撮影しています。
論文 参考訳(メタデータ) (2020-03-25T06:00:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。