論文の概要: CM-NAS: Cross-Modality Neural Architecture Search for Visible-Infrared
Person Re-Identification
- arxiv url: http://arxiv.org/abs/2101.08467v2
- Date: Thu, 18 Mar 2021 07:48:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-21 07:55:52.163029
- Title: CM-NAS: Cross-Modality Neural Architecture Search for Visible-Infrared
Person Re-Identification
- Title(参考訳): CM-NAS:可視赤外人物再同定のためのクロスモーダルニューラルネットワーク探索
- Authors: Chaoyou Fu, Yibo Hu, Xiang Wu, Hailin Shi, Tao Mei, Ran He
- Abstract要約: VI-ReIDは、暗い環境での単一モダリティ人物ReIDの制限を突破し、クロスモダリティ歩行者のイメージを一致させることを目指しています。
既存の作品は、さまざまな2ストリームアーキテクチャを手動で設計して、モダリティ固有およびモダリティシャーブル表現を別々に学習する。
CM-NAS(Cross-Modality Neural Architecture Search)という手法を提案する。
- 参考スコア(独自算出の注目度): 102.89434996930387
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visible-Infrared person re-identification (VI-ReID) aims to match
cross-modality pedestrian images, breaking through the limitation of
single-modality person ReID in dark environment. In order to mitigate the
impact of large modality discrepancy, existing works manually design various
two-stream architectures to separately learn modality-specific and
modality-sharable representations. Such a manual design routine, however,
highly depends on massive experiments and empirical practice, which is time
consuming and labor intensive. In this paper, we systematically study the
manually designed architectures, and identify that appropriately separating
Batch Normalization (BN) layers is the key to bring a great boost towards
cross-modality matching. Based on this observation, the essential objective is
to find the optimal separation scheme for each BN layer. To this end, we
propose a novel method, named Cross-Modality Neural Architecture Search
(CM-NAS). It consists of a BN-oriented search space in which the standard
optimization can be fulfilled subject to the cross-modality task. Equipped with
the searched architecture, our method outperforms state-of-the-art counterparts
in both two benchmarks, improving the Rank-1/mAP by 6.70%/6.13% on SYSU-MM01
and by 12.17%/11.23% on RegDB. In light of its simplicity and effectiveness, we
expect CM-NAS will serve as a strong baseline for future research. Code will be
made available.
- Abstract(参考訳): Visible-Infrared person re-identification (VI-ReID) は、暗黒環境下での単一モダリティ人物ReIDの限界を突破し、モダリティ横断歩行者画像のマッチングを目的としている。
大きなモダリティの相違の影響を軽減するために、既存の作業は、モダリティ固有の表現とモダリティの相違を個別に学習するために、様々な2ストリームアーキテクチャを手動で設計する。
しかし、このような手動設計のルーチンは、膨大な実験と経験的な実践に大きく依存しており、それは時間消費と労働集約である。
本稿では,手作業で設計したアーキテクチャを体系的に研究し,Batch Normalization (BN) 層を適切に分離することが,相互モダリティマッチングに大きく貢献する鍵であることを示す。
この観測に基づいて、BN層毎の最適分離法を見つけることが本目的である。
そこで我々は,Cross-Modality Neural Architecture Search (CM-NAS) という新しい手法を提案する。
これは、標準的な最適化をクロスモダリティタスクの対象となるbn指向の探索空間から成っている。
SYSU-MM01ではランク1/mAPが6.70%/6.13%,RegDBでは12.17%/11.23%向上した。
CM-NASは,そのシンプルさと有効性を踏まえ,今後の研究の強力なベースラインとなると期待している。
コードは利用可能になる。
関連論文リスト
- EM-DARTS: Hierarchical Differentiable Architecture Search for Eye Movement Recognition [54.99121380536659]
眼球運動バイオメトリックスは、高い安全性の識別により注目されている。
深層学習(DL)モデルは近年,眼球運動認識に成功している。
DLアーキテクチャはまだ人間の事前知識によって決定されている。
眼球運動認識のためのDLアーキテクチャを自動設計する階層的微分可能なアーキテクチャ探索アルゴリズムEM-DARTSを提案する。
論文 参考訳(メタデータ) (2024-09-22T13:11:08Z) - A Pairwise Comparison Relation-assisted Multi-objective Evolutionary Neural Architecture Search Method with Multi-population Mechanism [58.855741970337675]
ニューラルアーキテクチャサーチ(NAS)により、リサーチ者は広大なサーチスペースを自動的に探索し、効率的なニューラルネットワークを見つけることができる。
NASは重要なボトルネックに悩まされており、探索プロセス中に多くのアーキテクチャを評価する必要がある。
SMEM-NASは,多集団構造に基づく多目的進化アルゴリズムである。
論文 参考訳(メタデータ) (2024-07-22T12:46:22Z) - DCP-NAS: Discrepant Child-Parent Neural Architecture Search for 1-bit
CNNs [53.82853297675979]
バイナリ重みとアクティベーションを備えた1ビット畳み込みニューラルネットワーク(CNN)は、リソース制限された組み込みデバイスの可能性を示している。
自然なアプローチの1つは、NASの計算とメモリコストを削減するために1ビットCNNを使用することである。
本稿では,1ビットCNNを効率的に探索するためにDCP-NAS(Disrepant Child-Parent Neural Architecture Search)を提案する。
論文 参考訳(メタデータ) (2023-06-27T11:28:29Z) - Surrogate-assisted Multi-objective Neural Architecture Search for
Real-time Semantic Segmentation [11.866947846619064]
ニューラルアーキテクチャサーチ(NAS)は、アーキテクチャ設計を自動化するための有望な道として登場した。
セマンティックセグメンテーションにNASを適用する際の課題を解決するために,サロゲート支援多目的手法を提案する。
提案手法は,人手による設計と他のNAS手法による自動設計の両方により,既存の最先端アーキテクチャを著しく上回るアーキテクチャを同定することができる。
論文 参考訳(メタデータ) (2022-08-14T10:18:51Z) - MSO: Multi-Feature Space Joint Optimization Network for RGB-Infrared
Person Re-Identification [35.97494894205023]
RGB-infrared cross-modality person re-identification (ReID) タスクは、可視モダリティと赤外線モダリティの同一性の画像を認識することを目的としている。
既存の手法は主に2ストリームアーキテクチャを使用して、最終的な共通特徴空間における2つのモード間の相違を取り除く。
単一モダリティ空間と共通空間の両方において、モダリティ調和可能な特徴を学習できる新しい多機能空間共同最適化(MSO)ネットワークを提案する。
論文 参考訳(メタデータ) (2021-10-21T16:45:23Z) - Hierarchical Neural Architecture Search for Deep Stereo Matching [131.94481111956853]
本稿では, ディープステレオマッチングのための最初のエンドツーエンド階層型NASフレームワークを提案する。
我々のフレームワークは、タスク固有の人間の知識をニューラルアーキテクチャ検索フレームワークに組み込んでいる。
KITTI stereo 2012、2015、Middleburyベンチマークで1位、SceneFlowデータセットで1位にランクインしている。
論文 参考訳(メタデータ) (2020-10-26T11:57:37Z) - RARTS: An Efficient First-Order Relaxed Architecture Search Method [5.491655566898372]
微分可能なアーキテクチャ探索(DARTS)は、二段階最適化問題の解法に基づく、データ駆動型ニューラルネットワーク設計の有効な方法である。
我々は、データとネットワーク分割の両方を通してアーキテクチャ学習のデータセット全体を利用する、単一レベルの代替品と緩和アーキテクチャ検索(RARTS)手法を定式化する。
RARTSは、トポロジカルアーキテクチャ、すなわちエッジと演算を探索するタスクにおいて、CIFAR-10上の2階DARTSよりも高い精度と60%の計算コストを得る。
論文 参考訳(メタデータ) (2020-08-10T04:55:51Z) - DrNAS: Dirichlet Neural Architecture Search [88.56953713817545]
ディリクレ分布をモデルとした連続緩和型混合重みをランダム変数として扱う。
最近開発されたパスワイズ微分により、ディリクレパラメータは勾配に基づく一般化で容易に最適化できる。
微分可能なNASの大きなメモリ消費を軽減するために, 単純かつ効果的な進行学習方式を提案する。
論文 参考訳(メタデータ) (2020-06-18T08:23:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。