論文の概要: Leaning Compact and Representative Features for Cross-Modality Person
Re-Identification
- arxiv url: http://arxiv.org/abs/2103.14210v1
- Date: Fri, 26 Mar 2021 01:53:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-29 12:46:50.437660
- Title: Leaning Compact and Representative Features for Cross-Modality Person
Re-Identification
- Title(参考訳): クロスモダリティ人物再同定のための傾きコンパクトと代表的特徴
- Authors: Guangwei Gao, Hao Shao, Yi Yu, Fei Wu, Meng Yang
- Abstract要約: 本稿では,クロスモダリティ可視赤外人物再識別(vi re-id)タスクに注目する。
提案手法は他の最も先進的な手法よりも印象的な性能で優れている。
- 参考スコア(独自算出の注目度): 18.06382007908855
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper pays close attention to the cross-modality visible-infrared person
re-identification (VI Re-ID) task, which aims to match human samples between
visible and infrared modes. In order to reduce the discrepancy between features
of different modalities, most existing works usually use constraints based on
Euclidean metric. Since the Euclidean based distance metric cannot effectively
measure the internal angles between the embedded vectors, the above methods
cannot learn the angularly discriminative feature embedding. Because the most
important factor affecting the classification task based on embedding vector is
whether there is an angularly discriminativ feature space, in this paper, we
propose a new loss function called Enumerate Angular Triplet (EAT) loss. Also,
motivated by the knowledge distillation, to narrow down the features between
different modalities before feature embedding, we further present a new
Cross-Modality Knowledge Distillation (CMKD) loss. The experimental results on
RegDB and SYSU-MM01 datasets have shown that the proposed method is superior to
the other most advanced methods in terms of impressive performance.
- Abstract(参考訳): 本稿では,可視モードと赤外線モードのマッチングを目的としたクロスモダリティ可視赤外人物再識別タスク(vi re-id)に注目する。
異なるモダリティの特徴間の不一致を減らすために、既存の作品の多くはユークリッド計量に基づく制約を用いる。
ユークリッドに基づく距離計量は、埋め込みベクトル間の内部角を効果的に測定できないので、上記の方法では角微分的特徴埋め込みを学べない。
埋め込みベクトルに基づく分類タスクに影響を及ぼす最も重要な要因は,角偏差特徴空間が存在するかどうかであり,本稿では,eat損失と呼ばれる新しい損失関数を提案する。
また, 知識蒸留を契機として, 特徴埋込前の異なるモダリティ間の特徴を狭めるため, 新たにCMKD(Cross-Modality Knowledge Distillation)の損失を生じさせる。
RegDBとSYSU-MM01データセットの実験結果から,提案手法は印象的な性能の点で,他の高度な手法よりも優れていることが示された。
関連論文リスト
- Sparse Prior Is Not All You Need: When Differential Directionality Meets Saliency Coherence for Infrared Small Target Detection [15.605122893098981]
本研究では,Sparse Differential Directionality prior (SDD)フレームワークを提案する。
我々は、ターゲットの異なる方向特性を活用して、それらを背景と区別する。
さらに、サリエンシ・コヒーレンス・ストラテジーにより、目標検出性をさらに強化する。
近似交互最小化法(PAM)アルゴリズムは,提案したモデルを効率的に解く。
論文 参考訳(メタデータ) (2024-07-22T04:32:43Z) - Instance-Variant Loss with Gaussian RBF Kernel for 3D Cross-modal
Retriveal [52.41252219453429]
既存の方法は全てのインスタンスを等しく扱い、同じペナルティ強度を様々な難易度を持つインスタンスに適用する。
これは曖昧な収束や局所最適性をもたらし、特徴空間の分離性を著しく妥協させる。
本稿では,異なるインスタンスに対して異なるペナルティ強度を割り当て,空間分離性を向上させるインスタンス・ヴァリアント損失を提案する。
論文 参考訳(メタデータ) (2023-05-07T10:12:14Z) - DOAD: Decoupled One Stage Action Detection Network [77.14883592642782]
人々をローカライズし、ビデオからアクションを認識することは、ハイレベルなビデオ理解にとって難しい課題だ。
既存の手法は主に2段階ベースで、1段階は人物境界ボックス生成、もう1段階は行動認識を行う。
本稿では、時間的行動検出の効率を向上させるために、DOADと呼ばれる分離したワンステージネットワークを提案する。
論文 参考訳(メタデータ) (2023-04-01T08:06:43Z) - MRCN: A Novel Modality Restitution and Compensation Network for
Visible-Infrared Person Re-identification [36.88929785476334]
本稿では,2つのモダリティ間のギャップを狭めるために,新しいモダリティ再構成補償ネットワーク(MRCN)を提案する。
この手法はRanc-1の95.1%とRegDBデータセットのmAPの89.2%を達成している。
論文 参考訳(メタデータ) (2023-03-26T05:03:18Z) - Learning Progressive Modality-shared Transformers for Effective
Visible-Infrared Person Re-identification [27.75907274034702]
我々は,能率VI-ReIDのためのPMT(Progressive Modality-Shared Transformer)という新しいディープラーニングフレームワークを提案する。
モダリティギャップの負の効果を低減するために、まず、グレースケールの画像を補助的なモダリティとして捉え、進歩的な学習戦略を提案する。
クラス内差が大きく,クラス間差が少ない問題に対処するために,識別中心損失を提案する。
論文 参考訳(メタデータ) (2022-12-01T02:20:16Z) - CycleTrans: Learning Neutral yet Discriminative Features for
Visible-Infrared Person Re-Identification [79.84912525821255]
Visible-infrared person re-identification (VI-ReID) は、可視・赤外線モダリティ間で同一人物をマッチングするタスクである。
既存のVI-ReID手法は主に、特徴識別性を犠牲にして、モダリティを越えて一般的な特徴を学習することに焦点を当てている。
ニュートラルかつ差別的な特徴学習のための新しいサイクル構築型ネットワークであるCycleTransを提案する。
論文 参考訳(メタデータ) (2022-08-21T08:41:40Z) - Benchmarking Deep Models for Salient Object Detection [67.07247772280212]
汎用SALOD(General SALient Object Detection)ベンチマークを構築し,複数のSOD手法の総合的な比較を行った。
以上の実験では、既存の損失関数は、通常いくつかの指標に特化しているが、他の指標には劣る結果が報告されている。
我々は,深層ネットワークに画素レベルと画像レベルの両方の監視信号を統合することにより,より識別的な特徴を学習するためのエッジ・アウェア・ロス(EA)を提案する。
論文 参考訳(メタデータ) (2022-02-07T03:43:16Z) - On Exploring Pose Estimation as an Auxiliary Learning Task for
Visible-Infrared Person Re-identification [66.58450185833479]
本稿では,Pose Estimationを補助学習タスクとして活用して,エンドツーエンドフレームワークにおけるVI-ReIDタスクを支援する。
これら2つのタスクを相互に有利な方法で共同でトレーニングすることにより、高品質なモダリティ共有とID関連の特徴を学習する。
2つのベンチマークVI-ReIDデータセットの実験結果から,提案手法は一定のマージンで最先端の手法を継続的に改善することが示された。
論文 参考訳(メタデータ) (2022-01-11T09:44:00Z) - MMD-ReID: A Simple but Effective Solution for Visible-Thermal Person
ReID [20.08880264104061]
本稿では,モダリティギャップを明示的な差分低減制約によって低減する,シンプルで効果的なMDD-ReIDを提案する。
我々はMDD-ReIDの有効性を定性的かつ定量的に実証するための広範囲な実験を行った。
提案手法は,SYSU-MM01およびRegDBデータセットにおける最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2021-11-09T11:33:32Z) - Meta Learning Low Rank Covariance Factors for Energy-Based Deterministic
Uncertainty [58.144520501201995]
ニューラルネットワーク層のBi-Lipschitz正規化は、各レイヤの特徴空間におけるデータインスタンス間の相対距離を保存する。
注意セットエンコーダを用いて,タスク固有の共分散行列を効率的に構築するために,対角的,対角的,低ランクな要素のメタ学習を提案する。
また,最終的な予測分布を達成するために,スケールしたエネルギーを利用する推論手法を提案する。
論文 参考訳(メタデータ) (2021-10-12T22:04:19Z) - Bi-directional Exponential Angular Triplet Loss for RGB-Infrared Person
Re-Identification [18.09586167227815]
本稿では,角分離可能な共通特徴空間の学習を支援するために,二方向指数Angularトリプルトロスという新たなランキング損失関数を提案する。
SYSU-MM01データセットでは、7.40%/11.46%から38.57%/38.61%に改善されている。
提案手法は単一モードRe-IDのタスクに一般化することができる。
論文 参考訳(メタデータ) (2020-06-01T12:26:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。