論文の概要: Unified Batch All Triplet Loss for Visible-Infrared Person
Re-identification
- arxiv url: http://arxiv.org/abs/2103.04607v1
- Date: Mon, 8 Mar 2021 08:58:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-09 15:35:33.070057
- Title: Unified Batch All Triplet Loss for Visible-Infrared Person
Re-identification
- Title(参考訳): Unified Batch All Triplet Loss for Visible-Infrared Person Re-identification
- Authors: Wenkang Li, Ke Qi, Wenbin Chen, Yicong Zhou
- Abstract要約: バッチハードトリプルトロスは、個人再識別タスクで広く使われているが、可視赤外線人物再識別タスクではうまく機能しない。
そこで本研究では,最も難しい三重項ではなく,全ての三重項を抽出して最適化する,全三重項選択方式を提案する。
また、画像ベクトル間のコサイン距離を協調的に最適化するために、Unified Batch All Triplet lossとCosine Softmax lossを導入する。
- 参考スコア(独自算出の注目度): 33.23261883419256
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visible-Infrared cross-modality person re-identification (VI-ReID), whose aim
is to match person images between visible and infrared modality, is a
challenging cross-modality image retrieval task. Batch Hard Triplet loss is
widely used in person re-identification tasks, but it does not perform well in
the Visible-Infrared person re-identification task. Because it only optimizes
the hardest triplet for each anchor image within the mini-batch, samples in the
hardest triplet may all belong to the same modality, which will lead to the
imbalance problem of modality optimization. To address this problem, we adopt
the batch all triplet selection strategy, which selects all the possible
triplets among samples to optimize instead of the hardest triplet. Furthermore,
we introduce Unified Batch All Triplet loss and Cosine Softmax loss to
collaboratively optimize the cosine distance between image vectors. Similarly,
we rewrite the Hetero Center Triplet loss, which is proposed for VI-ReID task,
into a batch all form to improve model performance. Extensive experiments
indicate the effectiveness of the proposed methods, which outperform
state-of-the-art methods by a wide margin.
- Abstract(参考訳): Visible-Infrared cross-modality person re-identification (VI-ReID) は、視覚的モダリティと赤外線的モダリティの人物像をマッチングすることを目的としている。
バッチハードトリプルトロスは、個人再識別タスクで広く使われているが、可視赤外線人物再識別タスクではうまく機能しない。
ミニバッチ内の各アンカー画像に対して最も硬い三重項のみを最適化するため、最も硬い三重項のサンプルはすべて同じモダリティに属し、モダリティ最適化の不均衡問題を引き起こす。
この問題に対処するために、我々は、最も難しい三重項の代わりに、サンプルの中から可能な三重項を全て選択するバッチ全三重項選択戦略を採用した。
さらに,画像ベクトル間のコサイン距離を協調的に最適化するために,統一バッチ全三重項損失とコサインソフトマックス損失を導入する。
同様に、VI-ReIDタスクのために提案されるHetero Center Triplet損失を、モデル性能を改善するために全形式に書き換える。
広範な実験は提案手法の有効性を示しており、これは最先端の手法を幅広いマージンで上回っている。
関連論文リスト
- Mutual Information Guided Optimal Transport for Unsupervised Visible-Infrared Person Re-identification [39.70083261306122]
非監視型赤外線人物再識別 (USVI-ReID) は, ラベル情報を用いることなく, 異質な歩行者画像を取得することを目的とした, 難易度の高い検索課題である。
本稿では,モデルの相互情報に基づいて,教師なしVI-ReIDの最適化目標を導出する。
彼らの指導のもと、モデルトレーニングと相互モダリティマッチングの交互にループ反復的なトレーニング戦略を設計する。
論文 参考訳(メタデータ) (2024-07-17T17:32:07Z) - Multi-threshold Deep Metric Learning for Facial Expression Recognition [60.26967776920412]
本稿では,難易度検証を回避する多閾値深度学習手法を提案する。
その結果,三重項損失のそれぞれの閾値は本質的にクラス間変動の特異な分布を決定することがわかった。
埋め込み層はスライスで構成されており、より情報的で差別的な特徴である。
論文 参考訳(メタデータ) (2024-06-24T08:27:31Z) - Unified-Width Adaptive Dynamic Network for All-In-One Image Restoration [50.81374327480445]
本稿では, 複雑な画像劣化を基本劣化の観点で表現できる, という新しい概念を提案する。
We propose the Unified-Width Adaptive Dynamic Network (U-WADN) which consist of two pivotal components: a Width Adaptive Backbone (WAB) and a Width Selector (WS)。
提案したU-WADNは、最大32.3%のFLOPを同時に削減し、約15.7%のリアルタイム加速を実現している。
論文 参考訳(メタデータ) (2024-01-24T04:25:12Z) - Bridging the Gap: Multi-Level Cross-Modality Joint Alignment for
Visible-Infrared Person Re-Identification [41.600294816284865]
Visible-Infrared Person Re-IDentification (VI-ReID)は、歩行者の画像を可視カメラと赤外線カメラに合わせることを目的としている。
モダリティギャップを解決するため、既存の主流手法では、画像検索タスクを画像分類タスクに変換する学習パラダイムを採用している。
モーダリティと目的レベルのギャップを埋める,単純かつ効果的な多層クロスモーダリティ共同アライメント(MCJA)を提案する。
論文 参考訳(メタデータ) (2023-07-17T08:24:05Z) - A Recipe for Efficient SBIR Models: Combining Relative Triplet Loss with
Batch Normalization and Knowledge Distillation [3.364554138758565]
SBIR(Sketch-Based Image Retrieval)は、マルチメディア検索において重要なタスクであり、指定されたスケッチクエリにマッチした画像の集合を検索することを目的としている。
我々は, アンカーの類似性に基づく損失重み付けにより, 制限を克服する適応三重項損失である相対三重項損失(RTL)を導入する。
本稿では, 知識蒸留による精度の限界損失を抑えて, 小型モデルを効率的に訓練するための簡単な手法を提案する。
論文 参考訳(メタデータ) (2023-05-30T12:41:04Z) - Learning Feature Recovery Transformer for Occluded Person
Re-identification [71.18476220969647]
本稿では,FRT(Feature Recovery Transformer)と呼ばれる2つの課題を同時に解決する手法を提案する。
特徴マッチング時のノイズの干渉を低減するため,両画像に現れる可視領域に着目し,類似性を計算するための可視グラフを開発した。
2つ目の課題は、グラフの類似性に基づいて、各クエリ画像に対して、ギャラリー内の$k$-nearestの隣人の特徴セットを利用して、完全な特徴を復元するリカバリトランスフォーマを提案することである。
論文 参考訳(メタデータ) (2023-01-05T02:36:16Z) - Unifying Flow, Stereo and Depth Estimation [121.54066319299261]
本稿では3つの動作と3次元知覚タスクのための統一的な定式化とモデルを提案する。
これら3つのタスクを、統一された高密度対応マッチング問題として定式化する。
我々のモデルは、モデルアーキテクチャとパラメータがタスク間で共有されているため、自然にクロスタスク転送を可能にします。
論文 参考訳(メタデータ) (2022-11-10T18:59:54Z) - Warp Consistency for Unsupervised Learning of Dense Correspondences [116.56251250853488]
密接な対応を学習する上で重要な課題は、実画像対に対する地道整合の欠如である。
密な対応回帰のための教師なし学習目標であるWarp Consistencyを提案する。
私たちのアプローチは、MegaDepth、RobotCar、TSSなど、いくつかの挑戦的なベンチマークに新しい最先端を設定します。
論文 参考訳(メタデータ) (2021-04-07T17:58:22Z) - Strong but Simple Baseline with Dual-Granularity Triplet Loss for
Visible-Thermal Person Re-Identification [9.964287254346976]
可視熱者再同定(VT-ReID)のための概念的に単純かつ効果的な二重粒度三重項損失を提案する。
提案する双粒度三重項損失は, 試料ベース三重項損失と中心ベース三重項損失を, 粒状粒度で階層的に整理する。
論文 参考訳(メタデータ) (2020-12-09T12:43:34Z) - Recurrent Multi-view Alignment Network for Unsupervised Surface
Registration [79.72086524370819]
非厳格な登録をエンドツーエンドで学習することは、本質的に高い自由度とラベル付きトレーニングデータの欠如により困難である。
我々は、いくつかの剛性変換のポイントワイドな組み合わせで、非剛性変換を表現することを提案する。
また,投影された多視点2次元深度画像上での3次元形状の類似度を計測する可微分損失関数も導入する。
論文 参考訳(メタデータ) (2020-11-24T14:22:42Z) - Parameter Sharing Exploration and Hetero-Center based Triplet Loss for
Visible-Thermal Person Re-Identification [17.402673438396345]
本稿では,VT Re-ID(VT Re-ID)タスクについて述べる。
提案手法は,最先端の手法を大きなマージンで明らかに上回っている。
論文 参考訳(メタデータ) (2020-08-14T07:40:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。