論文の概要: Angular Triplet Loss-based Camera Network for ReID
- arxiv url: http://arxiv.org/abs/2005.05740v2
- Date: Thu, 23 Sep 2021 03:01:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-03 19:16:56.713662
- Title: Angular Triplet Loss-based Camera Network for ReID
- Title(参考訳): ReIDのためのAngular Triplet Lossに基づくカメラネットワーク
- Authors: Yitian Li and Ruini Xue and Mengmeng Zhu and Jing Xu and Zenglin Xu
- Abstract要約: 人物再識別(ReID)は、歩行者を特定する上で困難なクロスカメラ検索タスクである。
本稿では,グローバルな特徴しか持たない魅力的な性能を実現することができる,単純な角三重項損失に基づくカメラネットワークであるATCNを提案する。
- 参考スコア(独自算出の注目度): 15.654771601134787
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Person re-identification (ReID) is a challenging crosscamera retrieval task
to identify pedestrians. Many complex network structures are proposed recently
and many of them concentrate on multi-branch features to achieve high
performance. However, they are too heavy-weight to deploy in realworld
applications. Additionally, pedestrian images are often captured by different
surveillance cameras, so the varied lights, perspectives and resolutions result
in inevitable multi-camera domain gaps for ReID. To address these issues, this
paper proposes ATCN, a simple but effective angular triplet loss-based camera
network, which is able to achieve compelling performance with only global
features. In ATCN, a novel angular distance is introduced to learn a more
discriminative feature representation in the embedding space. Meanwhile, a
lightweight camera network is designed to transfer global features to more
discriminative features. ATCN is designed to be simple and flexible so it can
be easily deployed in practice. The experiment results on various benchmark
datasets show that ATCN outperforms many SOTA approaches.
- Abstract(参考訳): 人物再識別(ReID)は、歩行者を特定する上で困難なクロスカメラ検索タスクである。
近年,複雑なネットワーク構造が多数提案されており,その多くが高性能化のためにマルチブランチ機能に重点を置いている。
しかし、現実世界のアプリケーションにデプロイするには重すぎる。
さらに、歩行者の画像は異なる監視カメラによって撮影されることが多いため、様々な照明、視点、解像度によって、ReIDにとって避けられないマルチカメラドメインギャップが生じる。
これらの問題に対処するため,本稿では,グローバル機能のみで魅力的な性能を実現するための,シンプルかつ効果的な3重項損失ベースのカメラネットワークであるatcnを提案する。
ATCNでは、埋め込み空間においてより識別的な特徴表現を学ぶために、新しい角距離を導入する。
一方、軽量カメラネットワークは、グローバル機能をより差別的な機能に転送するように設計されている。
ATCNはシンプルで柔軟に設計されており、実際に簡単にデプロイできる。
様々なベンチマークデータセットを用いた実験の結果,ATCNが多くのSOTAアプローチより優れていることが示された。
関連論文リスト
- DVPE: Divided View Position Embedding for Multi-View 3D Object Detection [7.791229698270439]
現在の研究は、受容場間のバランスと、多視点の特徴を集約する際の干渉を減らすことの課題に直面している。
本稿では,視覚的クロスアテンション機構を通じて特徴を世界規模でモデル化する分割ビュー手法を提案する。
我々のフレームワークはDVPEと呼ばれ、nuScenesテストセット上で最先端のパフォーマンス(57.2% mAPと64.5% NDS)を達成する。
論文 参考訳(メタデータ) (2024-07-24T02:44:41Z) - LCPR: A Multi-Scale Attention-Based LiDAR-Camera Fusion Network for
Place Recognition [11.206532393178385]
本稿では,マルチモーダル位置認識のための新しいニューラルネットワークLCPRを提案する。
位置認識性能を向上させるために,マルチビューカメラとLiDARデータを効果的に利用することができる。
論文 参考訳(メタデータ) (2023-11-06T15:39:48Z) - A Flexible Framework for Virtual Omnidirectional Vision to Improve
Operator Situation Awareness [2.817412580574242]
本稿では,ロボットのどこに設置した複数のカメラを融合させる新しい手法に基づいて,仮想プロジェクションのためのフレキシブルなフレームワークを提案する。
カメラ画像と幾何学的3Dライダーデータを融合させることでシーン理解を改善するための補完的なアプローチを提案し,色付き点雲を得る。
論文 参考訳(メタデータ) (2023-02-01T10:40:05Z) - RDRN: Recursively Defined Residual Network for Image Super-Resolution [58.64907136562178]
深部畳み込みニューラルネットワーク(CNN)は、単一画像超解像において顕著な性能を得た。
本稿では,注目ブロックを効率的に活用する新しいネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-11-17T11:06:29Z) - SAR Despeckling Using Overcomplete Convolutional Networks [53.99620005035804]
スペックルはSAR画像を劣化させるため、リモートセンシングにおいて重要な問題である。
近年の研究では、畳み込みニューラルネットワーク(CNN)が古典的解法よりも優れていることが示されている。
本研究は、受容場を制限することで低レベルの特徴を学習することに集中するために、過剰なCNNアーキテクチャを用いる。
本稿では,合成および実SAR画像の非特定化手法と比較して,提案手法により非特定化性能が向上することを示す。
論文 参考訳(メタデータ) (2022-05-31T15:55:37Z) - Dual Adversarial Adaptation for Cross-Device Real-World Image
Super-Resolution [114.26933742226115]
異なるデバイスからの画像に基づいて訓練された超高解像度(SR)モデルは、異なる画像パターンを示す可能性がある。
本稿では、DADA(Dual Adversarial Adaptation)という、実世界のSRのための教師なしドメイン適応機構を提案する。
3台のカメラで6台のリアル・トゥ・リアル・アダプティブ・セッティングで実験を行い、既存の最先端のアプローチと比較して優れた性能を実現した。
論文 参考訳(メタデータ) (2022-05-07T02:55:39Z) - Lightweight Image Super-Resolution with Multi-scale Feature Interaction
Network [15.846394239848959]
軽量マルチスケール機能インタラクションネットワーク(MSFIN)を提案する。
軽量SISRでは、MSFINは受容野を拡張し、低解像度の観測画像の情報的特徴を適切に活用する。
提案したMSFINは,より軽量なモデルで最先端技術に匹敵する性能を達成できる。
論文 参考訳(メタデータ) (2021-03-24T07:25:21Z) - MRDet: A Multi-Head Network for Accurate Oriented Object Detection in
Aerial Images [51.227489316673484]
水平アンカーから変換された指向性提案を生成するために、任意指向領域提案ネットワーク(AO-RPN)を提案する。
正確なバウンディングボックスを得るために,検出タスクを複数のサブタスクに分離し,マルチヘッドネットワークを提案する。
各ヘッドは、対応するタスクに最適な特徴を学習するために特別に設計されており、ネットワークがオブジェクトを正確に検出することができる。
論文 参考訳(メタデータ) (2020-12-24T06:36:48Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - Towards Precise Intra-camera Supervised Person Re-identification [54.86892428155225]
人物の再識別(Re-ID)のためのカメラ内監視(ICS)は、アイデンティティラベルが各カメラビュー内に独立してアノテートされていると仮定する。
カメラ間ラベルの欠如により、ICS Re-ID問題は、完全に監督されたラベルよりもはるかに難しい。
われわれの手法は、2つのデータセットで最先端の完全教師付き手法に匹敵する性能を発揮する。
論文 参考訳(メタデータ) (2020-02-12T11:56:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。