論文の概要: Using Auxiliary Information for Person Re-Identification -- A Tutorial
Overview
- arxiv url: http://arxiv.org/abs/2211.08565v1
- Date: Tue, 15 Nov 2022 23:12:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-17 15:23:02.029179
- Title: Using Auxiliary Information for Person Re-Identification -- A Tutorial
Overview
- Title(参考訳): 補助情報を用いた人物再同定 -- チュートリアル概要
- Authors: Tharindu Fernando, Clinton Fookes, Sridha Sridharan, Dana Michalski
- Abstract要約: 本稿では,より差別的な人物記述子を生成するために,複数の情報の融合について検討する。
より差別的な人物記述子を生成するために複数の情報の融合を探求する最初の作品である。
- 参考スコア(独自算出の注目度): 32.67404002095918
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Person re-identification (re-id) is a pivotal task within an intelligent
surveillance pipeline and there exist numerous re-id frameworks that achieve
satisfactory performance in challenging benchmarks. However, these systems
struggle to generate acceptable results when there are significant differences
between the camera views, illumination conditions, or occlusions. This result
can be attributed to the deficiency that exists within many recently proposed
re-id pipelines where they are predominately driven by appearance-based
features and little attention is paid to other auxiliary information that could
aid the re-id. In this paper, we systematically review the current
State-Of-The-Art (SOTA) methods in both uni-modal and multimodal person re-id.
Extending beyond a conceptual framework, we illustrate how the existing SOTA
methods can be extended to support these additional auxiliary information and
quantitatively evaluate the utility of such auxiliary feature information,
ranging from logos printed on the objects carried by the subject or printed on
the clothes worn by the subject, through to his or her behavioural
trajectories. To the best of our knowledge, this is the first work that
explores the fusion of multiple information to generate a more discriminant
person descriptor and the principal aim of this paper is to provide a thorough
theoretical analysis regarding the implementation of such a framework. In
addition, using model interpretation techniques, we validate the contributions
from different combinations of the auxiliary information versus the original
features that the SOTA person re-id models extract. We outline the limitations
of the proposed approaches and propose future research directions that could be
pursued to advance the area of multi-modal person re-id.
- Abstract(参考訳): 人物再識別(re-id)は、インテリジェントな監視パイプラインにおける重要なタスクであり、挑戦的なベンチマークで十分なパフォーマンスを達成する多くの再識別フレームワークが存在する。
しかし、これらのシステムは、カメラビュー、照明条件、またはオクルージョンの間に大きな違いがある場合、許容できる結果を生成するのに苦労する。
この結果は、最近提案された多くのre-idパイプラインにおいて、外観に基づく特徴が優先的に駆動され、re-idを支援する他の補助情報にはほとんど注意が払われていないことに起因する。
本稿では,現状のsota(state-of-the-art)メソッドを,単モーダルとマルチモーダルの人リidの両方で体系的に検討する。
概念的枠組みを超えて,既存のSOTA手法を拡張してこれらの補助情報をサポートし,対象物に印字されたロゴや被写体が着用する衣服に印字されたロゴから,その行動軌跡に至るまで,補助情報の有用性を定量的に評価する方法について述べる。
我々の知る限りでは、複数の情報の融合を探求し、より差別的な人物記述子を生成する最初の研究であり、本論文の主な目的は、そのようなフレームワークの実装に関する詳細な理論的分析を提供することである。
さらに,モデル解釈手法を用いて,補助情報の異なる組み合わせと,ソタパーソンリidモデルが抽出した元の特徴の寄与を検証する。
本稿では,提案手法の限界を概説し,マルチモーダルな人物再認識の領域を推し進めるための今後の研究方向を提案する。
関連論文リスト
- Where Do We Stand with Implicit Neural Representations? A Technical and Performance Survey [16.89460694470542]
Inlicit Neural Representation (INR) は知識表現のパラダイムとして登場した。
INRは、データを連続的な暗黙の関数としてモデル化するために多層パーセプトロン(MLP)を利用する。
この調査では、アクティベーション機能、位置エンコーディング、統合戦略、ネットワーク構造という4つの重要な領域に分類する明確な分類法を紹介した。
論文 参考訳(メタデータ) (2024-11-06T06:14:24Z) - A Survey on All-in-One Image Restoration: Taxonomy, Evaluation and Future Trends [67.43992456058541]
画像復元(IR)とは、ノイズ、ぼかし、気象効果などの劣化を除去しながら、画像の視覚的品質を改善する過程である。
従来のIR手法は、一般的に特定の種類の劣化をターゲットとしており、複雑な歪みを伴う現実のシナリオにおいて、その効果を制限している。
オールインワン画像復元(AiOIR)パラダイムが登場し、複数の劣化タイプに順応的に対処する統一されたフレームワークを提供する。
論文 参考訳(メタデータ) (2024-10-19T11:11:09Z) - A Comprehensive Survey on Underwater Image Enhancement Based on Deep Learning [51.7818820745221]
水中画像強調(UIE)はコンピュータビジョン研究において重要な課題である。
多数のUIEアルゴリズムが開発されているにもかかわらず、網羅的で体系的なレビューはいまだに欠落している。
論文 参考訳(メタデータ) (2024-05-30T04:46:40Z) - Learning Cross-modality Information Bottleneck Representation for
Heterogeneous Person Re-Identification [61.49219876388174]
Visible-Infrared person re-identification (VI-ReID)は、インテリジェントビデオ監視において重要かつ困難な課題である。
既存の手法は主に共有特徴空間の学習に重点を置いており、可視光と赤外光の相違を減らす。
本稿では,新しい相互情報・モダリティコンセンサスネットワーク,すなわちCMInfoNetを提案し,モダリティ不変な同一性の特徴を抽出する。
論文 参考訳(メタデータ) (2023-08-29T06:55:42Z) - Visual Information Extraction in the Wild: Practical Dataset and
End-to-end Solution [48.693941280097974]
視覚情報抽出(VIE)のためのカメラ画像からなる大規模データセットを提案する。
我々は,OCRの段階と情報抽出をエンド・ツー・エンドの学習方式で組み合わせた,エンド・ツー・エンドVIEのための新しいフレームワークを提案する。
提案したデータセット上で既存のVIEのエンド・ツー・エンド手法を評価し,これらの手法の性能がSROIEから提案したデータセットに相違があることを観察した。
論文 参考訳(メタデータ) (2023-05-12T14:11:47Z) - Robust Saliency-Aware Distillation for Few-shot Fine-grained Visual
Recognition [57.08108545219043]
サンプルが少ない新しいサブカテゴリを認識することは、コンピュータビジョンにおいて不可欠で挑戦的な研究課題である。
既存の文献は、ローカルベースの表現アプローチを採用することでこの問題に対処している。
本稿では,ロバスト・サリエンシ・アウェア蒸留法(RSaD)を提案する。
論文 参考訳(メタデータ) (2023-05-12T00:13:17Z) - Person Re-identification: A Retrospective on Domain Specific Open
Challenges and Future Trends [2.4907242954727926]
人物再識別(Re-ID)は、自動化された視覚監視システムの主要な構成要素の1つである。
オーバーラップしない視野を持つマルチカメラネットワーク内の人物を自動的に識別・検索することを目的としている。
論文 参考訳(メタデータ) (2022-02-26T11:55:57Z) - Explainable Recommender Systems via Resolving Learning Representations [57.24565012731325]
説明はユーザー体験を改善し、システムの欠陥を発見するのに役立つ。
本稿では,表現学習プロセスの透明性を向上させることによって,説明可能な新しい推薦モデルを提案する。
論文 参考訳(メタデータ) (2020-08-21T05:30:48Z) - Survey on Reliable Deep Learning-Based Person Re-Identification Models:
Are We There Yet? [19.23187114221822]
人物再識別(PReID)は、インテリジェントビデオ監視(IVS)において最も重大な問題の一つである。
ディープニューラルネットワーク(DNN)は、同様のビジョン問題とテスト時の高速実行に魅力的なパフォーマンスを与えた。
ベンチマークデータセットのセット上で、各モデルについての評価とともに、各モデルについて記述する。
論文 参考訳(メタデータ) (2020-04-30T16:09:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。