論文の概要: Multilinear subspace learning for person re-identification based fusion of high order tensor features
- arxiv url: http://arxiv.org/abs/2505.15825v1
- Date: Fri, 09 May 2025 23:39:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-25 10:52:49.078761
- Title: Multilinear subspace learning for person re-identification based fusion of high order tensor features
- Title(参考訳): 人物再同定に基づく高次テンソル特徴の融合のための多線形部分空間学習
- Authors: Ammar Chouchane, Mohcene Bessaoudi, Hamza Kheddar, Abdelmalik Ouamane, Tiago Vieira, Mahmoud Hassaballah,
- Abstract要約: PRe-IDは、カメラネットワークで既に検出された標的個人を特定し追跡することを目的としている。
この目的のために、CNN(Conal Neural Networks)とLOMO(Local Maximal Occurrence)という2つの強力な特徴が多次元データに基づいてモデル化されている。
新しいテンソル融合スキームを導入し、これら2種類の特徴を1つのテンソルに活用する。
- 参考スコア(独自算出の注目度): 2.03240755905453
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Video surveillance image analysis and processing is a challenging field in computer vision, with one of its most difficult tasks being Person Re-Identification (PRe-ID). PRe-ID aims to identify and track target individuals who have already been detected in a network of cameras, using a robust description of their pedestrian images. The success of recent research in person PRe-ID is largely due to effective feature extraction and representation, as well as the powerful learning of these features to reliably discriminate between pedestrian images. To this end, two powerful features, Convolutional Neural Networks (CNN) and Local Maximal Occurrence (LOMO), are modeled on multidimensional data using the proposed method, High-Dimensional Feature Fusion (HDFF). Specifically, a new tensor fusion scheme is introduced to leverage and combine these two types of features in a single tensor, even though their dimensions are not identical. To enhance the system's accuracy, we employ Tensor Cross-View Quadratic Analysis (TXQDA) for multilinear subspace learning, followed by cosine similarity for matching. TXQDA efficiently facilitates learning while reducing the high dimensionality inherent in high-order tensor data. The effectiveness of our approach is verified through experiments on three widely-used PRe-ID datasets: VIPeR, GRID, and PRID450S. Extensive experiments demonstrate that our approach outperforms recent state-of-the-art methods.
- Abstract(参考訳): 映像監視画像解析と処理はコンピュータビジョンにおいて困難な分野であり、最も難しい課題の1つは人物再同定(Person Re-Identification:PRe-ID)である。
PRe-IDは、歩行者画像の堅牢な記述を用いて、既にカメラのネットワークで検出されたターゲット個人を特定し、追跡することを目的としている。
個人PRe-IDにおける最近の研究の成功は主に、効果的な特徴抽出と表現、および歩行者画像間で確実に識別するこれらの特徴の強力な学習によるものである。
この目的のために、畳み込みニューラルネットワーク(CNN)と局所最大発生(LOMO)という2つの強力な特徴を、提案手法であるHDFF(High-dimensional Feature Fusion)を用いて多次元データに基づいてモデル化する。
具体的には、次元が同一でないにもかかわらず、これらの2種類の特徴を単一のテンソルに活用し、組み合わせるために新しいテンソル融合スキームが導入された。
システムの精度を高めるために,マルチ線形部分空間学習にTensor Cross-View Quadratic Analysis (TXQDA) を用い,次いでマッチングにコサイン類似性を用いる。
TXQDAは、高次テンソルデータに固有の高次元性を低減しつつ、学習を容易にする。
提案手法の有効性は,広く使用されている3つのPRe-IDデータセット(VIPeR,GRID,PRID450S)を用いて検証した。
大規模な実験により,本手法は最近の最先端手法よりも優れていることが示された。
関連論文リスト
- VLMine: Long-Tail Data Mining with Vision Language Models [18.412533708652102]
この研究は、ラベルなしデータのコーパス内の稀な例を識別する問題に焦点を当てている。
本稿では,大規模視覚言語モデル(VLM)に含まれる知識を活用する,シンプルでスケーラブルなデータマイニング手法を提案する。
私たちの実験は、ベースライン技術よりも大きな改善(10%から50%)を示しています。
論文 参考訳(メタデータ) (2024-09-23T19:13:51Z) - Advancing Person Re-Identification: Tensor-based Feature Fusion and
Multilinear Subspace Learning [0.6829272097221595]
特徴表現と多線形部分空間学習を組み合わせた新しいPRe-IDシステムを提案する。
提案手法は,CNN(Creative Conrimial Neural Networks)を強力な特徴抽出器として活用する。
提案手法は,VIPeR,GRID,PRID450の3つのデータセットを用いて実験を行うことにより評価する。
論文 参考訳(メタデータ) (2023-12-24T16:19:22Z) - Enhancing Person Re-Identification through Tensor Feature Fusion [0.5562294018150907]
本稿では,テンソル特徴表現とマルチ線形部分空間学習に基づく新しい人物認識システム(PRe-ID)を提案する。
提案手法は,事前学習したCNNを高レベル特徴抽出に活用する。
クロスビュー四分法解析(TXQDA)アルゴリズムは,マルチ線形部分空間学習に使用される。
論文 参考訳(メタデータ) (2023-12-16T15:04:07Z) - HiDAnet: RGB-D Salient Object Detection via Hierarchical Depth Awareness [2.341385717236931]
本稿では,RGB-Dサリエンシ検出のための階層的深度認識ネットワーク(HiDAnet)を提案する。
我々のモチベーションは、幾何学的先行の多粒性特性がニューラルネットワーク階層とよく相関しているという観察から来ています。
当社のHiDAnetは最先端の手法よりも大きなマージンで良好に動作します。
論文 参考訳(メタデータ) (2023-01-18T10:00:59Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - Correlation-Aware Deep Tracking [83.51092789908677]
本稿では,自己/横断的意図に着想を得た,新たなターゲット依存型特徴ネットワークを提案する。
我々のネットワークは機能ネットワークの複数の層にクロスイメージの特徴相関を深く埋め込んでいる。
我々のモデルは、豊富な未ペア画像に対して柔軟に事前訓練が可能であり、既存の手法よりも顕著に高速な収束をもたらす。
論文 参考訳(メタデータ) (2022-03-03T11:53:54Z) - Efficient Person Search: An Anchor-Free Approach [86.45858994806471]
パーソンサーチは、クエリーの人物を、リアルで切り刻まれていない画像から、同時にローカライズし、識別することを目的としている。
この目標を達成するために、最先端モデルは通常、Faster R-CNNのような2段階検出器にre-idブランチを追加する。
本研究では,この課題に対処するためのアンカーフリーな手法を提案する。
論文 参考訳(メタデータ) (2021-09-01T07:01:33Z) - Decoupled and Memory-Reinforced Networks: Towards Effective Feature
Learning for One-Step Person Search [65.51181219410763]
歩行者検出と識別サブタスクを1つのネットワークで処理するワンステップ方式を開発しました。
現在のワンステップアプローチには2つの大きな課題があります。
本稿では,これらの問題を解決するために,分離メモリ強化ネットワーク(DMRNet)を提案する。
論文 参考訳(メタデータ) (2021-02-22T06:19:45Z) - Hybrid-Attention Guided Network with Multiple Resolution Features for
Person Re-Identification [30.285126447140254]
本稿では,ハイレベルな特徴を学習する際の情報損失を低減するために,ハイレベルな埋め込みと低レベルな埋め込みを融合した新しい人物再IDモデルを提案する。
また,対象物に関するより識別的な特徴を抽出することを目的とした,空間的およびチャネル的注意機構をモデルに導入する。
論文 参考訳(メタデータ) (2020-09-16T08:12:42Z) - FairMOT: On the Fairness of Detection and Re-Identification in Multiple
Object Tracking [92.48078680697311]
マルチオブジェクトトラッキング(MOT)はコンピュータビジョンにおいて重要な問題である。
本稿では,FairMOTと呼ばれる,アンカーフリーなオブジェクト検出アーキテクチャCenterNetをベースとした,シンプルかつ効果的なアプローチを提案する。
このアプローチは、検出と追跡の両方において高い精度を達成する。
論文 参考訳(メタデータ) (2020-04-04T08:18:00Z) - Towards Reading Beyond Faces for Sparsity-Aware 4D Affect Recognition [55.15661254072032]
自動4次元表情認識(FER)のための空間認識深層ネットワークを提案する。
まず,深層学習のためのデータ制限問題に対処する新しい拡張手法を提案する。
次に、多視点での畳み込み特徴のスパース表現を計算するために、疎度対応のディープネットワークを提案する。
論文 参考訳(メタデータ) (2020-02-08T13:09:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。