論文の概要: Taking Modality-free Human Identification as Zero-shot Learning
- arxiv url: http://arxiv.org/abs/2010.00975v2
- Date: Thu, 30 Dec 2021 08:35:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-12 01:51:50.460762
- Title: Taking Modality-free Human Identification as Zero-shot Learning
- Title(参考訳): ゼロショット学習としてのモダリティフリーな人間識別
- Authors: Zhizhe Liu, Xingxing Zhang, Zhenfeng Zhu, Shuai Zheng, Yao Zhao and
Jian Cheng
- Abstract要約: 我々は、新しいモダリティフリーヒューマン識別(MFHI)タスクを、スケーラブルな方法で汎用的なゼロショット学習モデルとして開発する。
各アイデンティティの識別プロトタイプを学習することで、視覚的および意味的なモダリティをブリッジすることができる。
さらに、意味論に基づく空間的注意は、高グローバルなカテゴリーレベルと局所的な属性レベルを区別した表現を得るために、視覚的モダリティに強制される。
- 参考スコア(独自算出の注目度): 46.51413603352702
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human identification is an important topic in event detection, person
tracking, and public security. There have been numerous methods proposed for
human identification, such as face identification, person re-identification,
and gait identification. Typically, existing methods predominantly classify a
queried image to a specific identity in an image gallery set (I2I). This is
seriously limited for the scenario where only a textual description of the
query or an attribute gallery set is available in a wide range of video
surveillance applications (A2I or I2A). However, very few efforts have been
devoted towards modality-free identification, i.e., identifying a query in a
gallery set in a scalable way. In this work, we take an initial attempt, and
formulate such a novel Modality-Free Human Identification (named MFHI) task as
a generic zero-shot learning model in a scalable way. Meanwhile, it is capable
of bridging the visual and semantic modalities by learning a discriminative
prototype of each identity. In addition, the semantics-guided spatial attention
is enforced on visual modality to obtain representations with both high global
category-level and local attribute-level discrimination. Finally, we design and
conduct an extensive group of experiments on two common challenging
identification tasks, including face identification and person
re-identification, demonstrating that our method outperforms a wide variety of
state-of-the-art methods on modality-free human identification.
- Abstract(参考訳): 人間の識別は、イベント検出、人物追跡、公開セキュリティにおいて重要なトピックである。
人間の識別には、顔の識別、人物の再識別、歩行識別など多くの方法が提案されている。
通常、既存の方法は、検索された画像を画像ギャラリーセット(I2I)内の特定のアイデンティティに分類する。
これは、クエリのテキスト記述や属性ギャラリーセットのみが、幅広いビデオ監視アプリケーション(A2IまたはI2A)で利用できるシナリオにおいて、非常に制限されている。
しかし、モダリティフリーな識別、すなわち、スケーラブルな方法でギャラリーセット内のクエリの識別に費やされた努力はごくわずかである。
本稿では,最初の試みとして,このような新しいモダリティフリーな人間識別タスク(mfhi)を,スケーラブルな方法で汎用的ゼロショット学習モデルとして定式化する。
一方、各アイデンティティの識別プロトタイプを学習することにより、視覚的および意味的モダリティを橋渡しすることができる。
さらに、セマンティクスを導いた空間的注意が視覚モダリティに強制され、高いグローバルカテゴリレベルと局所属性レベルの両方の識別を持つ表現が得られる。
最後に,顔識別と人物再同定を含む2つの難解な識別タスクに関する広範な実験を設計・実施し,モダリティフリーの人間識別において,その手法が多種多様な最先端の手法に勝ることを実証した。
関連論文リスト
- Disentangled Representations for Short-Term and Long-Term Person Re-Identification [33.76874948187976]
アイデンティティシャッフルGAN(Identity shuffle GAN:IS-GAN)と呼ばれる新たな生成対向ネットワークを提案する。
それは、アイデンティティシャッフル技術によって、個人画像からアイデンティティ関連および非関連の特徴を解き放つ。
実験により,IS-GANの有効性が検証され,標準reIDベンチマークにおける最先端性能が示された。
論文 参考訳(メタデータ) (2024-09-09T02:09:49Z) - X-ReID: Cross-Instance Transformer for Identity-Level Person
Re-Identification [53.047542904329866]
Cross-Identity Instancesモジュール(IntraX)は、ID-Levelの知識を転送するために、異なるIdentityインスタンスをフューズする。
Cross Inter-Identity Instancesモジュール(InterX)は、同じアイデンティティに対する注意応答を改善するために、ハードポジティとハードポジティのインスタンスを含む。
論文 参考訳(メタデータ) (2023-02-04T03:16:18Z) - Body Part-Based Representation Learning for Occluded Person
Re-Identification [102.27216744301356]
隠蔽人物再識別(ReID)とは,隠蔽人物画像と包括的人物画像とのマッチングを目的とした人物検索タスクである。
パートベースの手法は、微細な情報を提供し、部分的に見える人間の体を表現するのに適しているため、有益であることが示されている。
本稿では,BPBreIDという身体部分に基づくReIDモデルを提案する。
論文 参考訳(メタデータ) (2022-11-07T16:48:41Z) - Dynamic Prototype Mask for Occluded Person Re-Identification [88.7782299372656]
既存の手法では、目に見える部分を識別するために、余分なネットワークによって提供される身体の手がかりを利用することで、この問題に対処している。
2つの自己明快な事前知識に基づく新しい動的プロトタイプマスク(DPM)を提案する。
この条件下では、隠蔽された表現は、選択された部分空間において自然にうまく整列することができる。
論文 参考訳(メタデータ) (2022-07-19T03:31:13Z) - RealGait: Gait Recognition for Person Re-Identification [79.67088297584762]
我々は,既存の映像人物の再識別課題からシルエットを抽出し,制約のない方法で歩く1,404人からなる新たな歩行データセットを構築した。
以上の結果から、実際の監視シナリオにおける歩行による認識は実現可能であり、その基盤となる歩行パターンが、実際にビデオの人物認識が機能する真の理由である可能性が示唆された。
論文 参考訳(メタデータ) (2022-01-13T06:30:56Z) - Context-Aware Unsupervised Clustering for Person Search [13.99348653165494]
個人識別ラベルがない場合にネットワークをトレーニングできる新しい人物検索フレームワークを提案する。
注釈付き人物識別ラベルを用いて,効率的な非教師なしクラスタリング手法を提案する。
実験の結果,提案手法は最先端の教師付き人物探索手法に匹敵する性能を示した。
論文 参考訳(メタデータ) (2021-10-04T11:39:18Z) - Learning by Aligning: Visible-Infrared Person Re-identification using
Cross-Modal Correspondences [42.16002082436691]
VI-reIDの主な課題は、個人画像間のクラス内変動と、可視画像と赤外線画像の相互差である。
我々はこれらの問題に統一的な方法で対処する新しい特徴学習フレームワークを導入する。
論文 参考訳(メタデータ) (2021-08-17T03:38:51Z) - Intra-Camera Supervised Person Re-Identification [87.88852321309433]
本稿では,カメラごとの個人識別アノテーションに基づく新しい人物識別パラダイムを提案する。
これにより、最も時間がかかり、面倒なカメラ間IDラベリングプロセスがなくなる。
MATE(Multi-tAsk mulTi-labEl)Deep Learning method for intra-Camera Supervised (ICS) person re-id。
論文 参考訳(メタデータ) (2020-02-12T15:26:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。