論文の概要: Person Retrieval in Surveillance Using Textual Query: A Review
- arxiv url: http://arxiv.org/abs/2105.02414v1
- Date: Thu, 6 May 2021 03:17:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-08 00:20:12.364219
- Title: Person Retrieval in Surveillance Using Textual Query: A Review
- Title(参考訳): テキストクエリを用いたサーベイランスにおける人物検索 : レビュー
- Authors: Hiren Galiyawala, Mehul S Raval
- Abstract要約: 近年のバイオメトリックス、コンピュータビジョン、自然言語処理の研究は、テキストクエリを用いた監視ビデオから人物を検索する機会を発見した。
テキストクエリは、人のソフトな生体認証属性を含むため、人間記述と機械間の意味的なギャップを埋めるのに役立ちます。
また、大量の監視映像を手動で検索して特定の人物を取得することは不可能です。
- 参考スコア(独自算出の注目度): 1.41414531071294
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advancement of research in biometrics, computer vision, and natural
language processing has discovered opportunities for person retrieval from
surveillance videos using textual query. The prime objective of a surveillance
system is to locate a person using a description, e.g., a short woman with a
pink t-shirt and white skirt carrying a black purse. She has brown hair. Such a
description contains attributes like gender, height, type of clothing, colour
of clothing, hair colour, and accessories. Such attributes are formally known
as soft biometrics. They help bridge the semantic gap between a human
description and a machine as a textual query contains the person's soft
biometric attributes. It is also not feasible to manually search through huge
volumes of surveillance footage to retrieve a specific person. Hence, automatic
person retrieval using vision and language-based algorithms is becoming
popular. In comparison to other state-of-the-art reviews, the contribution of
the paper is as follows: 1. Recommends most discriminative soft biometrics for
specifiic challenging conditions. 2. Integrates benchmark datasets and
retrieval methods for objective performance evaluation. 3. A complete snapshot
of techniques based on features, classifiers, number of soft biometric
attributes, type of the deep neural networks, and performance measures. 4. The
comprehensive coverage of person retrieval from handcrafted features based
methods to end-to-end approaches based on natural language description.
- Abstract(参考訳): 近年のバイオメトリックス、コンピュータビジョン、自然言語処理の研究は、テキストクエリを用いた監視ビデオから人物を検索する機会を発見した。
監視システムの主な目的は、例えば、ピンクのTシャツと黒い財布を背負った白いスカートの短い女性のような説明を使って人物を見つけることである。
彼女は茶色の髪をしています。
このような記述には、性別、身長、衣服の種類、衣服の色、髪の色、アクセサリーなどの属性が含まれる。
このような属性は、正式にはソフトバイオメトリックス(Soft Biometrics)と呼ばれる。
テキストクエリには、人のソフトバイオメトリック属性が含まれているため、人間記述と機械間のセマンティックギャップを埋めるのに役立ちます。
また、特定の人物を回収するために大量の監視映像を手動で検索することは不可能である。
そのため,視覚と言語に基づくアルゴリズムを用いた自動人物検索が普及しつつある。
他の最先端のレビューと比較して、論文の貢献は以下のとおりである。
最も差別的な軟式バイオメトリックスを、特定困難条件に推奨する。
2.
客観的パフォーマンス評価のためのベンチマークデータセットと検索方法を統合する。
3.
特徴、分類器、ソフトバイオメトリック属性の数、ディープニューラルネットワークの種類、パフォーマンス指標に基づくテクニックの完全なスナップショット。
4.
手作りの特徴に基づく手法から,自然言語記述に基づくエンドツーエンドアプローチへの人物検索の包括的カバレッジ
関連論文リスト
- Help Me Identify: Is an LLM+VQA System All We Need to Identify Visual Concepts? [62.984473889987605]
本稿では,大規模言語モデルとVQA(Visual Question Answering)システムを活用した,視覚概念学習のためのゼロショットフレームワークを提案する。
VQAシステムに問い合わせ画像とともにこれらの質問を行い、回答を集約し、テスト画像中のオブジェクトの有無を判定する。
実験では,既存のゼロショット視覚分類法や少数ショット概念学習手法と同等の性能を示した。
論文 参考訳(メタデータ) (2024-10-17T15:16:10Z) - BookWorm: A Dataset for Character Description and Analysis [59.186325346763184]
本稿では,短い事実プロファイルを生成する文字記述と,詳細な解釈を提供する文字解析という2つのタスクを定義する。
本稿では,Gutenbergプロジェクトからの書籍と,人間による記述と分析のペアリングを行うBookWormデータセットを紹介する。
その結果,検索に基づくアプローチは両タスクにおいて階層的アプローチよりも優れていた。
論文 参考訳(メタデータ) (2024-10-14T10:55:58Z) - From Attributes to Natural Language: A Survey and Foresight on Text-based Person Re-identification [4.400729890122927]
テキストベースのRe-IDの目的は、属性や自然言語の記述を精査することで、特定の歩行者を認識することである。
技術的観点からは、テキストベースの人物であるRe-IDを要約する包括的なレビューが欠落している。
本稿では,評価,戦略,アーキテクチャ,最適化の分野にまたがる分類を導入し,テキストベースの人物Re-IDタスクの総合的な調査を行う。
論文 参考訳(メタデータ) (2024-07-31T18:16:18Z) - Universal Multimodal Representation for Language Understanding [110.98786673598015]
本研究は,一般的なNLPタスクの補助信号として視覚情報を利用する新しい手法を提案する。
各文に対して、まず、既存の文-画像ペア上で抽出された軽トピック-画像検索テーブルから、フレキシブルな画像を検索する。
そして、テキストと画像はそれぞれトランスフォーマーエンコーダと畳み込みニューラルネットワークによって符号化される。
論文 参考訳(メタデータ) (2023-01-09T13:54:11Z) - Facial Soft Biometrics for Recognition in the Wild: Recent Works,
Annotation, and COTS Evaluation [63.05890836038913]
制約のないシナリオにおける人物認識システムを強化するために,ソフトバイオメトリックスが果たす役割について検討する。
1) ソフトバイオメトリックスのマニュアル推定と,2) 市販オフザシェルフシステムによる自動推定の2つの仮定を考察する。
深層学習に基づく2つの最先端顔認識システムを用いた軟式生体計測実験を行った。
論文 参考訳(メタデータ) (2022-10-24T11:29:57Z) - Bridging Vision and Language from the Video-to-Text Perspective: A
Comprehensive Review [1.0520692160489133]
本稿では,ビデオ・トゥ・テキスト問題に対する最先端技術の分類と解説を行う。
主なvideo-to-textメソッドとそのパフォーマンス評価方法をカバーする。
最先端の技術は、ビデオ記述の生成または取得における人間のようなパフォーマンスを達成するには、まだ長い道のりです。
論文 参考訳(メタデータ) (2021-03-27T02:12:28Z) - PeR-ViS: Person Retrieval in Video Surveillance using Semantic
Description [0.491574468325115]
人は通常、年齢、性別、身長、布の種類、模様、色などの記述子で特徴づけられる。
セマンティック記述のクエリで特定の人物を検索することは、ビデオ監視において重要な応用である。
我々は深層学習に基づくカスケードフィルタリング手法(PeR-ViS)を開発した。
0.566 平均 IoU と 0.792 %w $ IoU > 0.4$ を達成する。
論文 参考訳(メタデータ) (2020-12-04T05:11:21Z) - Quantifying Learnability and Describability of Visual Concepts Emerging
in Representation Learning [91.58529629419135]
我々は、ディープニューラルネットワークによって自動的に発見された視覚的なグルーピングを特徴付ける方法を検討する。
本稿では、任意の画像グループ化の解釈可能性の定量化に使用できる視覚的学習可能性と記述可能性という2つの概念を紹介する。
論文 参考訳(メタデータ) (2020-10-27T18:41:49Z) - COBE: Contextualized Object Embeddings from Narrated Instructional Video [52.73710465010274]
そこで本稿では,教師ビデオの自動書き起こしからコンテキスト適応型オブジェクト埋め込みを学習するための新しいフレームワークを提案する。
言語の意味的・構成的構造を視覚的検知器を訓練し,オブジェクトとその関連するナレーションの文脈的単語埋め込みを予測する。
実験の結果,検出器は多種多様なコンテキストオブジェクト情報を予測し,少数ショットおよびゼロショット学習の設定において極めて有効であることがわかった。
論文 参考訳(メタデータ) (2020-07-14T19:04:08Z) - ViTAA: Visual-Textual Attributes Alignment in Person Search by Natural
Language [36.319953919737245]
自然言語による人物検索は、与えられたテキスト記述にマッチする大規模な画像プールにおいて、特定の人物を検索することを目的としている。
そこで本稿では,特定の属性句を対応する視覚領域に接地できる属性適応型視点を提案する。
私たちは、堅牢な機能学習によってパフォーマンスが向上するだけでなく、成功も達成しています。
論文 参考訳(メタデータ) (2020-05-15T02:22:28Z) - Vision-based techniques for gait recognition [6.817301687702869]
本研究では、歩行認識とモデリングの現在の技術と、研究が行われた環境について論じる。
我々は,バイオメトリックスに基づく人間の認識における新しいパラダイム,すなわち遠距離バイオメトリックスと近距離で動作するバイオメトリックスの組み合わせとして,歩行のフロントノーマルなビューを使用することのモチベーションを提供する。
論文 参考訳(メタデータ) (2020-04-30T06:33:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。