論文の概要: From A Glance to "Gotcha": Interactive Facial Image Retrieval with
Progressive Relevance Feedback
- arxiv url: http://arxiv.org/abs/2007.15683v1
- Date: Thu, 30 Jul 2020 18:46:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-05 14:52:17.128442
- Title: From A Glance to "Gotcha": Interactive Facial Image Retrieval with
Progressive Relevance Feedback
- Title(参考訳): ゴッチャ」から「ゴッチャ」へ:プログレッシブな関連フィードバックを伴う対話型顔画像検索
- Authors: Xinru Yang, Haozhi Qi, Mingyang Li, Alexander Hauptmann
- Abstract要約: 本稿では,目撃者から徐々にフィードバックを得て顔画像を取得するためのエンドツーエンドフレームワークを提案する。
追加のアノテーションを必要とせずに、私たちのモデルは少しのレスポンスの努力を犠牲にして適用できます。
- 参考スコア(独自算出の注目度): 72.29919762941029
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Facial image retrieval plays a significant role in forensic investigations
where an untrained witness tries to identify a suspect from a massive pool of
images. However, due to the difficulties in describing human facial appearances
verbally and directly, people naturally tend to depict by referring to
well-known existing images and comparing specific areas of faces with them and
it is also challenging to provide complete comparison at each time. Therefore,
we propose an end-to-end framework to retrieve facial images with relevance
feedback progressively provided by the witness, enabling an exploitation of
history information during multiple rounds and an interactive and iterative
approach to retrieving the mental image. With no need of any extra annotations,
our model can be applied at the cost of a little response effort. We experiment
on \texttt{CelebA} and evaluate the performance by ranking percentile and
achieve 99\% under the best setting. Since this topic remains little explored
to the best of our knowledge, we hope our work can serve as a stepping stone
for further research.
- Abstract(参考訳): 顔画像検索は、未訓練の目撃者が大量の画像から容疑者を特定しようとする法医学的な調査において重要な役割を果たす。
しかし、人間の顔の表情を口頭・直接的に説明するのが困難であるため、自然に既知の画像を参照し、顔の特定の領域を比較して表現する傾向があり、同時に、そのたびに完全な比較を行うことも困難である。
そこで本研究では,証人が徐々に提供し,複数ラウンドの履歴情報の活用を可能にするとともに,心的イメージの検索にインタラクティブで反復的なアプローチを施したエンド・ツー・エンド・エンドの枠組みを提案する。
追加のアノテーションは不要で、私たちのモデルは少しのレスポンスのコストで適用できます。
我々は, <texttt{CelebA} を実験し, パーセンタイルのランク付けによる性能評価を行い, 最高の設定で 99\% を達成する。
この話題は、私たちの知識の最良の部分についてはほとんど探求されていないので、我々の研究がさらなる研究の足掛かりとなることを願っています。
関連論文リスト
- A Comprehensive Review of Few-shot Action Recognition [64.47305887411275]
アクション認識は、複雑で可変なビデオデータを手動でラベル付けすることのコストと非現実性に対処することを目的としている。
ビデオ中の人間のアクションを正確に分類するには、クラスごとにいくつかのラベル付き例だけを使用する必要がある。
論文 参考訳(メタデータ) (2024-07-20T03:53:32Z) - Semantic Contextualization of Face Forgery: A New Definition, Dataset, and Detection Method [77.65459419417533]
我々は,顔フォージェリを意味的文脈に配置し,意味的顔属性を変更する計算手法が顔フォージェリの源であることを定義した。
階層的なグラフで整理されたラベルの集合に各画像が関連付けられている大規模な顔偽画像データセットを構築した。
本稿では,ラベル関係を捕捉し,その優先課題を優先するセマンティクス指向の顔偽造検出手法を提案する。
論文 参考訳(メタデータ) (2024-05-14T10:24:19Z) - FACE-AUDITOR: Data Auditing in Facial Recognition Systems [24.082527732931677]
顔画像を扱うスケーラビリティと能力のために、ショットベースの顔認識システムが注目されている。
顔画像の誤使用を防止するために、簡単なアプローチとして、生の顔画像を共有する前に修正する方法がある。
そこで本研究では,FACE-AUDITORの完全ツールキットを提案する。このツールキットは,少数ショットベースの顔認識モデルに問い合わせ,ユーザの顔画像のいずれかがモデルのトレーニングに使用されているかどうかを判断する。
論文 参考訳(メタデータ) (2023-04-05T23:03:54Z) - A survey on facial image deblurring [3.6775758132528877]
顔画像がぼやけていると、顔認識などのハイレベルな視覚タスクに大きな影響を与えます。
本稿では,最近発表された顔画像の難読化手法について概説し,その大部分はディープラーニングに基づくものである。
本稿では,データセットとメトリクスにおける古典的手法の性能を示すとともに,モデルに基づく手法と学習に基づく手法の違いについて,簡単な議論を行う。
論文 参考訳(メタデータ) (2023-02-10T02:24:56Z) - Specialized Re-Ranking: A Novel Retrieval-Verification Framework for
Cloth Changing Person Re-Identification [36.4001616893874]
Re-IDは通常のRe-IDや生体認証技術よりもセキュリティの高い複雑なシナリオで動作することができる。
類似画像を扱う新しい検索検証フレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-07T14:47:28Z) - FaIRCoP: Facial Image Retrieval using Contrastive Personalization [43.293482565385055]
属性から顔画像を取得することは、顔認識や被疑者識別などの様々なシステムにおいて重要な役割を果たす。
既存の方法は、ユーザのメンタルイメージの特定の特徴を、提案した画像と比較することで実現している。
そこで本研究では,ユーザのフィードバックを用いて,対象画像と類似あるいは異な画像とラベル付けする手法を提案する。
論文 参考訳(メタデータ) (2022-05-28T09:52:09Z) - Where Does the Performance Improvement Come From? - A Reproducibility
Concern about Image-Text Retrieval [85.03655458677295]
画像テキスト検索は、情報検索分野において、徐々に主要な研究方向になりつつある。
まず、画像テキスト検索タスクに焦点が当てられている理由と関連性について検討する。
本研究では,事前学習と非事前学習による検索モデルの再現の諸側面を解析する。
論文 参考訳(メタデータ) (2022-03-08T05:01:43Z) - SynFace: Face Recognition with Synthetic Data [83.15838126703719]
我々は、ID混在(IM)とドメイン混在(DM)を併用したSynFaceを考案し、パフォーマンスギャップを緩和する。
また、合成顔画像の系統的実験分析を行い、合成データを顔認識に効果的に活用する方法についての知見を提供する。
論文 参考訳(メタデータ) (2021-08-18T03:41:54Z) - Enhancing Social Relation Inference with Concise Interaction Graph and
Discriminative Scene Representation [56.25878966006678]
我々はtextbfSocial rtextbfElation (PRISE) における textbfPractical textbfInference のアプローチを提案する。
人の対話的特徴と全体主義的な場面の識別的特徴を簡潔に学習する。
PRISEはPIPAデータセットにおけるドメイン分類の改善を6.8$%で達成している。
論文 参考訳(メタデータ) (2021-07-30T04:20:13Z) - Part2Whole: Iteratively Enrich Detail for Cross-Modal Retrieval with
Partial Query [25.398090300086302]
本稿では,この問題に対処する対話型検索フレームワークPart2Wholeを提案する。
Interactive Retrieval Agentは、初期クエリを洗練するための最適なポリシーを構築するために訓練される。
テキスト画像データセット以外の人手による注釈データを必要としない弱教師付き強化学習法を提案する。
論文 参考訳(メタデータ) (2021-03-02T11:27:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。