論文の概要: Multi-Granularity Representation Learning for Sketch-based Dynamic Face
Image Retrieval
- arxiv url: http://arxiv.org/abs/2401.00371v1
- Date: Sun, 31 Dec 2023 02:17:14 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-03 17:40:44.289722
- Title: Multi-Granularity Representation Learning for Sketch-based Dynamic Face
Image Retrieval
- Title(参考訳): スケッチに基づく動的顔画像検索のためのマルチグラニュリティ表現学習
- Authors: Liang Wang, Dawei Dai, Shiyu Fu, Guoyin Wang
- Abstract要約: 特定のシナリオでは、顔のスケッチを使用して人物を特定することができる。
スケッチ少ない顔画像検索(SLFIR)は、人や機械が描画プロセス中に対話する手段を提供することで、障壁を克服しようとする。
本研究では,SLFIR問題に対処する多粒度表現学習法(MGRL)を提案する。
- 参考スコア(独自算出の注目度): 13.287197931943961
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In specific scenarios, face sketch can be used to identify a person. However,
drawing a face sketch often requires exceptional skill and is time-consuming,
limiting its widespread applications in actual scenarios. The new framework of
sketch less face image retrieval (SLFIR)[1] attempts to overcome the barriers
by providing a means for humans and machines to interact during the drawing
process. Considering SLFIR problem, there is a large gap between a partial
sketch with few strokes and any whole face photo, resulting in poor performance
at the early stages. In this study, we propose a multigranularity (MG)
representation learning (MGRL) method to address the SLFIR problem, in which we
learn the representation of different granularity regions for a partial sketch,
and then, by combining all MG regions of the sketches and images, the final
distance was determined. In the experiments, our method outperformed
state-of-the-art baselines in terms of early retrieval on two accessible
datasets. Codes are available at https://github.com/ddw2AIGROUP2CQUPT/MGRL.
- Abstract(参考訳): 特定のシナリオでは、顔のスケッチを使って人物を識別することができる。
しかし、顔のスケッチを描くには、しばしば例外的なスキルが必要であり、実際のシナリオでの幅広い応用を制限するのに時間がかかる。
sketch less face image retrieval (slfir)[1]の新たなフレームワークは、描画プロセス中に人間と機械が対話する手段を提供することで、障壁を克服しようとするものである。
SLFIR問題を考えると、ストロークが少ない部分スケッチと顔写真全体の間には大きなギャップがあり、初期の段階ではパフォーマンスが低下する。
本研究では,SLFIR問題に対処する多粒度表現学習法(MGRL)を提案し,部分スケッチの異なる粒度領域の表現を学習し,スケッチと画像のすべてのMG領域を組み合わせて最終的な距離を決定する。
実験では,2つのアクセス可能なデータセットの早期検索において,最先端のベースラインを上回った。
コードはhttps://github.com/ddw2aigroup2cqupt/mgrlで入手できる。
関連論文リスト
- Stylized Face Sketch Extraction via Generative Prior with Limited Data [6.727433982111717]
StyleSketchは、顔画像から高解像度のスタイリングスケッチを抽出する方法である。
事前訓練されたStyleGANの深い特徴の豊富なセマンティクスを用いて、16対の顔とそれに対応するスケッチイメージでスケッチジェネレータを訓練することができる。
論文 参考訳(メタデータ) (2024-03-17T16:25:25Z) - Towards Interactive Image Inpainting via Sketch Refinement [13.34066589008464]
そこで本研究では,SketchRefinerと呼ばれる2段階画像のインペイント手法を提案する。
第1段階では,クロス相関損失関数を用いて,ユーザが提供するスケッチを堅牢に校正し,洗練する。
第2段階では,特徴空間の抽象的スケッチから情報的特徴を抽出し,着色過程を変調する。
論文 参考訳(メタデータ) (2023-06-01T07:15:54Z) - Picture that Sketch: Photorealistic Image Generation from Abstract
Sketches [109.69076457732632]
この論文は、あなたや私のような訓練を受けていないアマチュアの抽象的で変形した普通のスケッチから、それをフォトリアリスティックなイメージに変えます。
まず、エッジマップのようなスケッチを指示するのではなく、抽象的なフリーハンドな人間のスケッチで作業することを目指しています。
そうすることで、スケッチから写真までのパイプラインを民主化し、スケッチがどれだけよいかに関わらず、スケッチを"写真化"します。
論文 参考訳(メタデータ) (2023-03-20T14:49:03Z) - Sketch Less Face Image Retrieval: A New Challenge [9.703239229149261]
完全な顔のスケッチを描くには、しばしばスキルと時間が必要です。
そこで本研究では,各ストロークで顔画像検索を行い,ストロークの少ない部分スケッチを用いて対象の顔写真を検索することを目的とした,スケッチ少ない顔画像検索(SLFIR)を提案する。
実験は、新しいフレームワークが部分的またはプール描画スケッチを使用して検索を終了できることを示している。
論文 参考訳(メタデータ) (2023-02-11T02:36:00Z) - Multi-granularity Association Learning Framework for on-the-fly
Fine-Grained Sketch-based Image Retrieval [7.797006835701767]
きめ細かいスケッチベース画像検索(FG-SBIR)は、与えられたクエリスケッチで特定の写真を取得する問題に対処する。
本研究では,最小のストローク数で対象写真を検索することを目的とした(不完全スケッチ)。
非完全スケッチの埋め込み空間をさらに最適化する多粒性関連学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-01-13T14:38:50Z) - Fully Context-Aware Image Inpainting with a Learned Semantic Pyramid [102.24539566851809]
画像中の任意の欠落する領域に対して、合理的で現実的なコンテンツを復元することは、重要な課題である。
最近の画像インパインティングモデルは鮮明な視覚的詳細を生成するために大きな進歩を遂げているが、それでもテクスチャのぼやけや構造的歪みにつながる可能性がある。
本研究では,画像中の局所的欠落コンテンツの回復に大きく貢献する,多スケールなセマンティック・セマンティック・ピラミッド・ネットワーク(SPN)を提案する。
論文 参考訳(メタデータ) (2021-12-08T04:33:33Z) - Domain-Smoothing Network for Zero-Shot Sketch-Based Image Retrieval [66.37346493506737]
Zero-Shot Sketch-Based Image Retrieval (ZS-SBIR) は、新しいクロスモーダル検索タスクである。
ZS-SBIRのための新しいドメイン・スムーシング・ネットワーク(DSN)を提案する。
我々のアプローチは、SketchyとTU-Berlinの両方のデータセットで最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2021-06-22T14:58:08Z) - DeepFacePencil: Creating Face Images from Freehand Sketches [77.00929179469559]
既存の画像から画像への変換には、大規模なスケッチと画像のデータセットが必要である。
本稿では,手描きスケッチから写真リアルな顔画像を生成するための効果的なツールであるDeepFacePencilを提案する。
論文 参考訳(メタデータ) (2020-08-31T03:35:21Z) - Cross-Modal Hierarchical Modelling for Fine-Grained Sketch Based Image
Retrieval [147.24102408745247]
我々は、これまで見過ごされてきたスケッチのさらなる特性、すなわち、詳細レベルの階層性について研究する。
本稿では,スケッチ固有の階層を育成し,それを利用して,対応する階層レベルでのスケッチと写真とのマッチングを行う新しいネットワークを設計する。
論文 参考訳(メタデータ) (2020-07-29T20:50:25Z) - Sketch Less for More: On-the-Fly Fine-Grained Sketch Based Image
Retrieval [203.2520862597357]
きめ細かいスケッチベースの画像検索(FG-SBIR)は、ユーザのクエリのスケッチから特定の写真インスタンスを検索する問題に対処する。
これらの課題に対処するため、従来のFG-SBIRフレームワークを再構築する。
ユーザが絵を描き始めるとすぐに検索を開始できるオンザフライ設計を提案する。
論文 参考訳(メタデータ) (2020-02-24T15:36:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。