論文の概要: Graph Jigsaw Learning for Cartoon Face Recognition
- arxiv url: http://arxiv.org/abs/2107.06532v1
- Date: Wed, 14 Jul 2021 08:01:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-15 14:19:37.505530
- Title: Graph Jigsaw Learning for Cartoon Face Recognition
- Title(参考訳): カートゥーン顔認識のためのグラフJigsaw学習
- Authors: Yong Li, Lingjie Lao, Zhen Cui, Shiguang Shan, Jian Yang
- Abstract要約: 畳み込みニューラルネットワーク(CNN)を用いたマンガ顔認識のための形状指向表現の学習は困難である
分類ネットワークの様々な段階においてジグソーパズルを構築し,グラフ畳み込みネットワーク(GCN)を段階的に解くグラフJigsawを提案する。
提案したグラフJigsawは、2つの人気のあるマンガの顔データセットにおいて、他の顔認識やジグソーベースの手法よりも一貫して優れています。
- 参考スコア(独自算出の注目度): 79.29656077338828
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Cartoon face recognition is challenging as they typically have smooth color
regions and emphasized edges, the key to recognize cartoon faces is to
precisely perceive their sparse and critical shape patterns. However, it is
quite difficult to learn a shape-oriented representation for cartoon face
recognition with convolutional neural networks (CNNs). To mitigate this issue,
we propose the GraphJigsaw that constructs jigsaw puzzles at various stages in
the classification network and solves the puzzles with the graph convolutional
network (GCN) in a progressive manner. Solving the puzzles requires the model
to spot the shape patterns of the cartoon faces as the texture information is
quite limited. The key idea of GraphJigsaw is constructing a jigsaw puzzle by
randomly shuffling the intermediate convolutional feature maps in the spatial
dimension and exploiting the GCN to reason and recover the correct layout of
the jigsaw fragments in a self-supervised manner. The proposed GraphJigsaw
avoids training the classification model with the deconstructed images that
would introduce noisy patterns and are harmful for the final classification.
Specially, GraphJigsaw can be incorporated at various stages in a top-down
manner within the classification model, which facilitates propagating the
learned shape patterns gradually. GraphJigsaw does not rely on any extra manual
annotation during the training process and incorporates no extra computation
burden at inference time. Both quantitative and qualitative experimental
results have verified the feasibility of our proposed GraphJigsaw, which
consistently outperforms other face recognition or jigsaw-based methods on two
popular cartoon face datasets with considerable improvements.
- Abstract(参考訳): マンガの顔認識は、通常、滑らかな色領域と強調されたエッジを持つため、マンガの顔を認識する鍵は、それらの希薄で批判的な形状パターンを正確に知覚することである。
しかし,畳み込みニューラルネットワーク(CNN)を用いたマンガの顔認識における形状指向表現の学習は非常に困難である。
この問題を軽減するために,分類ネットワークの様々な段階においてジグソーパズルを構築し,グラフ畳み込みネットワーク(gcn)を用いて漸進的に解くグラフジグソーを提案する。
パズルを解くには、テクスチャ情報がかなり限られているため、漫画の顔の形状パターンを見つける必要がある。
GraphJigsawの鍵となるアイデアは、空間次元の中間畳み込み特徴写像をランダムにシャッフルし、GCNを利用して自監督的な方法でジグソーフラグメントの正確なレイアウトを推論し、復元することでジグソーパズルを構築することである。
提案するgraphjigsawは,ノイズパターンを発生させ,最終分類に有害な分解画像を用いた分類モデルのトレーニングを回避している。
特に、graphjigsawは分類モデル内でトップダウン方式で様々な段階に組み込むことができ、学習した形状パターンを徐々に伝播させることができる。
GraphJigsawはトレーニングプロセス中に追加のマニュアルアノテーションを依存せず、推論時に余分な計算負担を伴わない。
定量的および定性的な実験結果から提案したGraphJigsawの有効性が検証された。
関連論文リスト
- Patch-Based Deep Unsupervised Image Segmentation using Graph Cuts [0.0]
本稿では,従来のグラフ手法のアルゴリズム的助けを借りて,教師なし特徴抽出の進歩を橋渡しするパッチベースの教師なし画像分割戦略を提案する。
画像パッチを分類するために訓練された単純な畳み込みニューラルネットワークは、自然に最先端の完全畳み込み非教師付きピクセルレベルのセグメンタに繋がることを示す。
論文 参考訳(メタデータ) (2023-11-01T19:59:25Z) - G-MSM: Unsupervised Multi-Shape Matching with Graph-based Affinity
Priors [52.646396621449]
G-MSMは、非剛体形状対応のための新しい教師なし学習手法である。
学習形態の集合に親和性グラフを自己教師型で構築する。
近年の形状対応ベンチマークで最先端の性能を示す。
論文 参考訳(メタデータ) (2022-12-06T12:09:24Z) - Video Anomaly Detection by Solving Decoupled Spatio-Temporal Jigsaw
Puzzles [67.39567701983357]
ビデオ異常検出(VAD)はコンピュータビジョンにおいて重要なトピックである。
近年の自己教師型学習の進歩に触発された本論文は,直感的かつ難解なプレテキストタスクを解くことによって,VADに対処する。
提案手法は3つの公開ベンチマークにおいて最先端のベンチマークよりも優れている。
論文 参考訳(メタデータ) (2022-07-20T19:49:32Z) - SSR-GNNs: Stroke-based Sketch Representation with Graph Neural Networks [34.759306840182205]
本稿では,スケッチにおけるストローク情報,すなわちスケッチの一部が頂点にエンコードされ,エッジ上のストローク間情報であるスケッチのグラフ表現について検討する。
結果のグラフ表現は、分類タスクのためのグラフニューラルネットワークのトレーニングを容易にする。
提案した表現は,既存のデータセットから分離可能ながら,構造的に類似した斬新なスケッチの生成を可能にする。
論文 参考訳(メタデータ) (2022-04-27T19:18:01Z) - Graph Neural Networks for Image Classification and Reinforcement
Learning using Graph representations [15.256931959393803]
我々は,コンピュータビジョンと強化学習という2つの異なる領域において,グラフニューラルネットワークの性能を評価する。
コンピュータビジョンのセクションでは、グラフとしての画像に対する新しい非冗長表現が、グラフレベルの予測グラフ、特に画像分類において、自明なピクセルからノードマッピングへの性能向上を図っている。
強化学習部では,グラフ問題としてルービックキューブの解法を明示的にモデル化することで,帰納バイアスのない標準モデルフリー手法の性能向上を図っている。
論文 参考訳(メタデータ) (2022-03-07T15:16:31Z) - Learning Skeletal Articulations with Neural Blend Shapes [57.879030623284216]
あらかじめ定義された骨格構造を有するエンベロープを用いて3次元文字を表現できるニューラルテクニックを開発している。
我々のフレームワークは、同じ調音構造を持つリグとスキンキャラクタを学習する。
関節領域の変形品質を向上させるニューラルブレンディング形状を提案します。
論文 参考訳(メタデータ) (2021-05-06T05:58:13Z) - Joint Deep Multi-Graph Matching and 3D Geometry Learning from
Inhomogeneous 2D Image Collections [57.60094385551773]
非均質な画像コレクションから変形可能な3Dジオメトリモデルを学ぶためのトレーニング可能なフレームワークを提案する。
さらに,2次元画像で表現された物体の3次元形状も取得する。
論文 参考訳(メタデータ) (2021-03-31T17:25:36Z) - Learning to Caricature via Semantic Shape Transform [95.25116681761142]
本稿では,意味的形状変換に基づくアルゴリズムを提案する。
提案手法は,顔の構造を維持しつつ,視覚的に心地よい形状の誇張を表現できることを示す。
論文 参考訳(メタデータ) (2020-08-12T03:41:49Z) - Deep Generation of Face Images from Sketches [36.146494762987146]
ディープ・イメージ・ツー・イメージの翻訳技術により、フリーハンドスケッチから高速に顔画像を生成することができる。
既存のソリューションはスケッチに過度に適合する傾向にあり、プロのスケッチやエッジマップを入力として必要とします。
本稿では,画像の形状空間を暗黙的にモデル化し,この空間の顔画像を合成し,入力スケッチを近似する手法を提案する。
本手法は,入力スケッチをソフトな制約として使用することにより,粗いスケッチや不完全なスケッチであっても高品質な顔画像を生成することができる。
論文 参考訳(メタデータ) (2020-06-01T16:20:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。