論文の概要: Edge-aware Graph Representation Learning and Reasoning for Face Parsing
- arxiv url: http://arxiv.org/abs/2007.11240v1
- Date: Wed, 22 Jul 2020 07:46:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-07 22:47:52.556702
- Title: Edge-aware Graph Representation Learning and Reasoning for Face Parsing
- Title(参考訳): エッジアウェアグラフ表現学習と顔解析のための推論
- Authors: Gusi Te, Yinglu Liu, Wei Hu, Hailin Shi, and Tao Mei
- Abstract要約: 顔解析は、最近注目されている各顔成分にピクセルワイズラベルを推論する。
従来は顔解析における効率性を示してきたが, 異なる顔領域間の相関性を見落としている。
本稿では,グラフ表現の学習による地域関係のモデル化と推論を提案する。
- 参考スコア(独自算出の注目度): 61.5045850197694
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Face parsing infers a pixel-wise label to each facial component, which has
drawn much attention recently. Previous methods have shown their efficiency in
face parsing, which however overlook the correlation among different face
regions. The correlation is a critical clue about the facial appearance, pose,
expression etc., and should be taken into account for face parsing. To this
end, we propose to model and reason the region-wise relations by learning graph
representations, and leverage the edge information between regions for
optimized abstraction. Specifically, we encode a facial image onto a global
graph representation where a collection of pixels ("regions") with similar
features are projected to each vertex. Our model learns and reasons over
relations between the regions by propagating information across vertices on the
graph. Furthermore, we incorporate the edge information to aggregate the
pixel-wise features onto vertices, which emphasizes on the features around
edges for fine segmentation along edges. The finally learned graph
representation is projected back to pixel grids for parsing. Experiments
demonstrate that our model outperforms state-of-the-art methods on the widely
used Helen dataset, and also exhibits the superior performance on the
large-scale CelebAMask-HQ and LaPa dataset. The code is available at
https://github.com/tegusi/EAGRNet.
- Abstract(参考訳): 顔解析は、最近注目を集めている各顔コンポーネントにピクセル単位のラベルを推測する。
従来は顔解析における効率性を示してきたが, 異なる顔領域間の相関性を見落としている。
この相関は、顔の外観、ポーズ、表情などに関する重要な手がかりであり、顔のパーシングを考慮に入れるべきである。
そこで我々は,グラフ表現の学習による地域関係のモデル化と推論を行い,最適化された抽象化のために領域間のエッジ情報を活用することを提案する。
具体的には、同じ特徴を持つピクセル(領域)の集合が各頂点に投影されるグローバルグラフ表現に、顔画像を符号化する。
我々のモデルは、グラフ上の頂点にまたがる情報を伝播することにより、地域間の関係を学習し、理由付けする。
さらに,エッジ情報を取り込んで画素単位の特徴を頂点に集約し,エッジ近傍の特徴に着目し,エッジに沿って細かなセグメンテーションを行う。
最終的に学習されたグラフ表現は、解析のためにピクセルグリッドに投影される。
実験により、我々のモデルは広く使用されているHelenデータセット上で最先端の手法よりも優れており、大規模なCelebAMask-HQおよびLaPaデータセット上での優れたパフォーマンスを示している。
コードはhttps://github.com/tegusi/eagrnetで入手できる。
関連論文リスト
- Hierarchical Superpixel Segmentation via Structural Information Theory [48.488598357738674]
スーパーピクセルセグメンテーションは多くの高レベルのコンピュータビジョンタスクの基礎となっている。
構造情報理論に基づく階層的スーパーピクセルセグメンテーション手法であるSIT-HSSを提案する。
SIT-HSSは、最先端の教師なしスーパーピクセルセグメンテーションアルゴリズムよりも優れた性能を示す。
論文 参考訳(メタデータ) (2025-01-13T05:39:43Z) - RoboHop: Segment-based Topological Map Representation for Open-World Visual Navigation [18.053914853235142]
画像セグメントに基づく新しい環境表現を提案する。
3次元シーングラフとは異なり、セグメントをノードとする純粋に位相グラフを作成する。
これはセグメント間の永続性によって定義される「場所の連続的な感覚」を明らかにする。
論文 参考訳(メタデータ) (2024-05-09T14:17:26Z) - BI-GCN: Boundary-Aware Input-Dependent Graph Convolution Network for
Biomedical Image Segmentation [21.912509900254364]
セグメント化タスクにグラフ畳み込みを適用し,改良されたtextitLaplacianを提案する。
本手法は,大腸内視鏡像におけるポリープの分画と光ディスク,光カップのカラーファンドス画像における画期的なアプローチよりも優れていた。
論文 参考訳(メタデータ) (2021-10-27T21:12:27Z) - Learning to Generate Scene Graph from Natural Language Supervision [52.18175340725455]
シーングラフと呼ばれる画像内の局所化オブジェクトとその関係をグラフィカルに表現するために,画像と文のペアから学習する最初の方法の1つを提案する。
既製のオブジェクト検出器を利用してオブジェクトのインスタンスを識別し、ローカライズし、検出された領域のラベルとキャプションから解析された概念をマッチングし、シーングラフを学習するための"擬似ラベル"を作成する。
論文 参考訳(メタデータ) (2021-09-06T03:38:52Z) - Font Completion and Manipulation by Cycling Between Multi-Modality
Representations [113.26243126754704]
中間表現としてグラフを用いた2次元グラフィックオブジェクトとしてフォントグリフの生成を探求する。
我々は、画像エンコーダと画像の間のグラフで、モダリティサイクルのイメージ・ツー・イメージ構造を定式化する。
本モデルでは,画像から画像までのベースラインと,それ以前のグリフ補完手法よりも改善された結果を生成する。
論文 参考訳(メタデータ) (2021-08-30T02:43:29Z) - Edge Representation Learning with Hypergraphs [36.03482700241067]
本稿では,グラフのエッジをハイパーグラフのノードに変換するDHT(Dual Hypergraph Transformation)に基づく新しいエッジ表現学習フレームワークを提案する。
グラフ表現と生成性能のための多種多様なグラフデータセット上で,ハイパーグラフを用いたエッジ表現学習法を検証する。
我々のエッジ表現学習とプーリング法はグラフ分類における最先端のグラフプーリング法よりも優れています。
論文 参考訳(メタデータ) (2021-06-30T06:59:05Z) - Segmentation-grounded Scene Graph Generation [47.34166260639392]
ピクセルレベルセグメンテーションに基づくシーングラフ生成のためのフレームワークを提案する。
私たちのフレームワークは、基盤となるシーングラフ生成方法に無知です。
ターゲットデータセットと補助データセットの両方でマルチタスクで学習される。
論文 参考訳(メタデータ) (2021-04-29T08:54:08Z) - Adaptive Graph Representation Learning and Reasoning for Face Parsing [55.086151726427104]
顔解析は、各顔成分にピクセルワイズラベルを推論する。
成分関係は、顔領域の曖昧な画素を識別する重要な手がかりである。
顔面成分の適応的グラフ表現学習と推論を提案する。
論文 参考訳(メタデータ) (2021-01-18T12:17:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。