論文の概要: Shape Preserving Facial Landmarks with Graph Attention Networks
- arxiv url: http://arxiv.org/abs/2210.07233v1
- Date: Thu, 13 Oct 2022 17:58:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-14 16:44:59.664840
- Title: Shape Preserving Facial Landmarks with Graph Attention Networks
- Title(参考訳): グラフアテンションネットワークによる顔ランドマークの形状保存
- Authors: Andr\'es Prados-Torreblanca, Jos\'e M. Buenaposada, Luis Baumela
- Abstract要約: 本稿では,CNN と Graph Attention Network Regressors のカスケードを組み合わせたモデルを提案する。
顔のランドマークの外観と位置を共同で表現するエンコーディングと、その信頼性に応じて情報を測定するアテンション機構を導入する。
実験により,提案モデルが顔の構造のグローバルな表現を学習し,頭部ポーズとランドマーク推定のベンチマークで最高性能を達成できることが確認された。
- 参考スコア(独自算出の注目度): 3.996275177789895
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Top-performing landmark estimation algorithms are based on exploiting the
excellent ability of large convolutional neural networks (CNNs) to represent
local appearance. However, it is well known that they can only learn weak
spatial relationships. To address this problem, we propose a model based on the
combination of a CNN with a cascade of Graph Attention Network regressors. To
this end, we introduce an encoding that jointly represents the appearance and
location of facial landmarks and an attention mechanism to weigh the
information according to its reliability. This is combined with a multi-task
approach to initialize the location of graph nodes and a coarse-to-fine
landmark description scheme. Our experiments confirm that the proposed model
learns a global representation of the structure of the face, achieving top
performance in popular benchmarks on head pose and landmark estimation. The
improvement provided by our model is most significant in situations involving
large changes in the local appearance of landmarks.
- Abstract(参考訳): トップパフォーマンスのランドマーク推定アルゴリズムは、局所的な外観を表現するために大きな畳み込みニューラルネットワーク(CNN)の優れた能力を利用する。
しかし、弱い空間関係しか学べないことはよく知られている。
この問題に対処するために,CNN と Graph Attention Network Regressors のカスケードを組み合わせたモデルを提案する。
この目的のために,顔のランドマークの外観と位置を共同で表現するエンコーディングと,その信頼性に応じて情報を測定するアテンション機構を導入する。
これは、グラフノードの位置を初期化するマルチタスクアプローチと、粒度の細かいランドマーク記述スキームと組み合わせる。
実験により,提案モデルが顔の構造のグローバルな表現を学習し,頭部ポーズとランドマーク推定のベンチマークでトップパフォーマンスを達成することを確認した。
我々のモデルによる改善は、ランドマークの局所的な外観に大きな変化を伴う状況において最も重要である。
関連論文リスト
- Neighborhood-Order Learning Graph Attention Network for Fake News Detection [2.34863357088666]
偽ニュース検出のためのNelborhood-Order Learning Graph Attention Network (NOL-GAT) と呼ばれる新しいモデルを提案する。
このモデルにより、各層の各ノードはその最適近傍順序を独立に学習することができる。
モデルの性能を評価するために、様々なフェイクニュースデータセットで実験を行う。
論文 参考訳(メタデータ) (2025-02-10T18:51:57Z) - Cybercrime Prediction via Geographically Weighted Learning [0.24578723416255752]
地理的緯度と長手点を考慮したグラフニューラルネットワークモデルを提案する。
合成データセットを用いて,サイバーセキュリティの4クラス分類問題にアルゴリズムを適用した。
従来のニューラルネットワークや畳み込みニューラルネットワークよりも精度が高いことを示す。
論文 参考訳(メタデータ) (2024-11-07T11:46:48Z) - GNN-LoFI: a Novel Graph Neural Network through Localized Feature-based
Histogram Intersection [51.608147732998994]
グラフニューラルネットワークは、グラフベースの機械学習の選択フレームワークになりつつある。
本稿では,古典的メッセージパッシングに代えて,ノード特徴の局所分布を解析するグラフニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-01-17T13:04:23Z) - A parameterised model for link prediction using node centrality and
similarity measure based on graph embedding [5.507008181141738]
リンク予測は、グラフ機械学習の重要な側面である。
ネットワークノード間で形成される可能性のある新しいリンクを予測する必要がある。
既存のモデルには重大な欠点がある。
ノードの集中度と類似度をベースとしています。
Model (NCSM) - リンク予測タスクの新しい方法。
論文 参考訳(メタデータ) (2023-09-11T13:13:54Z) - SEM-GAT: Explainable Semantic Pose Estimation using Learned Graph
Attention [10.883346969896621]
本稿では,信頼度の高いポイントクラウド登録候補の識別を導くために,意味論と局所幾何学を利用したグラフニューラルネットワーク(GNN)に基づく手法を提案する。
環境のセマンティックおよび形態学的特徴は、登録のための重要な基準点として機能し、正確なライダーベースのポーズ推定を可能にする。
提案手法をKITTIオドメトリデータセット上でテストし,ベンチマーク手法と比較して競合精度が向上し,より少ないネットワークパラメータに依存しながら,トラックのスムーズさが向上した。
論文 参考訳(メタデータ) (2023-08-07T16:43:46Z) - TOPIQ: A Top-down Approach from Semantics to Distortions for Image
Quality Assessment [53.72721476803585]
画像品質評価(IQA)は、ディープニューラルネットワークによる顕著な進歩を目の当たりにしたコンピュータビジョンの基本課題である。
本稿では,高レベルの意味論を用いてIQAネットワークを誘導し,意味的に重要な局所歪み領域に注目するトップダウンアプローチを提案する。
提案手法の重要な要素は,低レベル特徴に対するアテンションマップを算出した,クロススケールアテンション機構である。
論文 参考訳(メタデータ) (2023-08-06T09:08:37Z) - Skeletal Human Action Recognition using Hybrid Attention based Graph
Convolutional Network [3.261599248682793]
相対的距離と相対的角度情報に基づいて局所的注意マップをグローバルに拡張する適応型空間的注意層を提案する。
我々は,頭部,手,足を結ぶ新しい初期グラフ隣接行列を設計し,行動認識精度の点で目に見える改善点を示す。
提案モデルは,日常生活における人間活動の分野における大規模かつ挑戦的な2つのデータセットを用いて評価する。
論文 参考訳(メタデータ) (2022-07-12T12:22:21Z) - Keypoint Message Passing for Video-based Person Re-Identification [106.41022426556776]
ビデオベースの人物再識別(re-ID)は、異なるカメラで捉えた人々のビデオスニペットをマッチングすることを目的とした、視覚監視システムにおいて重要な技術である。
既存の手法は主に畳み込みニューラルネットワーク(CNN)に基づいており、そのビルディングブロックは近隣のピクセルを一度に処理するか、あるいは3D畳み込みが時間情報のモデル化に使用される場合、人の動きによって生じるミスアライメントの問題に悩まされる。
本稿では,人間指向グラフ法を用いて,通常の畳み込みの限界を克服することを提案する。具体的には,人手指のキーポイントに位置する特徴を抽出し,時空間グラフとして接続する。
論文 参考訳(メタデータ) (2021-11-16T08:01:16Z) - Bayesian Attention Belief Networks [59.183311769616466]
注意に基づくニューラルネットワークは、幅広いタスクにおいて最先端の結果を得た。
本稿では,非正規化注意重みをモデル化してデコーダネットワークを構築するベイズ的注意信念ネットワークについて紹介する。
提案手法は, 精度, 不確実性推定, ドメイン間の一般化, 敵攻撃において, 決定論的注意と最先端の注意よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-06-09T17:46:22Z) - Variational Structured Attention Networks for Deep Visual Representation
Learning [49.80498066480928]
空間的注意マップとチャネル的注意の両方を原則的に共同学習するための統合的深層フレームワークを提案する。
具体的には,確率的表現学習フレームワークに注目度の推定と相互作用を統合する。
ニューラルネットワーク内で推論ルールを実装し,確率パラメータとcnnフロントエンドパラメータのエンドツーエンド学習を可能にする。
論文 参考訳(メタデータ) (2021-03-05T07:37:24Z) - Multi-Level Graph Convolutional Network with Automatic Graph Learning
for Hyperspectral Image Classification [63.56018768401328]
HSI分類のための自動グラフ学習法(MGCN-AGL)を用いたマルチレベルグラフ畳み込みネットワーク(GCN)を提案する。
空間的に隣接する領域における重要度を特徴付けるために注意機構を利用することで、最も関連性の高い情報を適応的に組み込んで意思決定を行うことができる。
MGCN-AGLは局所的に生成した表現表現に基づいて画像領域間の長距離依存性を符号化する。
論文 参考訳(メタデータ) (2020-09-19T09:26:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。