論文の概要: HybridGazeNet: Geometric model guided Convolutional Neural Networks for
gaze estimation
- arxiv url: http://arxiv.org/abs/2111.11691v1
- Date: Tue, 23 Nov 2021 07:20:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-25 01:21:34.635173
- Title: HybridGazeNet: Geometric model guided Convolutional Neural Networks for
gaze estimation
- Title(参考訳): HybridGazeNet: 視線推定のための幾何モデルガイド付き畳み込みニューラルネットワーク
- Authors: Shaobo Guo, Xiao Jiang, Zhizhong Su, Rui Wu and Xin Wang
- Abstract要約: 幾何学的眼球モデルを外見に基づくCNNアーキテクチャに明示的にエンコードする統合フレームワークであるHybridGazeNetを提案する。
複数の挑戦的なガゼデータセットの実験では、HybridGazeNetは既存のSOTA手法よりも精度と一般化能力が優れていることが示されている。
- 参考スコア(独自算出の注目度): 9.649076368863904
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As a critical cue for understanding human intention, human gaze provides a
key signal for Human-Computer Interaction(HCI) applications. Appearance-based
gaze estimation, which directly regresses the gaze vector from eye images, has
made great progress recently based on Convolutional Neural Networks(ConvNets)
architecture and open-source large-scale gaze datasets. However, encoding
model-based knowledge into CNN model to further improve the gaze estimation
performance remains a topic that needs to be explored. In this paper, we
propose HybridGazeNet(HGN), a unified framework that encodes the geometric
eyeball model into the appearance-based CNN architecture explicitly. Composed
of a multi-branch network and an uncertainty module, HybridGazeNet is trained
using a hyridized strategy. Experiments on multiple challenging gaze datasets
shows that HybridGazeNet has better accuracy and generalization ability
compared with existing SOTA methods. The code will be released later.
- Abstract(参考訳): 人間の意図を理解するための重要な手がかりとして、ヒューマン・コンピュータ・インタラクション(HCI)アプリケーションのための重要な信号を提供する。
近年,畳み込みニューラルネットワーク(ConvNets)アーキテクチャと大規模視線データセットをベースとして,視線ベクトルを直接眼画像から回帰する外観に基づく視線推定が大きな進歩を遂げている。
しかし, モデルに基づく知識をCNNモデルにエンコードして視線推定性能をさらに向上させることは, 検討すべき課題である。
本稿では,幾何学的眼球モデルを外見に基づくCNNアーキテクチャに明示的にエンコードする統合フレームワークであるHybridGazeNet(HGN)を提案する。
マルチブランチネットワークと不確実性モジュールで構成されるHybridGazeNetは、ハイリッド戦略を用いてトレーニングされている。
複数の挑戦的なガゼデータセットの実験では、HybridGazeNetは既存のSOTA手法よりも精度と一般化能力が優れていることが示されている。
コードは後でリリースされる。
関連論文リスト
- MAgNET: A Graph U-Net Architecture for Mesh-Based Simulations [0.5185522256407782]
我々は、任意のグラフ構造化データに対応するために、よく知られた畳み込みニューラルネットワークを拡張するMagNETを提案する。
固体の力学における非線形有限要素シミュレーションのサロゲートモデリングにおけるMAgNETの予測能力を示す。
論文 参考訳(メタデータ) (2022-11-01T19:23:45Z) - Learnable Filters for Geometric Scattering Modules [64.03877398967282]
最近提案された幾何散乱変換の緩和に基づく新しいグラフニューラルネットワーク(GNN)モジュールを提案する。
我々の学習可能な幾何散乱(LEGS)モジュールは、ウェーブレットの適応的なチューニングを可能にし、学習された表現に帯域通過の特徴が現れるように促す。
論文 参考訳(メタデータ) (2022-08-15T22:30:07Z) - EvenNet: Ignoring Odd-Hop Neighbors Improves Robustness of Graph Neural
Networks [51.42338058718487]
グラフニューラルネットワーク(GNN)は、グラフ機械学習における有望なパフォーマンスについて、広範な研究の注目を集めている。
GCNやGPRGNNのような既存のアプローチは、テストグラフ上のホモフィリな変化に直面しても堅牢ではない。
偶数多項式グラフフィルタに対応するスペクトルGNNであるEvenNetを提案する。
論文 参考訳(メタデータ) (2022-05-27T10:48:14Z) - Spiking Graph Convolutional Networks [19.36064180392385]
SpikingGCNは、GCNの埋め込みとSNNの生体忠実性特性を統合することを目的としたエンドツーエンドフレームワークである。
ニューロモルフィックチップ上でのスパイキングGCNは、グラフデータ解析にエネルギー効率の明確な利点をもたらすことを示す。
論文 参考訳(メタデータ) (2022-05-05T16:44:36Z) - L2CS-Net: Fine-Grained Gaze Estimation in Unconstrained Environments [2.5234156040689237]
制約のない環境での視線予測のための頑健なCNNモデルを提案する。
我々は、ネットワーク学習を改善し、一般化を高めるために、各角度に2つの同一の損失を用いる。
提案モデルでは,MPIIGazeデータセットとGaze360データセットを用いて3.92degと10.41degの最先端精度を実現する。
論文 参考訳(メタデータ) (2022-03-07T12:35:39Z) - BScNets: Block Simplicial Complex Neural Networks [79.81654213581977]
グラフ学習における最新の方向性として、SNN(Simplicial Neural Network)が最近登場した。
リンク予測のためのBlock Simplicial Complex Neural Networks (BScNets) モデルを提案する。
BScNetsは、コストを抑えながら最先端のモデルよりも大きなマージンを保っている。
論文 参考訳(メタデータ) (2021-12-13T17:35:54Z) - Enhance Information Propagation for Graph Neural Network by
Heterogeneous Aggregations [7.3136594018091134]
グラフニューラルネットワークは、ディープラーニングの成功の継続として出現している。
ヘテロジニアスアグリゲーションを組み合わせることで,GNN層間の情報伝達を促進することを提案する。
我々は,多くのグラフ分類ベンチマークにおいて,HAG-Netの有効性を実証的に検証した。
論文 参考訳(メタデータ) (2021-02-08T08:57:56Z) - Binary Graph Neural Networks [69.51765073772226]
グラフニューラルネットワーク(gnns)は、不規則データに対する表現学習のための強力で柔軟なフレームワークとして登場した。
本稿では,グラフニューラルネットワークのバイナライゼーションのための異なる戦略を提示し,評価する。
モデルの慎重な設計とトレーニングプロセスの制御によって、バイナリグラフニューラルネットワークは、挑戦的なベンチマークの精度において、適度なコストでトレーニングできることを示しています。
論文 参考訳(メタデータ) (2020-12-31T18:48:58Z) - Data-Driven Learning of Geometric Scattering Networks [74.3283600072357]
最近提案された幾何散乱変換の緩和に基づく新しいグラフニューラルネットワーク(GNN)モジュールを提案する。
我々の学習可能な幾何散乱(LEGS)モジュールは、ウェーブレットの適応的なチューニングを可能にし、学習された表現に帯域通過の特徴が現れるように促す。
論文 参考訳(メタデータ) (2020-10-06T01:20:27Z) - FastSal: a Computationally Efficient Network for Visual Saliency
Prediction [7.742198347952173]
我々は、MobileNetV2が視覚的サリエンシモデルに優れたバックボーンを作り、複雑なデコーダを使わずに有効であることを示す。
また,DeepGaze IIのような計算コストの高いモデルからの知識伝達は,ラベルのないデータセットを擬似ラベリングすることで実現できることを示す。
論文 参考訳(メタデータ) (2020-08-25T16:32:33Z) - Binarized Graph Neural Network [65.20589262811677]
我々は二項化グラフニューラルネットワークを開発し、二項化ネットワークパラメータを用いてノードのバイナリ表現を学習する。
提案手法は既存のGNNベースの埋め込み手法にシームレスに統合できる。
実験により、提案された二項化グラフニューラルネットワーク、すなわちBGNは、時間と空間の両方の観点から、桁違いに効率的であることが示されている。
論文 参考訳(メタデータ) (2020-04-19T09:43:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。