論文の概要: Deep Convolutional Neural Network-based Bernoulli Heatmap for Head Pose
Estimation
- arxiv url: http://arxiv.org/abs/2005.11780v1
- Date: Sun, 24 May 2020 15:36:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-29 14:00:26.187417
- Title: Deep Convolutional Neural Network-based Bernoulli Heatmap for Head Pose
Estimation
- Title(参考訳): 深層畳み込みニューラルネットワークを用いた頭部ポーズ推定のためのbernolliヒートマップ
- Authors: Zhongxu Hu, Yang Xing, Chen Lv, Peng Hang, Jie Liu
- Abstract要約: 本稿では1枚のRGB画像から頭部ポーズ推定のためのベルヌーイヒートマップを提案する。
本手法は頭部の角度を推定しながら頭部位置を推定できる。
マルチスケール表現を備えたディープ畳み込みニューラルネットワーク(CNN)構造を採用し、高解像度情報を維持する。
- 参考スコア(独自算出の注目度): 11.676928225717337
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Head pose estimation is a crucial problem for many tasks, such as driver
attention, fatigue detection, and human behaviour analysis. It is well known
that neural networks are better at handling classification problems than
regression problems. It is an extremely nonlinear process to let the network
output the angle value directly for optimization learning, and the weight
constraint of the loss function will be relatively weak. This paper proposes a
novel Bernoulli heatmap for head pose estimation from a single RGB image. Our
method can achieve the positioning of the head area while estimating the angles
of the head. The Bernoulli heatmap makes it possible to construct fully
convolutional neural networks without fully connected layers and provides a new
idea for the output form of head pose estimation. A deep convolutional neural
network (CNN) structure with multiscale representations is adopted to maintain
high-resolution information and low-resolution information in parallel. This
kind of structure can maintain rich, high-resolution representations. In
addition, channelwise fusion is adopted to make the fusion weights learnable
instead of simple addition with equal weights. As a result, the estimation is
spatially more precise and potentially more accurate. The effectiveness of the
proposed method is empirically demonstrated by comparing it with other
state-of-the-art methods on public datasets.
- Abstract(参考訳): ヘッドポーズ推定は、ドライバーの注意、疲労検出、人間の行動分析など、多くのタスクにおいて重要な問題である。
ニューラルネットワークが回帰問題よりも分類問題に優れていることはよく知られている。
最適化学習のためにネットワークが直接角度値を出力することは極めて非線形なプロセスであり、損失関数の重み制約は相対的に弱くなる。
本稿では,単一のrgb画像から頭部位置推定を行うためのbernolli heatmapを提案する。
本手法では,頭部の角度を推定しながら頭部の位置決めを行うことができる。
Bernoulliのヒートマップは、完全に接続された層を持たない完全な畳み込みニューラルネットワークの構築を可能にし、ヘッドポーズ推定の出力形式に対する新しいアイデアを提供する。
マルチスケール表現を持つ深層畳み込みニューラルネットワーク(cnn)構造を採用し,高分解能情報と低分解能情報を並列に保持する。
このような構造はリッチで高解像度な表現を維持することができる。
さらに、チャネルワイズ融合は、同じ重みで単純な加算ではなく、融合重みを学習可能にするために採用されている。
その結果、推定は空間的により正確であり、潜在的により正確である。
提案手法の有効性は,公開データセット上の他の最先端手法と比較することによって実証的に実証される。
関連論文リスト
- Addressing caveats of neural persistence with deep graph persistence [54.424983583720675]
神経の持続性に影響を与える主な要因は,ネットワークの重みのばらつきと大きな重みの空間集中である。
単一層ではなく,ニューラルネットワーク全体へのニューラルネットワークの持続性に基づくフィルタリングの拡張を提案する。
これにより、ネットワーク内の永続的なパスを暗黙的に取り込み、分散に関連する問題を緩和するディープグラフの永続性測定が得られます。
論文 参考訳(メタデータ) (2023-07-20T13:34:11Z) - Hidden Classification Layers: Enhancing linear separability between
classes in neural networks layers [0.0]
トレーニング手法の深層ネットワーク性能への影響について検討する。
本稿では,全てのネットワークレイヤの出力を含むエラー関数を誘導するニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-06-09T10:52:49Z) - Look beyond labels: Incorporating functional summary information in
Bayesian neural networks [11.874130244353253]
予測確率に関する要約情報を組み込むための簡単な手法を提案する。
利用可能な要約情報は、拡張データとして組み込まれ、ディリクレプロセスでモデル化される。
本稿では,タスクの難易度やクラス不均衡をモデルに示す方法について述べる。
論文 参考訳(メタデータ) (2022-07-04T07:06:45Z) - Neural Maximum A Posteriori Estimation on Unpaired Data for Motion
Deblurring [87.97330195531029]
本稿では、ニューラルネットワークをトレーニングし、失明したデータから視覚情報や鋭いコンテンツを復元するためのニューラルネットワークの最大Aポストエリオリ(NeurMAP)推定フレームワークを提案する。
提案されたNeurMAPは、既存のデブロアリングニューラルネットワークに対するアプローチであり、未使用データセット上のイメージデブロアリングネットワークのトレーニングを可能にする最初のフレームワークである。
論文 参考訳(メタデータ) (2022-04-26T08:09:47Z) - Optimization-Based Separations for Neural Networks [57.875347246373956]
本研究では,2層のシグモダルアクティベーションを持つディープ2ニューラルネットワークを用いて,ボールインジケータ関数を効率よく学習できることを示す。
これは最適化に基づく最初の分離結果であり、より強力なアーキテクチャの近似の利点は、実際に確実に現れる。
論文 参考訳(メタデータ) (2021-12-04T18:07:47Z) - Non-Gradient Manifold Neural Network [79.44066256794187]
ディープニューラルネットワーク(DNN)は通常、勾配降下による最適化に数千のイテレーションを要します。
非次最適化に基づく新しい多様体ニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2021-06-15T06:39:13Z) - A neural anisotropic view of underspecification in deep learning [60.119023683371736]
ニューラルネットが問題の未特定化を扱う方法が,データ表現に大きく依存していることを示す。
深層学習におけるアーキテクチャ的インダクティブバイアスの理解は,これらのシステムの公平性,堅牢性,一般化に対処する上で基本的であることを強調した。
論文 参考訳(メタデータ) (2021-04-29T14:31:09Z) - WoodFisher: Efficient Second-Order Approximation for Neural Network
Compression [35.45199662813043]
我々は、逆ヘッセンの忠実で効率的な推定法を開発する。
私たちの主な応用はニューラルネットワーク圧縮です。
本稿では,この手法をどのように拡張して1次情報を考慮するかを示す。
論文 参考訳(メタデータ) (2020-04-29T17:14:23Z) - MSE-Optimal Neural Network Initialization via Layer Fusion [68.72356718879428]
ディープニューラルネットワークは、さまざまな分類と推論タスクに対して最先端のパフォーマンスを達成する。
グラデーションと非進化性の組み合わせは、学習を新しい問題の影響を受けやすいものにする。
確率変数を用いて学習した深層ネットワークの近傍層を融合する手法を提案する。
論文 参考訳(メタデータ) (2020-01-28T18:25:15Z) - Mixed-Precision Quantized Neural Network with Progressively Decreasing
Bitwidth For Image Classification and Object Detection [21.48875255723581]
ビット幅が徐々に増大する混合精度量子化ニューラルネットワークを提案し,精度と圧縮のトレードオフを改善する。
典型的なネットワークアーキテクチャとベンチマークデータセットの実験は、提案手法がより良い結果または同等の結果が得られることを示した。
論文 参考訳(メタデータ) (2019-12-29T14:11:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。