論文の概要: Lite-HRNet Plus: Fast and Accurate Facial Landmark Detection
- arxiv url: http://arxiv.org/abs/2308.12133v1
- Date: Wed, 23 Aug 2023 13:43:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-24 14:07:23.993672
- Title: Lite-HRNet Plus: Fast and Accurate Facial Landmark Detection
- Title(参考訳): Lite-HRNet Plus: 高速かつ正確な顔のランドマーク検出
- Authors: Sota Kato, Kazuhiro Hotta, Yuhki Hatakeyama, Yoshinori Konishi
- Abstract要約: 本稿では,核融合ブロックの計算コストの重い問題を解くために,Lite-HRNet Plusを提案する。
Lite-HRNet Plusは、チャネルアテンションに基づく新しい融合ブロックと、計算強度の低い新しい出力モジュールの2つの改善を実現している。
- 参考スコア(独自算出の注目度): 5.325390073522079
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Facial landmark detection is an essential technology for driver status
tracking and has been in demand for real-time estimations. As a landmark
coordinate prediction, heatmap-based methods are known to achieve a high
accuracy, and Lite-HRNet can achieve a fast estimation. However, with
Lite-HRNet, the problem of a heavy computational cost of the fusion block,
which connects feature maps with different resolutions, has yet to be solved.
In addition, the strong output module used in HRNetV2 is not applied to
Lite-HRNet. Given these problems, we propose a novel architecture called
Lite-HRNet Plus. Lite-HRNet Plus achieves two improvements: a novel fusion
block based on a channel attention and a novel output module with less
computational intensity using multi-resolution feature maps. Through
experiments conducted on two facial landmark datasets, we confirmed that
Lite-HRNet Plus further improved the accuracy in comparison with conventional
methods, and achieved a state-of-the-art accuracy with a computational
complexity with the range of 10M FLOPs.
- Abstract(参考訳): 顔のランドマーク検出は、運転者のステータス追跡に不可欠な技術であり、リアルタイムな推定が求められている。
ランドマーク座標予測として、ヒートマップに基づく手法は高い精度を達成することが知られ、Lite-HRNetは高速な推定を行うことができる。
しかし、Lite-HRNetでは、異なる解像度で特徴マップを接続する融合ブロックの計算コストの重い問題はまだ解決されていない。
加えて、HRNetV2で使用される強い出力モジュールはLite-HRNetには適用されない。
これらの問題から,Lite-HRNet Plusという新しいアーキテクチャを提案する。
Lite-HRNet Plusは、チャネルアテンションに基づく新しい融合ブロックと、マルチ解像度特徴写像を用いた計算強度の低い新しい出力モジュールの2つの改善を実現している。
2つの顔のランドマークデータセットを用いて行った実験により,Lite-HRNet Plusは従来手法と比較して精度が向上し,10M FLOPの計算複雑性を伴う最先端の精度が達成された。
関連論文リスト
- UHNet: An Ultra-Lightweight and High-Speed Edge Detection Network [2.8579170027399137]
本稿では,超軽量エッジ検出モデル(UHNet)を提案する。
UHNetは42.3kパラメータ、166 FPS、0.79G FLOPの優れたパフォーマンス指標を備えている。
BSDS500、NYUD、BIPEDデータセットの実験結果は、UHNetが顕著なエッジ検出性能を達成することを証明している。
論文 参考訳(メタデータ) (2024-08-08T06:56:33Z) - Temporal Correlation Meets Embedding: Towards a 2nd Generation of JDE-based Real-Time Multi-Object Tracking [52.04679257903805]
共同検出・埋め込み(JDE)トラッカーは多目的追跡(MOT)タスクにおいて優れた性能を示した。
TCBTrackという名前のトラッカーは、複数の公開ベンチマークで最先端のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2024-07-19T07:48:45Z) - MultiScale MeshGraphNets [65.26373813797409]
我々はMeshGraphNetsからフレームワークを改善するための2つの補完的なアプローチを提案する。
まず、より粗いメッシュ上で高解像度システムの正確なサロゲートダイナミクスを学習できることを実証する。
次に、2つの異なる解像度でメッセージを渡す階層的アプローチ(MultiScale MeshGraphNets)を導入する。
論文 参考訳(メタデータ) (2022-10-02T20:16:20Z) - Lightweight Salient Object Detection in Optical Remote Sensing Images
via Feature Correlation [93.80710126516405]
本稿では,これらの問題に対処する軽量ORSI-SODソリューションであるCorrNetを提案する。
それぞれのコンポーネントのパラメータと計算を減らし、CorrNetは4.09Mのパラメータしか持たず、21.09GのFLOPで実行している。
2つの公開データセットの実験結果から、私たちの軽量なCorrNetは、26の最先端メソッドと比較して、競争力やパフォーマンスがさらに向上することが示された。
論文 参考訳(メタデータ) (2022-01-20T08:28:01Z) - Lite-HRNet: A Lightweight High-Resolution Network [97.17242913089464]
人間のポーズ推定に有効な高分解能ネットワークLite-HRNetを提案する。
シャッフルブロックにおける高用量(1x1)の畳み込みが計算ボトルネックとなる。
シャッフルブロックにおけるコストのかかる(1x1)畳み込みを置き換えるために,軽量な条件付きチャネル重み付けを導入する。
論文 参考訳(メタデータ) (2021-04-13T17:59:31Z) - FastFlowNet: A Lightweight Network for Fast Optical Flow Estimation [81.76975488010213]
ディセンス光学フロー推定は、多くのロボットビジョンタスクで重要な役割を果たしています。
現在のネットワークはしばしば多くのパラメータを占有し、計算コストがかかる。
提案したFastFlowNetは、周知の粗大なやり方で、以下のイノベーションで機能する。
論文 参考訳(メタデータ) (2021-03-08T03:09:37Z) - A Unified Light Framework for Real-time Fault Detection of Freight Train
Images [16.721758280029302]
貨物列車のリアルタイム故障検出は、鉄道輸送の安全と最適運転を保証する上で重要な役割を担っている。
深層学習に基づくアプローチの有望な結果にもかかわらず、貨物列車画像におけるこれらの断層検出器の性能は精度と効率の両立には程遠い。
本稿では,リソース要求の少ないリアルタイム動作をサポートしながら,検出精度を向上させるための統一光フレームワークを提案する。
論文 参考訳(メタデータ) (2021-01-31T05:10:20Z) - HR-Depth: High Resolution Self-Supervised Monocular Depth Estimation [14.81943833870932]
本稿では,2つの効果的な戦略を持つ改良DepthNet,HR-Depthを提案する。
resnet-18をエンコーダとして使用すると、hr-depthは、高解像度と低解像度の両方で最小パラマエターを持つ、以前の最先端(sota)メソッドをすべて上回る。
論文 参考訳(メタデータ) (2020-12-14T09:15:15Z) - EfficientHRNet: Efficient Scaling for Lightweight High-Resolution
Multi-Person Pose Estimation [2.924868086534434]
EfficientHRNetは、リソース制約のあるデバイス上でリアルタイムに動作可能な、軽量な多人数ポーズ推定装置のファミリーである。
最大のモデルは現在の最先端の4.4%の精度で、モデルのサイズは1/3、出力は1/6である。
最上位のリアルタイムアプローチと比較して、EfficientHRNetは22%の精度向上を実現し、1/3のパワーで同様のFPSを実現している。
論文 参考訳(メタデータ) (2020-07-16T03:27:26Z) - A Single Stream Network for Robust and Real-time RGB-D Salient Object
Detection [89.88222217065858]
我々は、深度マップを用いて、RGBと深度の間の早期融合と中核融合を誘導する単一ストリームネットワークを設計する。
このモデルは、現在の最も軽量なモデルよりも55.5%軽く、32 FPSのリアルタイム速度で384倍の384ドルの画像を処理している。
論文 参考訳(メタデータ) (2020-07-14T04:40:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。