論文の概要: Attention Mesh: High-fidelity Face Mesh Prediction in Real-time
- arxiv url: http://arxiv.org/abs/2006.10962v1
- Date: Fri, 19 Jun 2020 05:07:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-19 04:51:01.788414
- Title: Attention Mesh: High-fidelity Face Mesh Prediction in Real-time
- Title(参考訳): Attention Mesh: リアルタイムの高忠実な顔メッシュ予測
- Authors: Ivan Grishchenko, Artsiom Ablavatski, Yury Kartynnik, Karthik
Raveendran, Matthias Grundmann
- Abstract要約: 本稿では3次元顔メッシュ予測のための軽量アーキテクチャであるAttention Meshについて紹介する。
私たちのソリューションは、目と唇の領域の高度に正確なランドマークに依存する、ARメイクやアイトラッキング、ARパペット作成などのアプリケーションを可能にします。
- 参考スコア(独自算出の注目度): 2.099922236065961
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present Attention Mesh, a lightweight architecture for 3D face mesh
prediction that uses attention to semantically meaningful regions. Our neural
network is designed for real-time on-device inference and runs at over 50 FPS
on a Pixel 2 phone. Our solution enables applications like AR makeup, eye
tracking and AR puppeteering that rely on highly accurate landmarks for eye and
lips regions. Our main contribution is a unified network architecture that
achieves the same accuracy on facial landmarks as a multi-stage cascaded
approach, while being 30 percent faster.
- Abstract(参考訳): 我々は,意味的に有意味な領域に注目した3次元顔メッシュ予測のための軽量アーキテクチャである attention mesh を提案する。
当社のニューラルネットワークは、デバイス上のリアルタイム推論用に設計されており、Pixel 2で50FPS以上で動作する。
私たちのソリューションでは、目と唇の領域の高精度なランドマークに依存するarメイク、アイトラッキング、arpuppeteeringなどのアプリケーションを可能にしています。
私たちの主な貢献は、顔のランドマークを多段階のカスケードアプローチと同じ精度で達成し、30%高速な統合ネットワークアーキテクチャです。
関連論文リスト
- Infinite 3D Landmarks: Improving Continuous 2D Facial Landmark Detection [9.633565294243173]
具体的なアーキテクチャ変更の組み合わせによって,その正確性と時間的安定性が向上することを示す。
ランドマーク検出器とともにトレーニングされた空間変圧器ネットワークの使用を教師なしで解析する。
ランドマーク予測器の出力ヘッドを変更して標準3次元空間のランドマークを推定することにより、精度をさらに向上できることを示す。
論文 参考訳(メタデータ) (2024-05-30T14:54:26Z) - SqueezerFaceNet: Reducing a Small Face Recognition CNN Even More Via
Filter Pruning [55.84746218227712]
我々は,100万パラメータ未満の軽量顔認識ネットワークであるSqueezerFaceNetを開発した。
性能を損なうことなく、さらに(最大40%)削減できることを示す。
論文 参考訳(メタデータ) (2023-07-20T08:38:50Z) - Neural Implicit Dense Semantic SLAM [83.04331351572277]
本稿では,屋内シーンのメモリ効率,高密度な3次元形状,セマンティックセマンティックセグメンテーションをオンラインで学習する新しいRGBD vSLAMアルゴリズムを提案する。
私たちのパイプラインは、従来の3Dビジョンベースのトラッキングとループクローズとニューラルフィールドベースのマッピングを組み合わせたものです。
提案アルゴリズムはシーン認識を大幅に向上させ,様々なロボット制御問題を支援する。
論文 参考訳(メタデータ) (2023-04-27T23:03:52Z) - MESH2IR: Neural Acoustic Impulse Response Generator for Complex 3D
Scenes [56.946057850725545]
メッシュを用いた屋内3次元シーンに対する音響インパルス応答(IR)を生成するメッシュベースニューラルネットワーク(MESH2IR)を提案する。
任意のトポロジ(2K-3M三角形)で入力三角メッシュを処理できる。
我々は,MESH2IRから予測される赤外線の音響測定値が,10%未満の誤差で地上の真実と一致していることを示す。
論文 参考訳(メタデータ) (2022-05-18T23:50:34Z) - 3D face reconstruction with dense landmarks [7.33116352373381]
目と歯を含む頭部全体をカバーし, いつもの10倍のランドマークを正確に予測する最初の方法を提案する。
これは完全なランドマークアノテーションを保証する合成トレーニングデータを使用して達成される。
単眼と多眼の両方のシナリオにおいて,顔の形状を正確に表現し,顔の形状情報をフレーム間で統合するための理想的な信号として,濃密なランドマークが有用であることを示す。
論文 参考訳(メタデータ) (2022-04-06T12:43:34Z) - N-Cloth: Predicting 3D Cloth Deformation with Mesh-Based Networks [69.94313958962165]
本稿では,3次元布の変形予測のためのメッシュに基づく新しい学習手法(N-Cloth)を提案する。
グラフ畳み込みを用いて、メッシュ空間の非線形性を低減するために、布とメッシュを潜在空間に変換する。
我々のアプローチは、SMPL人間、非SMPL人間、または剛体に対応する様々な物体で、最大100ドルの三角形とシーンを持つ複雑な布メッシュを扱うことができる。
論文 参考訳(メタデータ) (2021-12-13T03:13:11Z) - Topologically Consistent Multi-View Face Inference Using Volumetric
Sampling [25.001398662643986]
ToFuは、幾何推論フレームワークで、アイデンティティと式をまたいだトポロジ的に一貫したメッシュを生成することができる。
新たなプログレッシブメッシュ生成ネットワークは、顔のトポロジ的構造を特徴量に埋め込む。
これらの高品質な資産は、アバターの作成、アニメーション、物理的にベースとしたスキンレンダリングのためのプロダクションスタジオで容易に利用することができる。
論文 参考訳(メタデータ) (2021-10-06T17:55:08Z) - Multi-Exit Semantic Segmentation Networks [78.44441236864057]
本稿では,最先端セグメンテーションモデルをMESSネットワークに変換するフレームワークを提案する。
パラメトリド早期出口を用いた特別訓練されたCNNは、より簡単なサンプルの推測時に、その深さに沿って保存する。
接続されたセグメンテーションヘッドの数、配置、アーキテクチャとエグジットポリシーを併用して、デバイス機能とアプリケーション固有の要件に適応する。
論文 参考訳(メタデータ) (2021-06-07T11:37:03Z) - An Efficient Multitask Neural Network for Face Alignment, Head Pose
Estimation and Face Tracking [9.39854778804018]
効率的なマルチタスク顔アライメント、顔追跡、頭部ポーズ推定ネットワーク(ATPN)を提案します。
ATPNは従来の最先端手法に比べて性能が向上し、パラメータやFLOPSは少ない。
論文 参考訳(メタデータ) (2021-03-13T04:41:15Z) - Regional Attention with Architecture-Rebuilt 3D Network for RGB-D
Gesture Recognition [7.475025465262353]
ジェスチャー認識のためのアーキテクチャ再構築型3Dネットワーク(RAAR3DNet)を提案する。
我々は、ニューラルネットワークサーチ(NAS)を介して、ネットワークを介して自動的に再構築された構造に固定されたインセプションモジュールを置き換える。
これにより、ネットワークは異なるレイヤにおけるさまざまなレベルの特徴表現をより適応的にキャプチャできる。
論文 参考訳(メタデータ) (2021-02-10T09:36:00Z) - Real-Time High-Performance Semantic Image Segmentation of Urban Street
Scenes [98.65457534223539]
都市景観のロバストなセマンティックセマンティックセグメンテーションのためのリアルタイムDCNNに基づく高速DCNN手法を提案する。
提案手法は, 51.0 fps と 39.3 fps の推論速度で, 平均 73.6% と平均 68.0% (mIoU) の精度を実現する。
論文 参考訳(メタデータ) (2020-03-11T08:45:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。