論文の概要: A Human Ear Reconstruction Autoencoder
- arxiv url: http://arxiv.org/abs/2010.03972v1
- Date: Wed, 7 Oct 2020 12:52:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-09 22:38:00.856940
- Title: A Human Ear Reconstruction Autoencoder
- Title(参考訳): ヒト耳再建オートエンコーダ
- Authors: Hao Sun, Nick Pears and Hang Dai
- Abstract要約: 本研究の目的は、より微妙で難解な曲線と特徴が2次元の耳入力画像に現れる3次元耳再構成作業に取り組むことである。
我々のHuman Ear Reconstruction Autoencoder(HERA)システムは、これらのパラメータを監督することなく、3次元耳メッシュの3次元耳ポーズと形状パラメータを予測する。
構築したエンド・ツー・エンドの自己監督モデルについて,2次元ランドマークの定位性能と再構成された3次元耳の外観の両方で評価する。
- 参考スコア(独自算出の注目度): 19.72707659069644
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The ear, as an important part of the human head, has received much less
attention compared to the human face in the area of computer vision. Inspired
by previous work on monocular 3D face reconstruction using an autoencoder
structure to achieve self-supervised learning, we aim to utilise such a
framework to tackle the 3D ear reconstruction task, where more subtle and
difficult curves and features are present on the 2D ear input images. Our Human
Ear Reconstruction Autoencoder (HERA) system predicts 3D ear poses and shape
parameters for 3D ear meshes, without any supervision to these parameters. To
make our approach cover the variance for in-the-wild images, even grayscale
images, we propose an in-the-wild ear colour model. The constructed end-to-end
self-supervised model is then evaluated both with 2D landmark localisation
performance and the appearance of the reconstructed 3D ears.
- Abstract(参考訳): 人間の頭部の重要な部分である耳は、コンピュータビジョンの領域における人間の顔に比べて、はるかに少ない注意を払っている。
自己教師付き学習を実現するためのオートエンコーダ構造を用いた単眼的3d顔再構成に関するこれまでの研究に触発されて,2d耳入力画像にさらに微妙で難解な曲線や特徴が存在する3d耳再構築課題に取り組むための枠組みを活用しようとする。
我々のHuman Ear Reconstruction Autoencoder(HERA)システムは、これらのパラメータを監督することなく、3次元耳メッシュの3次元耳ポーズと形状パラメータを予測する。
そこで本研究では,線内画像,グレースケール画像のばらつきを補うために,線内耳色モデルを提案する。
構築されたエンド・ツー・エンドの自己監督モデルは、2次元ランドマークのローカライズ性能と再構成された3d耳の外観の両方で評価される。
関連論文リスト
- Head Pose Estimation and 3D Neural Surface Reconstruction via Monocular Camera in situ for Navigation and Safe Insertion into Natural Openings [4.592222359553848]
我々は、ベースプラットフォームとして3Dスライダを選択し、センサーとしてモノクルカメラを使用しました。
神経放射場(NeRF)アルゴリズムを用いて頭部の3次元モデル再構成を行った。
個々の頭部ポーズは、シングルカメラビジョンによって取得され、リアルタイムで3Dスライダ内で生成されたシーンに送信される。
論文 参考訳(メタデータ) (2024-06-18T20:42:09Z) - Talk3D: High-Fidelity Talking Portrait Synthesis via Personalized 3D Generative Prior [29.120669908374424]
本研究では,Talk3Dと呼ばれる新しい音声駆動音声ヘッド合成フレームワークを提案する。
予め訓練された3D認識生成前を効果的に活用することにより、そのもっともらしい顔のジオメトリを忠実に再構築することができる。
提案手法は,既存の手法と比較して,極端な頭部ポーズ下であっても,現実的な顔のジオメトリーの生成に優れる。
論文 参考訳(メタデータ) (2024-03-29T12:49:40Z) - HeadArtist: Text-conditioned 3D Head Generation with Self Score Distillation [95.58892028614444]
本研究は,テキスト記述から3次元ヘッド生成のためのHeadArtistを提案する。
従来の蒸留の監督の下でパラメータ化された3次元ヘッドモデルを最適化する効率的なパイプラインを考案した。
実験結果から,本手法は適切な形状とフォトリアリスティックな外観を持つ高品質な3次元頭部彫刻を実現することが示唆された。
論文 参考訳(メタデータ) (2023-12-12T18:59:25Z) - MinD-3D: Reconstruct High-quality 3D objects in Human Brain [50.534007259536715]
Recon3DMindは、fMRI(Functional Magnetic Resonance Imaging)信号から3次元視覚を再構成するための革新的なタスクである。
このデータセットは14人の参加者のデータを含み、3Dオブジェクトの360度ビデオが特徴である。
我々は,脳の3次元視覚情報をfMRI信号から復号化するための,新規で効果的な3段階フレームワークMinD-3Dを提案する。
論文 参考訳(メタデータ) (2023-12-12T18:21:36Z) - PanoHead: Geometry-Aware 3D Full-Head Synthesis in 360$^{\circ}$ [17.355141949293852]
3次元頭部合成のための既存の3次元生成対向ネットワーク(GAN)は、正面近傍のビューに限られるか、大きなビュー角で3次元の一貫性を維持するのが困難である。
パノヘッド(PanoHead)は、360ドル(約3万3000円)で高画質のフルヘッド画像合成を可能にする最初の3D認識生成モデルである。
論文 参考訳(メタデータ) (2023-03-23T06:54:34Z) - AudioEar: Single-View Ear Reconstruction for Personalized Spatial Audio [44.460995595847606]
単一視点画像を用いて3次元人間の耳を再構成し,パーソナライズされた空間音声を実現することを提案する。
視覚と音響のギャップを埋めるために,再建された耳メッシュと市販の3D人体を一体化するためのパイプラインを開発した。
論文 参考訳(メタデータ) (2023-01-30T02:15:50Z) - DRaCoN -- Differentiable Rasterization Conditioned Neural Radiance
Fields for Articulated Avatars [92.37436369781692]
フルボディの体積アバターを学習するためのフレームワークであるDRaCoNを提案する。
2Dと3Dのニューラルレンダリング技術の利点を利用する。
挑戦的なZJU-MoCapとHuman3.6Mデータセットの実験は、DRaCoNが最先端の手法より優れていることを示している。
論文 参考訳(メタデータ) (2022-03-29T17:59:15Z) - StereoPIFu: Depth Aware Clothed Human Digitization via Stereo Vision [54.920605385622274]
本研究では,立体視の幾何学的制約をPIFuの暗黙的関数表現と統合し,人間の3次元形状を復元するStereoPIFuを提案する。
従来の作品と比較すると, ステレオピフは衣服によるヒト再建のロバスト性, 完全性, 正確性が著しく向上した。
論文 参考訳(メタデータ) (2021-04-12T08:41:54Z) - Model-based 3D Hand Reconstruction via Self-Supervised Learning [72.0817813032385]
シングルビューのRGB画像から3Dハンドを再構成することは、様々な手構成と深さのあいまいさのために困難である。
ポーズ, 形状, テクスチャ, カメラ視点を共同で推定できる, 自己教師型3Dハンド再構成ネットワークであるS2HANDを提案する。
初めて手動アノテーションを使わずに、正確な3D手の再構築ネットワークを訓練できることを実証しました。
論文 参考訳(メタデータ) (2021-03-22T10:12:43Z) - Neural Descent for Visual 3D Human Pose and Shape [67.01050349629053]
入力RGB画像から3次元のポーズと形状を復元するディープニューラルネットワーク手法を提案する。
我々は最近導入された表現力のあるボディ統計モデルGHUMに頼っている。
我々の方法論の中心は、HUmanNeural Descent (HUND)と呼ばれるアプローチの学習と最適化である。
論文 参考訳(メタデータ) (2020-08-16T13:38:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。