論文の概要: Profile-Specific 3DMM Regression from a Single Lateral Face Image
- arxiv url: http://arxiv.org/abs/2605.01746v1
- Date: Sun, 03 May 2026 06:55:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.920775
- Title: Profile-Specific 3DMM Regression from a Single Lateral Face Image
- Title(参考訳): 1つの横顔画像からのプロファイル特異的3DMM回帰
- Authors: Taiki Kanaya, Hideo Saito,
- Abstract要約: シングルイメージの3D顔の再構成はコンピュータビジョンの中核的な問題であり、矯正学における頭蓋計測的ランドマーク分析などの重要な臨床応用がある。
伝統的に、この分析は側方X線イメージングに依存しているが、放射線の懸念により頻繁にX線を照射することは不可能である。
本稿では、このギャップを幾何学的条件付き合成データと、単一横方向画像のための単純なプロファイル固有のFLAME回帰ベースラインで埋める。
- 参考スコア(独自算出の注目度): 11.158058650531643
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Single-image 3D face reconstruction is a core problem in computer vision, with important clinical applications such as cephalometric landmark analysis in orthodontics. Traditionally, this analysis relies on lateral X-ray imaging; however, frequent X-ray exposure is impractical due to radiation concerns. While recent research has explored detecting landmarks from lateral RGB images as an alternative, existing methods typically rely on 2D features such as the eyes, mouth, ears, and boundary silhouettes, failing to fully exploit the underlying 3D facial geometry spanning the facial profile and jawline, which is essential for accurate diagnosis. Meanwhile, although 3D face reconstruction from frontal views has seen significant progress, most learning-based 3D morphable model (3DMM) regressors are developed and benchmarked on near-frontal images, where appearance cues are abundant. In extreme profile views (yaw $\approx 90^\circ$), much of the face is occluded, and the available signal is dominated by boundary cues, making accurate 3D reconstruction challenging. In this paper, we bridge this gap with geometry-conditioned synthetic data and a simple profile-specific FLAME regression baseline for single lateral images. We introduce ProfileSynth, a dataset created by sampling FLAME shape and pose parameters in extreme yaw ranges and generating photorealistic profile images using a diffusion model conditioned on depth and normal maps. We further study a profile-specific baseline with visibility-aware jawline regularization. Our framework provides a practical baseline for "profile $\times$ 3DMM" reconstruction and a promising foundation for more accurate, non-invasive cephalometric analysis from lateral RGB images.
- Abstract(参考訳): シングルイメージの3D顔の再構成はコンピュータビジョンの中核的な問題であり、矯正学における頭蓋計測的ランドマーク分析などの重要な臨床応用がある。
伝統的に、この分析は側方X線イメージングに依存しているが、放射線の懸念により頻繁にX線を照射することは不可能である。
近年の研究では、横方向のRGB画像からランドマークを検出する方法が研究されているが、既存の手法は目、口、耳、境界シルエットなどの2D特徴に依存しており、顔の形状や顎骨の3D形状を完全に活用することができない。
一方、正面からの3次元顔再構成は大きな進歩を遂げているが、ほとんどの学習ベース3次元形態素モデル(3DMM)は、外観的手がかりが豊富である近前面画像上で開発・ベンチマークされている。
極端なプロファイルビュー (yaw $\approx 90^\circ$) では、顔の多くは隠蔽されており、利用可能な信号は境界の手がかりによって支配され、正確な3D再構成は困難である。
本稿では、このギャップを幾何学的条件付き合成データと、単一横方向画像のための単純なプロファイル固有のFLAME回帰ベースラインで埋める。
本研究では、FLAME形状をサンプリングし、パラメータを極端にヨーレンジでポーズさせ、奥行きと正規地図に条件付き拡散モデルを用いてフォトリアリスティックなプロファイル画像を生成するデータセットであるProfileSynthを紹介する。
さらに、視認性に配慮した顎関節正則化を伴うプロファイル特異的ベースラインについて検討した。
我々のフレームワークは「$\times$3DMM」再構築のための実用的なベースラインを提供し、側面RGB画像からのより正確で非侵襲的な脳波分析のための有望な基盤を提供する。
関連論文リスト
- Dental3R: Geometry-Aware Pairing for Intraoral 3D Reconstruction from Sparse-View Photographs [10.70146635420186]
疎口内画像から高忠実度で頑健な再構成を行うためのポーズフリーグラフ誘導パイプラインである textbfDental3R を提案する。
提案手法はまずGAPS(Geometry-Aware Pairing Strategy)を構築し,高値画像ペアのコンパクト部分グラフをインテリジェントに選択する。
離散ウェーブレット変換を用いて帯域制限忠実度を強制することにより,高周波アーティファクトを抑えながら微細なエナメル質境界と近位縁を保存できる。
論文 参考訳(メタデータ) (2025-11-18T10:20:22Z) - A Perceptual Shape Loss for Monocular 3D Face Reconstruction [13.527078921914985]
本研究では,3次元顔再構成の質を人間がどう認識するかに着想を得た,単眼顔撮影のための新しい損失関数を提案する。
我々の損失は、入力顔画像と幾何推定のシェードレンダリングを採る判別器型ニューラルネットワークとして実装されている。
我々は、新しい知覚的形状損失が、単眼の3次元顔最適化とディープニューラルネットワーク回帰の伝統的なエネルギー用語とどのように組み合わせられるかを示す。
論文 参考訳(メタデータ) (2023-10-30T14:39:11Z) - Oral-3Dv2: 3D Oral Reconstruction from Panoramic X-Ray Imaging with
Implicit Neural Representation [3.8215162658168524]
Oral-3Dv2は、単一のパノラマX線画像から3Dラジオロジーを再構成する非逆学習モデルである。
本モデルは,2次元座標を3次元空間内のボクセルの密度値にマッピングすることにより,暗黙的に3次元口腔構造を表現することを学習する。
我々の知る限りでは、これは1枚のパノラマX線画像から3Dラジオグラフィ再構成における非逆学習モデルの最初の作品である。
論文 参考訳(メタデータ) (2023-03-21T18:17:27Z) - SIRA: Relightable Avatars from a Single Image [19.69326772087838]
SIRAは人間の頭部アバターを高忠実度な形状と分解光と表面材料で再構成する手法である。
我々の重要な要素は、単視点3次元表面再構成と外観分解のあいまいさを解消するニューラルネットワークに基づく2つのデータ駆動統計モデルである。
論文 参考訳(メタデータ) (2022-09-07T09:47:46Z) - Beyond 3DMM: Learning to Capture High-fidelity 3D Face Shape [77.95154911528365]
3Dモーフィブルモデル(3DMM)の適合性は、その強力な3D先行性のため、顔解析に広く有用である。
以前に再建された3次元顔は、微細な形状が失われるため、視差の低下に悩まされていた。
本論文は, パーソナライズされた形状が対応する人物と同一に見えるよう, パーソナライズされた形状を捉えるための完全な解を提案する。
論文 参考訳(メタデータ) (2022-04-09T03:46:18Z) - Facial Geometric Detail Recovery via Implicit Representation [147.07961322377685]
そこで本研究では,一眼の顔画像のみを用いて,テクスチャガイドを用いた幾何的細部復元手法を提案する。
提案手法は,高品質なテクスチャ補完と暗黙の面の強力な表現性を組み合わせたものである。
本手法は, 顔の正確な細部を復元するだけでなく, 正常部, アルベド部, シェーディング部を自己監督的に分解する。
論文 参考訳(メタデータ) (2022-03-18T01:42:59Z) - AvatarMe++: Facial Shape and BRDF Inference with Photorealistic
Rendering-Aware GANs [119.23922747230193]
そこで本研究では,レンダリング可能な3次元顔形状とBRDFの再構成を,単一の"in-the-wild"画像から実現した最初の手法を提案する。
本手法は,1枚の低解像度画像から,高解像度の3次元顔の再構成を行う。
論文 参考訳(メタデータ) (2021-12-11T11:36:30Z) - SIDER: Single-Image Neural Optimization for Facial Geometric Detail
Recovery [54.64663713249079]
SIDERは、教師なしの方法で単一の画像から詳細な顔形状を復元する新しい光度最適化手法である。
以前の作業とは対照的に、SIDERはデータセットの事前に依存せず、複数のビュー、照明変更、地上の真実の3D形状から追加の監視を必要としない。
論文 参考訳(メタデータ) (2021-08-11T22:34:53Z) - Fast-GANFIT: Generative Adversarial Network for High Fidelity 3D Face
Reconstruction [76.1612334630256]
我々は、GAN(Generative Adversarial Networks)とDCNN(Deep Convolutional Neural Networks)の力を利用して、単一画像から顔のテクスチャと形状を再構築する。
3次元顔再構成を保存したフォトリアリスティックでアイデンティティに優れた結果を示し, 初めて, 高精度な顔テクスチャ再構成を実現する。
論文 参考訳(メタデータ) (2021-05-16T16:35:44Z) - OSTeC: One-Shot Texture Completion [86.23018402732748]
ワンショット3D顔テクスチャ補完のための教師なしアプローチを提案する。
提案手法では,2次元フェースジェネレータで回転画像を再構成することにより,入力画像を3次元で回転させ,見えない領域を埋め込む。
完成したテクスチャーをジェネレーターに投影することで、ターゲットイメージを先取りします。
論文 参考訳(メタデータ) (2020-12-30T23:53:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。