論文の概要: Revisiting an Old Perspective Projection for Monocular 3D Morphable Models Regression
- arxiv url: http://arxiv.org/abs/2603.04958v1
- Date: Thu, 05 Mar 2026 08:52:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-06 22:06:11.152168
- Title: Revisiting an Old Perspective Projection for Monocular 3D Morphable Models Regression
- Title(参考訳): 単眼3次元形状モデル回帰に対する古い視点投影の再検討
- Authors: Toby Chong, Ryota Nakajima,
- Abstract要約: 本稿では,モノクル3次元モーフィブルモデル(3DMM)回帰法のための新しいカメラモデルを提案する。
クローズアップ顔画像でよく見られる視点歪み効果をとらえる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We introduce a novel camera model for monocular 3D Morphable Model (3DMM) regression methods that effectively captures the perspective distortion effect commonly seen in close-up facial images. Fitting 3D morphable models to video is a key technique in content creation. In particular, regression-based approaches have produced fast and accurate results by matching the rendered output of the morphable model to the target image. These methods typically achieve stable performance with orthographic projection, which eliminates the ambiguity between focal length and object distance. However, this simplification makes them unsuitable for close-up footage, such as that captured with head-mounted cameras. We extend orthographic projection with a new shrinkage parameter, incorporating a pseudo-perspective effect while preserving the stability of the original projection. We present several techniques that allow finetuning of existing models, and demonstrate the effectiveness of our modification through both quantitative and qualitative comparisons using a custom dataset recorded with head-mounted cameras.
- Abstract(参考訳): 顔画像のクローズアップによく見られる視点歪み効果を効果的に捉え, モノクル3次元モーフィブルモデル(3DMM)回帰法のための新しいカメラモデルを提案する。
3Dフォーマブルなモデルをビデオに合わせることは、コンテンツ制作の鍵となるテクニックだ。
特に、回帰に基づくアプローチは、形態素モデルのレンダリングされた出力と対象画像とをマッチングすることにより、高速で正確な結果を生み出している。
これらの手法は、典型的には、焦点距離と物体距離のあいまいさを排除し、ホログラム投影による安定した性能を実現する。
しかし、この単純化により、ヘッドマウントカメラで撮影したようなクローズアップ映像には適さない。
原投影の安定性を保ちつつ、疑似パースペクティブ効果を取り入れて、新たな縮小パラメータでホログラム投影を拡張した。
本稿では,既存のモデルを微調整し,頭部カメラで記録したカスタムデータセットを用いて定量的・質的な比較を行った。
関連論文リスト
- Long-Range depth estimation using learning based Hybrid Distortion Model for CCTV cameras [0.0]
本稿では,物体を長距離に局在させるのに適した歪みモデルをモデル化するための枠組みを提案する。
ニューラルネットワークは、非常に複雑な非線形レンズ歪み関数をモデル化するより良い代替となることはよく知られている。
このハイブリッドアプローチは、長距離ローカライゼーション性能を大幅に改善し、最大5kmの距離で物体の3次元位置を推定できる。
論文 参考訳(メタデータ) (2025-12-19T16:54:43Z) - GaVS: 3D-Grounded Video Stabilization via Temporally-Consistent Local Reconstruction and Rendering [54.489285024494855]
ビデオの安定化は、元のユーザの動きの意図を保ちながら、望ましくないシャキネスを除去するので、ビデオ処理に欠かせない。
既存のアプローチは、運用するドメインによって、ユーザエクスペリエンスを低下させるいくつかの問題に悩まされます。
ビデオの安定化を時間的に一貫性のある局所的再構成とレンダリングのパラダイムとして再構成する,新しい3Dグラウンドアプローチである textbfGaVS を紹介する。
論文 参考訳(メタデータ) (2025-06-30T15:24:27Z) - HORT: Monocular Hand-held Objects Reconstruction with Transformers [61.36376511119355]
モノクロ画像から手持ちの物体を3Dで再構成することは、コンピュータビジョンにおいて重要な課題である。
ハンドヘルドオブジェクトの高密度な3次元点群を効率的に再構成するトランスフォーマーモデルを提案する。
提案手法は,高速な推測速度で最先端の精度を達成し,画像の幅を最適化する。
論文 参考訳(メタデータ) (2025-03-27T09:45:09Z) - UniK3D: Universal Camera Monocular 3D Estimation [62.06785782635153]
カメラをモデル化可能なモノクル3D推定法として,UniK3Dを提案する。
本手法では, 球面3次元表現を導入し, カメラとシーンの形状をよりよく切り離すことができる。
13の多様なデータセットに対する包括的なゼロショット評価は、3D、ディープ、カメラメトリクスにわたるUniK3Dの最先端のパフォーマンスを示している。
論文 参考訳(メタデータ) (2025-03-20T17:49:23Z) - Boost 3D Reconstruction using Diffusion-based Monocular Camera Calibration [42.67358714902724]
DM-Calibは単一の入力画像からピンホールカメラ固有のパラメータを推定するための拡散に基づくアプローチである。
我々は、カメラ画像と呼ばれる新しい画像ベース表現を導入し、数値カメラの内在を無意味に符号化する。
一つのRGB入力からカメラ画像を生成するための安定拡散モデルを微調整することにより、RANSAC操作を介してカメラ固有の特徴を抽出することができる。
論文 参考訳(メタデータ) (2024-11-26T09:04:37Z) - Personalized 3D Human Pose and Shape Refinement [19.082329060985455]
回帰に基づく手法は3次元人間のポーズと形状推定の分野を支配してきた。
本稿では,初期人間のモデル推定値と対応する画像との密接な対応性を構築することを提案する。
提案手法は画像モデルアライメントの改善だけでなく,3次元精度の向上にも寄与する。
論文 参考訳(メタデータ) (2024-03-18T10:13:53Z) - Cameras as Rays: Pose Estimation via Ray Diffusion [54.098613859015856]
カメラのポーズを推定することは3D再構成の基本的な課題であり、まばらにサンプリングされたビューを考えると依然として困難である。
本稿では,カメラを光束として扱うカメラポーズの分散表現を提案する。
提案手法は回帰法と拡散法の両方で,CO3Dのカメラポーズ推定における最先端性能を示す。
論文 参考訳(メタデータ) (2024-02-22T18:59:56Z) - Neural Lens Modeling [50.57409162437732]
NeuroLens(ニューロレンス)は、点投影と光線鋳造に使用できる歪みと磁化のための神経レンズモデルである。
古典的なキャリブレーションターゲットを使用してプリキャプチャのキャリブレーションを行うことができ、後に3D再構成の際にキャリブレーションやリファインメントを行うために使用できる。
このモデルは、多くのレンズタイプにまたがって一般化されており、既存の3D再構成とレンダリングシステムとの統合は容易である。
論文 参考訳(メタデータ) (2023-04-10T20:09:17Z) - Wide-angle Image Rectification: A Survey [86.36118799330802]
広角画像は、基礎となるピンホールカメラモデルに反する歪みを含む。
これらの歪みを補正することを目的とした画像修正は、これらの問題を解決することができる。
本稿では、異なるアプローチで使用されるカメラモデルについて、詳細な説明と議論を行う。
次に,従来の幾何学に基づく画像修正手法と深層学習法の両方について検討する。
論文 参考訳(メタデータ) (2020-10-30T17:28:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。