論文の概要: GeoFusionLRM: Geometry-Aware Self-Correction for Consistent 3D Reconstruction
- arxiv url: http://arxiv.org/abs/2602.14119v1
- Date: Sun, 15 Feb 2026 12:39:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-17 14:17:28.662352
- Title: GeoFusionLRM: Geometry-Aware Self-Correction for Consistent 3D Reconstruction
- Title(参考訳): GeoFusionLRM : 連続3次元再構成のための幾何学的自己補正
- Authors: Ahmet Burak Yildirim, Tuna Saygin, Duygu Ceylan, Aysegul Dundar,
- Abstract要約: 大規模な再構成モデル(LRM)を用いた単一画像の3D再構成は急速に進んでいるが、幾何的不整合がしばしば現れ、忠実さを制限している。
構造精度を向上させるために,モデル自身の正規および深度予測を利用する幾何学的自己補正フレームワークであるGeoFusionLRMを紹介する。
- 参考スコア(独自算出の注目度): 27.169882738788257
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Single-image 3D reconstruction with large reconstruction models (LRMs) has advanced rapidly, yet reconstructions often exhibit geometric inconsistencies and misaligned details that limit fidelity. We introduce GeoFusionLRM, a geometry-aware self-correction framework that leverages the model's own normal and depth predictions to refine structural accuracy. Unlike prior approaches that rely solely on features extracted from the input image, GeoFusionLRM feeds back geometric cues through a dedicated transformer and fusion module, enabling the model to correct errors and enforce consistency with the conditioning image. This design improves the alignment between the reconstructed mesh and the input views without additional supervision or external signals. Extensive experiments demonstrate that GeoFusionLRM achieves sharper geometry, more consistent normals, and higher fidelity than state-of-the-art LRM baselines.
- Abstract(参考訳): 大規模な再構成モデル(LRM)を用いた単一画像の3D再構成は急速に進んでいるが、幾何的不整合や不整合性に制約のある細部がしばしば現れる。
構造精度を向上させるために,モデル自身の正規および深度予測を利用する幾何学的自己補正フレームワークであるGeoFusionLRMを紹介する。
入力画像から抽出された特徴のみに依存する従来のアプローチとは異なり、GeoFusionLRMは専用のトランスフォーマーと融合モジュールを通じて幾何学的キューをフィードバックし、モデルがエラーを修正し、条件付き画像との整合性を強制することを可能にする。
この設計は、再構築されたメッシュと入力ビューのアライメントを、追加の監視や外部信号なしで改善する。
大規模な実験により、GeoFusionLRMは最先端のLRMベースラインよりもシャープな幾何学、より一貫した正規化、忠実性を達成することが示されている。
関連論文リスト
- KaoLRM: Repurposing Pre-trained Large Reconstruction Models for Parametric 3D Face Reconstruction [51.67605823241639]
KaoLRMは、一視点画像からパラメトリックな3次元顔再構成を行うために、Large Restruction Model (LRM)の学習前を再度ターゲットする。
制御されたベンチマークと内部ベンチマークの両方の実験により、KaoLRMはより優れた再構成精度とクロスビュー整合性を実現することが示された。
論文 参考訳(メタデータ) (2026-01-19T05:36:59Z) - Joint Geometry-Appearance Human Reconstruction in a Unified Latent Space via Bridge Diffusion [57.09673862519791]
本稿では,幾何学と外観のモデリングを結合潜在表現に統一する新しいフレームワークである textbfJGA-LBD を紹介する。
実験により、JGA-LBDは、幾何学的忠実度と外観品質の両方の観点から、現在の最先端アプローチよりも優れていることが示された。
論文 参考訳(メタデータ) (2026-01-01T12:48:56Z) - GACO-CAD: Geometry-Augmented and Conciseness-Optimized CAD Model Generation from Single Image [11.612167656421079]
マルチモーダル大言語モデル(MLLM)は2次元画像から3次元幾何学を正確に推定するのに依然として苦労している。
本稿では,新しい2段階後学習フレームワークGACO-CADを紹介する。
DeepCADとFusion360データセットの実験は、GACO-CADが最先端のパフォーマンスを達成することを示している。
論文 参考訳(メタデータ) (2025-10-20T04:57:20Z) - A 3DGS-Diffusion Self-Supervised Framework for Normal Estimation from a Single Image [5.588610465556571]
空間次元情報の欠如は、単一画像からの正規推定において依然として課題である。
近年の拡散法は2次元から3次元の暗黙マッピングにおいて有意なポテンシャルを示した。
本稿では,SINGADを提案する。SINGADは,単一画像から正規推定のための新しい自己教師型フレームワークである。
論文 参考訳(メタデータ) (2025-08-08T02:32:33Z) - GeoAda: Efficiently Finetune Geometric Diffusion Models with Equivariant Adapters [61.51810815162003]
制御された生成タスクに対してフレキシブルかつパラメータ効率の良い微調整を可能にするSE(3)-equivariant Adapter framework(GeoAda)を提案する。
GeoAdaは、過剰適合と破滅的な忘れを緩和しながら、モデルの幾何的一貫性を保っている。
我々は、フレーム制御、グローバル制御、サブグラフ制御、広範囲のアプリケーションドメインを含む多様な幾何学的制御タイプにまたがるGeoAdaの適用性を実証する。
論文 参考訳(メタデータ) (2025-07-02T18:44:03Z) - Evolving High-Quality Rendering and Reconstruction in a Unified Framework with Contribution-Adaptive Regularization [27.509109317973817]
3D Gaussian Splatting (3DGS)は、高品質なレンダリングと高速な推論速度で注目されている。
従来の手法は主に幾何学的正則化に焦点を当てており、プリミティブベースのフレームワークやデュアルモデルフレームワークを含む一般的なアプローチがある。
本稿では,高画質表面再構成を実現するために,適応正規化を利用した統一モデルであるCarGSを提案する。
論文 参考訳(メタデータ) (2025-03-02T12:51:38Z) - GeoLRM: Geometry-Aware Large Reconstruction Model for High-Quality 3D Gaussian Generation [65.33726478659304]
GeoLRM(Geometry-Aware Large Restruction Model)は、512kガウスと21の入力画像で11GBのGPUメモリで高品質な資産を予測できる手法である。
従来の作品では、3D構造の本質的な空間性は無視されており、3D画像と2D画像の間の明示的な幾何学的関係は利用されていない。
GeoLRMは、3Dポイントを直接処理し、変形可能なクロスアテンション機構を使用する新しい3D対応トランスフォーマー構造を導入することで、これらの問題に対処する。
論文 参考訳(メタデータ) (2024-06-21T17:49:31Z) - GeoWizard: Unleashing the Diffusion Priors for 3D Geometry Estimation from a Single Image [94.56927147492738]
単一画像から幾何学的属性を推定するための新しい生成基盤モデルであるGeoWizardを紹介する。
拡散前処理の活用は,資源利用における一般化,詳細な保存,効率性を著しく向上させることが示唆された。
本稿では,様々なシーンの複雑なデータ分布を,個別のサブディストリビューションに分離する,シンプルかつ効果的な戦略を提案する。
論文 参考訳(メタデータ) (2024-03-18T17:50:41Z) - CRM: Single Image to 3D Textured Mesh with Convolutional Reconstruction
Model [37.75256020559125]
本稿では,高忠実度フィードフォワード画像から3次元画像生成モデルを提案する。
ネットワーク設計に幾何学的事前情報を統合する必要性を強調した。
我々のモデルは、テストタイムの最適化なしに、画像から10秒で高忠実なテクスチャメッシュを提供する。
論文 参考訳(メタデータ) (2024-03-08T04:25:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。