論文の概要: FlowObject: Flow Steering for Bridging Generative Priors and Reconstruction Fidelity
- arxiv url: http://arxiv.org/abs/2606.19019v1
- Date: Wed, 17 Jun 2026 12:42:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 17:16:51.163719
- Title: FlowObject: Flow Steering for Bridging Generative Priors and Reconstruction Fidelity
- Title(参考訳): FlowObject: ブリッジ生成前のフローステアリングとリコンストラクションの忠実度
- Authors: Yuchen Rao, Xuqian Ren, Yinyu Nie, Sayan Deb Sarkar, Biao Zhang, Vincent Lepetit, Friedrich Fraundorfer,
- Abstract要約: FlowObjectは、スパースビューの3D再構成をトレーニング不要でガイド付き逆問題として再構成するフレームワークである。
提案手法は、幾何学的完全性およびビュー依存外観忠実度の両方において、最先端の生成モデルと最適化に基づくフレームワークを著しく上回る。
- 参考スコア(独自算出の注目度): 34.142288038459704
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recovering complete 3D representations of objects from few casual image captures remains a significant challenge. Recent 3D generative models, particularly those based on Flow-Matching (FM), can synthesize high-quality textured assets; however, they often suffer from ''synthetic bias'' where learned priors override observational evidence, alongside a lack of alignment with the observed instance. Conversely, optimization-based methods like 3D Gaussian Splatting (3DGS) provide high fidelity on visible surfaces but fail to reason about unobserved geometry. In this paper, we present FlowObject, a framework that reformulates sparse-view 3D reconstruction as a training-free, guided inverse problem. Our approach applies a dual-space guidance strategy to steer the Ordinary Differential Equation (ODE) trajectory of a flow-matching model, enabling the completion of unseen regions through learned generative priors while enforcing strict consistency with real-world observations. By integrating a 3DGS refinement stage, FlowObject further bridges the gap between ''synthetic-looking'' generative outputs and photorealistic reconstructions. Comprehensive benchmarks on synthetic and real-world datasets demonstrate that current state-of-the-art methods often struggle to achieve geometric completeness and observational consistency simultaneously, especially under severe occlusions. In contrast, our method significantly outperforms state-of-the-art generative models and optimization-based frameworks in both geometric completeness and view-dependent appearance fidelity.
- Abstract(参考訳): カジュアルなイメージキャプチャから、オブジェクトの完全な3D表現を復元することは、依然として大きな課題である。
最近の3次元生成モデル、特にフローマッチング(FM)に基づくモデルでは、高品質なテクスチャ化された資産を合成することができるが、これらのモデルはしばしば「合成バイアス」に悩まされる。
逆に、3D Gaussian Splatting (3DGS) のような最適化に基づく手法は、可視面に高い忠実度を与えるが、観測されていない幾何学の推論に失敗する。
本稿では,スパースビュー3次元再構成をトレーニング不要でガイド付き逆問題として再構成するフレームワークであるFlowObjectを提案する。
提案手法は,フローマッチングモデルの正規微分方程式(ODE)軌道を制御し,実世界の観測と厳密な整合性を保ちながら,学習した生成前を通した未確認領域の完成を可能にする。
3DGSの改良段階を統合することで、FlowObjectはさらに'合成的な'生成出力とフォトリアリスティックな再構築のギャップを埋める。
合成および実世界のデータセットに関する総合的なベンチマークでは、現在の最先端の手法は、特に厳密な閉塞の下で、幾何学的完全性と観測的一貫性を同時に達成するのに苦労することが多いことが示されている。
対照的に、我々の手法は、幾何学的完全性とビュー依存の外観忠実性の両方において、最先端の生成モデルと最適化に基づくフレームワークを著しく上回っている。
関連論文リスト
- GeoRect4D: Geometry-Compatible Generative Rectification for Dynamic Sparse-View 3D Reconstruction [16.448484686109992]
マルチビュービデオからダイナミックな3Dシーンを再構築することは、しばしば幾何学的な崩壊、軌道のドリフト、浮き彫りのアーティファクトに繋がる、非常に不適切である。
最近の試みでは、欠落したコンテンツに幻覚を与える遺伝子前駆体を導入しているが、ナイーブな統合はしばしば構造的ドリフトと時間的不整合を引き起こす。
そこで本稿では, 疎視動的再構成のための新しい統合フレームワークであるGeoRect4Dを提案する。
論文 参考訳(メタデータ) (2026-04-22T17:12:02Z) - Attention-Guided Flow-Matching for Sparse 3D Geological Generation [7.734651455015875]
3D-GeoFlowは、スパースマルチモーダルな地質モデリングに適した最初のアテンションガイド型連続フローマッチングフレームワークである。
離散カテゴリー生成をシミュレーションのない連続ベクトル場回帰として再構成することにより、安定な決定論的最適輸送経路を確立する。
この枠組みを検証するため,2200件の手続き的に生成された3次元地質事例からなる大規模マルチモーダルデータセットをキュレートした。
論文 参考訳(メタデータ) (2026-04-07T07:02:53Z) - Robust Mesh Saliency GT Acquisition in VR via View Cone Sampling and Geometric Smoothing [59.12032628787018]
バーチャルリアリティー(VR)における人中心視覚モデリングには3次元メッシュサリエンシ基底真理が不可欠である
現在のVRアイトラッキングパイプラインは、単一線サンプリングとユークリッドのスムース化に依存しており、テクスチャの注意を喚起し、ギャップをまたいだ信号の漏洩を引き起こす。
本稿では,これらの制約に対処する頑健な枠組みを提案する。
論文 参考訳(メタデータ) (2026-01-06T05:20:12Z) - OracleGS: Grounding Generative Priors for Sparse-View Gaussian Splatting [78.70702961852119]
OracleGSは、Gaussian Splattingのスパースビューのために、生成的完全性と回帰的忠実性を調整している。
提案手法は,多視点幾何学的証拠に先立って強力な生成条件を定め,幻覚的アーティファクトをフィルタリングし,非拘束領域における可塑性完備を保存している。
論文 参考訳(メタデータ) (2025-09-27T11:19:32Z) - Diffusion-Guided Gaussian Splatting for Large-Scale Unconstrained 3D Reconstruction and Novel View Synthesis [22.767866875051013]
本稿では,現行手法の限界に対処する多視点拡散モデルを用いて,新しい3DGSフレームワークであるGS-Diffを提案する。
マルチビュー入力に条件付き擬似観測を生成することにより、制約の少ない3次元再構成問題をよく表されたものに変換する。
4つのベンチマークの実験では、GS-Diffは最先端のベースラインをかなりのマージンで一貫して上回っている。
論文 参考訳(メタデータ) (2025-04-02T17:59:46Z) - MonoGSDF: Exploring Monocular Geometric Cues for Gaussian Splatting-Guided Implicit Surface Reconstruction [86.87464903285208]
高品質な再構成のための神経信号距離場(SDF)とプリミティブを結合する新しい手法であるMonoGSDFを紹介する。
任意のスケールのシーンを扱うために,ロバストな一般化のためのスケーリング戦略を提案する。
実世界のデータセットの実験は、効率を保ちながら、以前の方法よりも優れています。
論文 参考訳(メタデータ) (2024-11-25T20:07:07Z) - Secrets of 3D Implicit Object Shape Reconstruction in the Wild [92.5554695397653]
コンピュータビジョン、ロボティクス、グラフィックスの様々な用途において、高精細な3Dオブジェクトをスパースから再構築することは重要です。
最近の神経暗黙的モデリング法は、合成データセットまたは高密度データセットで有望な結果を示す。
しかし、粗末でノイズの多い実世界のデータではパフォーマンスが悪い。
本論文では, 一般的な神経暗黙モデルの性能低下の根本原因を解析する。
論文 参考訳(メタデータ) (2021-01-18T03:24:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。