論文の概要: Mind the Gap: Geometrically Accurate Generative Reconstruction from Disjoint Views
- arxiv url: http://arxiv.org/abs/2605.07550v1
- Date: Fri, 08 May 2026 10:24:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.991693
- Title: Mind the Gap: Geometrically Accurate Generative Reconstruction from Disjoint Views
- Title(参考訳): マインド・ザ・ギャップ(Mind the Gap) : 幾何学的に正確な生成的再構成
- Authors: Grzegorz Wilczynski, Mikołaj Zielinski, Bartosz Świrta, Dominik Belter, Przemysław Spurek,
- Abstract要約: 本稿では,新たなパラダイムとして,不随意視点からの生成的再構築を紹介する。
提案するGLADOSは,3段階にわたって動作する汎用モジュール型フレームワークである。
アーキテクチャに依存しないフレームワークとして、GLADOSは、生成、再構築、塗装における将来の進歩のシームレスな統合を可能にする。
- 参考スコア(独自算出の注目度): 0.8435195043404353
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: 3D vision systems are fundamentally constrained by their reliance on visual overlap: reconstruction methods require it for geometric alignment, while generative models use it to enforce multi-view consistency. This limitation is particularly acute in real-world scenarios such as distributed swarm robotics or crowd-sourced data collection, where capturing overlapping perspectives, both in terms of spatial and appearance overlap, is often impossible. We introduce Generative Reconstruction from Disjoint Views as a new paradigm, establish a comprehensive dataset, and propose specialized evaluation metrics for zero-overlap scenarios. Our benchmarking demonstrates that existing state-of-the-art methods fail catastrophically on this task, producing disconnected geometries or semantically incoherent reconstructions. To address these limitations, we propose GLADOS, a general, modular framework that operates through three stages: (1) Generative Bridging, where foundation models synthesize intermediate perspectives to connect disjoint inputs; (2) Robust Coarse 3D Reconstruction, that establish coarse geometric scaffold via global alignment which absorbs local contradictions from generative process; and (3) Iterative Context Expansion and Consistency Optimization to fill missing regions and unify the reconstruction. As an architectureagnostic framework, GLADOS enables seamless integration of future advances in generation, reconstruction, and inpainting. The source code is available at: https://github.com/gwilczynski95/GLADOS.
- Abstract(参考訳): 再現法は幾何的アライメントを必要とするが、生成モデルは多視点の一貫性を強制するためにそれを使用する。
この制限は、特に分散Swarm Roboticsやクラウドソースデータ収集のような現実のシナリオでは、空間的および外観的重複の観点から重なり合う視点を捉えることは、しばしば不可能である。
本稿では,解離ビューからの生成的再構成を新しいパラダイムとして導入し,包括的データセットを確立するとともに,ゼロオーバーラップシナリオに対する特別な評価指標を提案する。
我々のベンチマークは、既存の最先端の手法がこのタスクで破滅的に失敗し、不連結なジオメトリーや意味的に不整合な再構築が生じることを示した。
これらの制約に対処するため,(1)基礎モデルが中間視点を合成して接続する生成ブリジング,(2)粗い幾何学的足場を大域的アライメントで構築するロバスト粗い3次元再構成,(3)局所的な矛盾を生成過程から吸収する反復的コンテキスト拡張と一貫性の最適化,の3段階からなる汎用的なモジュラーフレームワークであるGLADOSを提案する。
アーキテクチャに依存しないフレームワークとして、GLADOSは、生成、再構築、塗装における将来の進歩のシームレスな統合を可能にする。
ソースコードは、https://github.com/gwilczynski95/GLADOSで入手できる。
関連論文リスト
- UniRecGen: Unifying Multi-View 3D Reconstruction and Generation [39.26563127393024]
フィードフォワードと拡散に基づく生成を統合する統合フレームワークUniRecGenを提案する。
我々は、推論中にシームレスな協調を可能にするとともに、安定したトレーニングを維持できる非絡み合い協調学習を採用している。
実験により、UniRecGenは、既存の手法よりも優れた忠実性と堅牢性を実現していることが示された。
論文 参考訳(メタデータ) (2026-04-01T23:35:40Z) - LG-HCC: Local Geometry-Aware Hierarchical Context Compression for 3D Gaussian Splatting [77.81227097905865]
アンカーベースの3DGS圧縮スキームは、いくつかの高度な文脈モデルを通してガウスの冗長性を減少させる。
本稿では, アンカープルーニングとエントロピー符号化にアンカー幾何学的相関を組み込んだ3DGSのための局所幾何学的階層型コンテキスト圧縮フレームワークを提案する。
実験の結果、LG-HCCは構造保存の問題を効果的に緩和し、Mip-NeRF360データセット上のScaffold-GSベースラインと比較して最大30.85倍のストレージを削減した。
論文 参考訳(メタデータ) (2026-03-30T13:39:35Z) - Scene Grounding In the Wild [27.597534811067348]
大規模な現実世界のシーンの正確な3Dモデルを、非構造的で、その中の画像から再構築することは、コンピュータビジョンにおける重要な課題である。
シーンの完全な参照モデルに各部分再構成を基礎とするフレームワークを提案する。
従来のパイプラインや学習ベースのパイプラインでは,我々のアプローチが一貫してグローバルアライメントを改善することを示す。
論文 参考訳(メタデータ) (2026-03-27T16:41:20Z) - RnG: A Unified Transformer for Complete 3D Modeling from Partial Observations [70.83499963694238]
RnG(Reconstruction and Generation)は、再構成と生成を統合する新しいフィードフォワードトランスである。
可視的幾何学を再構築し、可視的でコヒーレントな不明瞭な幾何学と外観を生成する。
提案手法は, 一般化可能な3次元再構成と新しいビュー生成の両方において, 最先端の性能を実現する。
論文 参考訳(メタデータ) (2026-03-01T17:25:32Z) - Joint Geometry-Appearance Human Reconstruction in a Unified Latent Space via Bridge Diffusion [57.09673862519791]
本稿では,幾何学と外観のモデリングを結合潜在表現に統一する新しいフレームワークである textbfJGA-LBD を紹介する。
実験により、JGA-LBDは、幾何学的忠実度と外観品質の両方の観点から、現在の最先端アプローチよりも優れていることが示された。
論文 参考訳(メタデータ) (2026-01-01T12:48:56Z) - ReconViaGen: Towards Accurate Multi-view 3D Object Reconstruction via Generation [28.308731720451053]
我々はReconViaGenを提案する。
我々のReconViaGenは、グローバルな構造と局所的な詳細の両方において、入力ビューと整合した完全かつ正確な3Dモデルを再構築できることを実証した。
論文 参考訳(メタデータ) (2025-10-27T13:15:06Z) - AlignGS: Aligning Geometry and Semantics for Robust Indoor Reconstruction from Sparse Views [18.361136390711415]
屋内シーンのセマンティックにリッチな3Dモデルへの需要は急速に増加しており、拡張現実、仮想現実、ロボット工学の応用によって推進されている。
既存の手法は、しばしば意味論を、既に形成され、潜在的に欠陥のある幾何学に描かれた受動的特徴として扱う。
本稿では、このビジョンを実現する新しいフレームワークであるAlignGSを紹介し、幾何学と意味論の相乗的でエンドツーエンドの最適化を開拓する。
論文 参考訳(メタデータ) (2025-10-09T06:30:20Z) - OracleGS: Grounding Generative Priors for Sparse-View Gaussian Splatting [78.70702961852119]
OracleGSは、Gaussian Splattingのスパースビューのために、生成的完全性と回帰的忠実性を調整している。
提案手法は,多視点幾何学的証拠に先立って強力な生成条件を定め,幻覚的アーティファクトをフィルタリングし,非拘束領域における可塑性完備を保存している。
論文 参考訳(メタデータ) (2025-09-27T11:19:32Z) - Single-view 3D Mesh Reconstruction for Seen and Unseen Categories [69.29406107513621]
シングルビュー3Dメッシュ再構成は、シングルビューRGB画像から3D形状を復元することを目的とした、基本的なコンピュータビジョンタスクである。
本稿では,一視点3Dメッシュ再構成に取り組み,未知のカテゴリのモデル一般化について検討する。
我々は、再構築におけるカテゴリ境界を断ち切るために、エンドツーエンドの2段階ネットワークであるGenMeshを提案する。
論文 参考訳(メタデータ) (2022-08-04T14:13:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。