論文の概要: SyncFix: Fixing 3D Reconstructions via Multi-View Synchronization
- arxiv url: http://arxiv.org/abs/2604.11797v2
- Date: Tue, 14 Apr 2026 21:52:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-16 13:09:57.450392
- Title: SyncFix: Fixing 3D Reconstructions via Multi-View Synchronization
- Title(参考訳): SyncFix:マルチビュー同期による3D再構成の修正
- Authors: Deming Li, Abhay Yadav, Cheng Peng, Rama Chellappa, Anand Bhattad,
- Abstract要約: SyncFixは、再構成されたシーンの拡散ベースの洗練の間、クロスビューの一貫性を強制するフレームワークである。
SyncFixは、高品質な再構築を一貫して生成し、現在の最先端のベースラインを超えていることを示す。
- 参考スコア(独自算出の注目度): 32.37731522327326
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present SyncFix, a framework that enforces cross-view consistency during the diffusion-based refinement of reconstructed scenes. SyncFix formulates refinement as a joint latent bridge matching problem, synchronizing distorted and clean representations across multiple views to fix the semantic and geometric inconsistencies. This means SyncFix learns a joint conditional over multiple views to enforce consistency throughout the denoising trajectory. Our training is done only on image pairs, but it generalizes naturally to an arbitrary number of views during inference. Moreover, reconstruction quality improves with additional views, with diminishing returns at higher view counts. Qualitative and quantitative results demonstrate that SyncFix consistently generates high-quality reconstructions and surpasses current state-of-the-art baselines, even in the absence of clean reference images. SyncFix achieves even higher fidelity when sparse references are available.
- Abstract(参考訳): 我々は、再構成シーンの拡散に基づくリファインメント中に、クロスビューの一貫性を強制するフレームワークSyncFixを提案する。
SyncFixは補間橋整合問題として洗練を定式化し、複数のビューで歪んだクリーンな表現を同期させ、意味的および幾何学的不整合を修正する。
これは、SyncFixが複数のビューでジョイント条件を学習し、デノイング軌跡全体にわたって一貫性を強制することを意味する。
私たちのトレーニングはイメージペアのみで行われるが、推論中に自然に任意の数のビューに一般化する。
さらに、リコンストラクションの品質は、ビューを増やすことで改善され、ビュー数が増えるとリターンが低下する。
定性的かつ定量的な結果は、SyncFixが常に高品質な再構成を生成し、クリーンな参照画像がなくても現在の最先端のベースラインを超えていることを示している。
SyncFixは、スパース参照が利用可能であれば、さらに忠実になる。
関連論文リスト
- LatentSync: Taming Audio-Conditioned Latent Diffusion Models for Lip Sync with SyncNet Supervision [13.447234794835921]
安定収束のために設計されたアーキテクチャを備えたStableSyncNetを紹介する。
提案手法は,HDTFおよびVoxCeleb2データセット上での様々な評価指標にまたがって,最先端のリップシンクアプローチを超越する。
論文 参考訳(メタデータ) (2024-12-12T13:20:52Z) - MV-DUSt3R+: Single-Stage Scene Reconstruction from Sparse Views In 2 Seconds [56.77548728485841]
本稿では,高速な単一ステージフィードフォワードネットワークMV-DUSt3Rを提案する。
コアとなるのはマルチビューデコーダブロックで、単一の参照ビューを考慮しながら、任意のビュー間で情報を交換する。
さらに,参照ビュー選択に頑健な手法として,参照ビュー選択の異なる情報を融合するために,参照ビューブロックを用いたMV-DUSt3R+を提案する。
論文 参考訳(メタデータ) (2024-12-09T20:34:55Z) - SyncNoise: Geometrically Consistent Noise Prediction for Text-based 3D Scene Editing [58.22339174221563]
高忠実度3Dシーン編集のための新しい幾何誘導型マルチビュー一貫したノイズ編集手法SyncNoiseを提案する。
SyncNoiseは2次元拡散モデルで複数のビューを同期的に編集し、幾何的に一貫した多視点ノイズ予測を行う。
本手法は,特に複雑なテクスチャを持つシーンにおいて,テキストの指示に配慮した高品質な3D編集結果を実現する。
論文 参考訳(メタデータ) (2024-06-25T09:17:35Z) - Consistent123: Improve Consistency for One Image to 3D Object Synthesis [74.1094516222327]
大規模な画像拡散モデルは、高品質で優れたゼロショット機能を備えた新規なビュー合成を可能にする。
これらのモデルは、ビュー一貫性の保証がなく、3D再構成や画像から3D生成といった下流タスクのパフォーマンスが制限される。
本稿では,新しい視点を同時に合成するConsistent123を提案する。
論文 参考訳(メタデータ) (2023-10-12T07:38:28Z) - RIGID: Recurrent GAN Inversion and Editing of Real Face Videos [73.97520691413006]
GANのインバージョンは、実画像に強力な編集可能性を適用するのに不可欠である。
既存のビデオフレームを個別に反転させる手法は、時間の経過とともに望ましくない一貫性のない結果をもたらすことが多い。
我々は、textbfRecurrent vtextbfIdeo textbfGAN textbfInversion and etextbfDiting (RIGID) という統合されたリカレントフレームワークを提案する。
本フレームワークは,入力フレーム間の固有コヒーレンスをエンドツーエンドで学習する。
論文 参考訳(メタデータ) (2023-08-11T12:17:24Z) - ReSync: Riemannian Subgradient-based Robust Rotation Synchronization [26.151024152071784]
この研究は、ロバスト同期問題を解決するための段階的なアルゴリズムであるReSyncを提示する。
その結果,適切な条件下でのReSyncの有効性が示された。
論文 参考訳(メタデータ) (2023-05-24T13:31:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。