論文の概要: Long-Term Multi-Session 3D Reconstruction Under Substantial Appearance Change
- arxiv url: http://arxiv.org/abs/2602.20584v1
- Date: Tue, 24 Feb 2026 06:12:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-25 17:34:53.627581
- Title: Long-Term Multi-Session 3D Reconstruction Under Substantial Appearance Change
- Title(参考訳): 実体的外観変化下における長期多段階3次元再構成
- Authors: Beverley Gorry, Tobias Fischer, Michael Milford, Alejandro Fontan,
- Abstract要約: 長期の環境モニタリングには、数ヶ月または数年ごとに分割された繰り返しサイト訪問で3Dモデルを再構築し調整する機能が必要である。
既存のアプローチは、独立して再構築されたセッションのポストホックアライメントに依存している。
我々は,共同SfM再建において,クロスセッション対応を直接実施することを提案する。
- 参考スコア(独自算出の注目度): 52.46888249268445
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Long-term environmental monitoring requires the ability to reconstruct and align 3D models across repeated site visits separated by months or years. However, existing Structure-from-Motion (SfM) pipelines implicitly assume near-simultaneous image capture and limited appearance change, and therefore fail when applied to long-term monitoring scenarios such as coral reef surveys, where substantial visual and structural change is common. In this paper, we show that the primary limitation of current approaches lies in their reliance on post-hoc alignment of independently reconstructed sessions, which is insufficient under large temporal appearance change. We address this limitation by enforcing cross-session correspondences directly within a joint SfM reconstruction. Our approach combines complementary handcrafted and learned visual features to robustly establish correspondences across large temporal gaps, enabling the reconstruction of a single coherent 3D model from imagery captured years apart, where standard independent and joint SfM pipelines break down. We evaluate our method on long-term coral reef datasets exhibiting significant real-world change, and demonstrate consistent joint reconstruction across sessions in cases where existing methods fail to produce coherent reconstructions. To ensure scalability to large datasets, we further restrict expensive learned feature matching to a small set of likely cross-session image pairs identified via visual place recognition, which reduces computational cost and improves alignment robustness.
- Abstract(参考訳): 長期の環境モニタリングには、数ヶ月または数年ごとに分割された繰り返しサイト訪問で3Dモデルを再構築し調整する機能が必要である。
しかし、既存のStructure-from-Motion(SfM)パイプラインは、ほぼ同時の画像キャプチャと外観変化の制限を暗黙的に仮定しているため、サンゴ礁の調査のような長期監視シナリオに適用した場合は失敗する。
本稿では,現状のアプローチの主な限界は,大規模な時間的変化の下では不十分な,独立に再構成されたセッションのポストホックアライメントに依存することにあることを示す。
我々は,共同SfM再建において,クロスセッション対応を直接実施することにより,この制限に対処する。
提案手法は,手工芸と学習した視覚的特徴を組み合わせることで,大規模な時間的ギャップをまたいだ対応性を確立し,標準独立・共同SfMパイプラインを分解した画像から,単一のコヒーレントな3Dモデルの再構築を可能にする。
本手法は,実世界の重要な変化を示すサンゴ礁の長期的データセットを用いて評価し,既存の手法がコヒーレントな再構成を達成できなかった場合のセッション間における一貫した共同再構築を実証する。
大規模データセットに対するスケーラビリティを確保するため,視覚的位置認識によって識別される少数のクロスセッション画像対に対して,コストのかかる特徴マッチングを制限し,計算コストを低減し,整合性の向上を図る。
関連論文リスト
- A Decomposition-based State Space Model for Multivariate Time-Series Forecasting [0.0]
本稿では,3つの並列状態空間モデル分岐を用いたエンドツーエンド分解フレームワークを提案する。
標準ベンチマーク全体では、DecompSSMは強力なベースラインを上回り、コンポーネントワイドな状態空間モデルとグローバルなコンテキスト改善の組み合わせの有効性を示した。
論文 参考訳(メタデータ) (2026-02-05T07:17:08Z) - Morphing Through Time: Diffusion-Based Bridging of Temporal Gaps for Robust Alignment in Change Detection [51.56484100374058]
既存の変更検出ネットワークを変更することなく空間的・時間的ロバスト性を改善するモジュールパイプラインを導入する。
拡散モジュールは、大きな外観ギャップをブリッジする中間変形フレームを合成し、RoMaは段階的に対応を推定できる。
LEVIR-CD、WHU-CD、DSIFN-CDの実験は、登録精度と下流変化検出の両方において一貫した利得を示した。
論文 参考訳(メタデータ) (2025-11-11T08:40:28Z) - VEIGAR: View-consistent Explicit Inpainting and Geometry Alignment for 3D object Removal [2.8954284913103367]
新しいビュー合成(NVS)と3D生成は編集タスクを大幅に改善した。
生成プロセス全体を通して横断的な一貫性を維持するために、メソッドは通常、デュアルストラテジーフレームワークを使用してこの問題に対処する。
VEIGARは,初期再構成フェーズに依存することなく,既存の手法より優れた計算効率の高いフレームワークである。
論文 参考訳(メタデータ) (2025-06-13T11:31:44Z) - StateSpaceDiffuser: Bringing Long Context to Diffusion World Models [52.92249035412797]
本稿では、状態空間モデルから機能を統合することで、拡散モデルが長時間コンテキストタスクの実行を可能にするStateSpaceDiffuserを紹介する。
この設計は拡散モデルの高忠実性合成を保ちながら長期記憶を復元する。
論文 参考訳(メタデータ) (2025-05-28T11:27:54Z) - TransformerLSR: Attentive Joint Model of Longitudinal Data, Survival, and Recurrent Events with Concurrent Latent Structure [35.54001561725239]
フレキシブルトランスフォーマーに基づく深層モデリングおよび推論フレームワークであるTransformerLSRを開発し,これら3つのコンポーネントを同時にモデル化する。
腎移植後の患者に対する実世界の医療データセットをシミュレーションし分析することでTransformerLSRの有効性と必要性を実証する。
論文 参考訳(メタデータ) (2024-04-04T20:51:37Z) - REGAS: REspiratory-GAted Synthesis of Views for Multi-Phase CBCT
Reconstruction from a single 3D CBCT Acquisition [75.64791080418162]
REGASは、アンダーサンプドトモグラフィビューを合成し、再構成画像中のアーティファクトのエイリアスを緩和する自己教師手法を提案する。
高解像度4Dデータ上でのディープニューラルネットワークの大規模なメモリコストに対処するため、REGASは分散して微分可能なフォワードプロジェクションを可能にする新しいレイパス変換(RPT)を導入した。
論文 参考訳(メタデータ) (2022-08-17T03:42:19Z) - Non-local Recurrent Regularization Networks for Multi-view Stereo [108.17325696835542]
深層多視点ステレオネットワークでは、正確な深さ推定を実現するためにコスト正規化が不可欠である。
NR2-Netと呼ばれるマルチビューステレオのための新しい非局所リカレント正規化ネットワークを提案する。
提案手法は,DTU,タンク,テンプルの双方のデータセットに対して,最先端の再構築結果を実現する。
論文 参考訳(メタデータ) (2021-10-13T01:43:54Z) - VIO-Aided Structure from Motion Under Challenging Environments [12.111638631118026]
本稿では,難しい環境下で正確な3次元再構成を行うための,ロバストで効率的なモーションパイプライン構造を提案する。
具体的には,候補画像対の事前幾何配置を考慮し,ミスマッチをフィルタリングする幾何検証手法を提案する。
論文 参考訳(メタデータ) (2021-01-24T06:35:52Z) - Supporting Optimal Phase Space Reconstructions Using Neural Network
Architecture for Time Series Modeling [68.8204255655161]
位相空間特性を暗黙的に学習する機構を持つ人工ニューラルネットワークを提案する。
私たちのアプローチは、ほとんどの最先端戦略と同じくらいの競争力があるか、あるいは優れているかのどちらかです。
論文 参考訳(メタデータ) (2020-06-19T21:04:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。