論文の概要: Sat3R: Satellite DSM Reconstruction via RPC-Aware Depth Fine-tuning
- arxiv url: http://arxiv.org/abs/2605.07264v1
- Date: Fri, 08 May 2026 05:29:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.820031
- Title: Sat3R: Satellite DSM Reconstruction via RPC-Aware Depth Fine-tuning
- Title(参考訳): Sat3R:RPC対応深度微調整による衛星DSM再構成
- Authors: Qiaoyi Yang, Chaoyi Zhou, Xi Liu, Run Wang, Minghui Xu, Mert D. Pesé, Feng Luo, Yuhao Xu, Zhi-Qi Cheng, Qiushi Chen, Hairong Qi, Siyu Huang,
- Abstract要約: 本研究では,単眼深度基礎モデルを衛星領域に適応させるフィードフォワードフレームワークであるSat3Rを提案する。
DFC 2019ベンチマークの実験では、Sat3Rは、ゼロショットフィードフォワードベースラインを38%削減し、最適化ベースのメソッドと競合する精度を達成し、300倍以上のスピードアップを実現している。
- 参考スコア(独自算出の注目度): 32.74470558379802
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate Digital Surface Model (DSM) reconstruction from satellite imagery is critical for applications such as disaster response, urban planning, and large-scale geographic mapping. Existing approaches face a fundamental trade-off: optimization-based methods achieve strong accuracy but require hours of per-scene computation, while generalizable geometry foundation models offer near-instant inference but fail to generalize to satellite imagery due to the domain gap introduced by the Rational Polynomial Camera (RPC) model and mismatched depth scale distributions. We present Sat3R, a feed-forward framework that bridges this gap via RPC-aware metric depth fine-tuning of Depth Anything V2 using the Scale-Invariant Logarithmic (SiLog) loss. By constructing physically consistent pseudo depth supervision from RPC geometry, Sat3R adapts a monocular depth foundation model to the satellite domain without per-scene optimization. Experiments on the DFC2019 benchmark demonstrate that Sat3R reduces MAE by 38% over zero-shot feed-forward baselines and achieves competitive accuracy against optimization-based methods, while delivering over 300x speedup. Sat3R demonstrates that feed-forward models, when properly adapted to the satellite domain, can match optimization-based accuracy at a fraction of the computational cost, paving the way for practical large-scale satellite DSM reconstruction.
- Abstract(参考訳): 衛星画像からの正確なデジタル表面モデル(DSM)の再構築は、災害対応、都市計画、大規模地理地図作成などの応用に不可欠である。
最適化に基づく手法は強い精度を達成できるが、シーン毎の計算時間を必要とするが、一般化可能な幾何学基礎モデルは、ほぼインスタントな推論を提供するが、Rational Polynomial Camera(RPC)モデルとミスマッチした深度スケール分布によってもたらされる領域ギャップにより、衛星画像への一般化に失敗する。
私たちは、Sat3Rというフィードフォワードフレームワークを紹介します。Sat3Rは、スケール不変対数(SiLog)損失を使用して、Depth Anything V2のRPC対応メトリックディープ微調整によって、このギャップを橋渡しします。
RPC幾何から物理的に一貫した擬似深度監視を構築することで、Sat3Rは単分子深度基礎モデルをシーンごとの最適化なしに衛星領域に適応させる。
DFC2019ベンチマークの実験では、Sat3Rは、ゼロショットフィードフォワードベースラインを38%削減し、最適化ベースの手法と競合する精度を達成し、300倍以上のスピードアップを実現している。
Sat3Rは、フィードフォワードモデルが衛星領域に適切に適合すると、計算コストのごく一部で最適化ベースの精度と一致し、実用的な大規模衛星DSM再構築の道を開くことを実証している。
関連論文リスト
- SatSurfGS: Generalizable 2D Gaussian Splatting for Sparse-View Satellite Surface Reconstruction [28.052416644147044]
2DGSに基づく衛星画像のスパース面再構成法であるSatSurfGSを提案する。
提案手法は粗大なガウス属性予測フレームワークを構築し,局所的な幾何学的信頼性を3つのレベルで明確にモデル化する。
衛星データセットを用いた実験により,提案手法はレンダリング品質,表面再構成精度,クロスデータセットの一般化,推論効率の向上を実現している。
論文 参考訳(メタデータ) (2026-05-08T03:19:32Z) - Semantic Segmentation and Depth Estimation for Real-Time Lunar Surface Mapping Using 3D Gaussian Splatting [1.1240669509034298]
本稿では,高密度知覚モデルと3次元ガウススプラッティング(3DGS)表現を統合したリアルタイムマッピングフレームワークを提案する。
この結果から, セマンティックセグメンテーションと深度推定を学習地図表現と組み合わせることが, 将来の月面ミッションを支援するための詳細な大規模地図作成に有効な方法であることが示唆された。
論文 参考訳(メタデータ) (2026-03-18T19:07:30Z) - PolGS++: Physically-Guided Polarimetric Gaussian Splatting for Fast Reflective Surface Reconstruction [76.9760302941819]
PolGS++は高速反射面再構成のための偏光ガウス散乱フレームワークである。
本稿では,アングル・オブ・ポラライゼーション(AoP)に基づくタンジェント空間の整合性制約を実現するための,奥行き誘導型可視マスク取得機構を提案する。
論文 参考訳(メタデータ) (2026-03-11T14:11:42Z) - SkySplat: Generalizable 3D Gaussian Splatting from Multi-Temporal Sparse Satellite Images [14.193740794354607]
疎視可能な衛星画像から3次元のシーンを再現することは、長年の課題である。
RPCモデルを一般化可能な3DGSパイプラインに統合する新しいフレームワークであるSkySplatを提案する。
シーンごとの最適化手法と比較して、SkySplatは高精度でEOGSの86倍の高速化を実現している。
論文 参考訳(メタデータ) (2025-08-13T04:17:51Z) - Pseudo Depth Meets Gaussian: A Feed-forward RGB SLAM Baseline [64.42938561167402]
本稿では,3次元ガウス型SLAMとフィードフォワードリカレント予測モジュールを組み合わせたオンライン3次元再構成手法を提案する。
このアプローチは、遅いテスト時間の最適化を高速なネットワーク推論に置き換え、トラッキング速度を大幅に改善する。
提案手法は,最先端のSplaTAMと同等の性能を示しながら,追跡時間を90%以上削減する。
論文 参考訳(メタデータ) (2025-08-06T16:16:58Z) - QuickSplat: Fast 3D Surface Reconstruction via Learned Gaussian Initialization [69.50126552763157]
表面再構成はコンピュータビジョンとグラフィックスの基本であり、3Dモデリング、混合現実、ロボット工学などの応用を可能にする。
レンダリングに基づく既存のアプローチは有望な結果を得るが、シーンごとに最適化されるため、テクスチャレスな領域をモデル化するのに苦労する可能性がある。
大規模屋内シーンの2次元ガウススプラッティング最適化のための高密度初期化を生成するために,データ駆動の先行処理を学習するQuickSplatを紹介する。
論文 参考訳(メタデータ) (2025-05-08T18:43:26Z) - AGS-Mesh: Adaptive Gaussian Splatting and Meshing with Geometric Priors for Indoor Room Reconstruction Using Smartphones [19.429461194706786]
室内シーンの正確な3次元再構成のためのガウススメッティング法における接合面深度と正規化のアプローチを提案する。
我々のフィルタリング戦略と最適化設計は、メッシュ推定と新規ビュー合成の両方において大きな改善を示す。
論文 参考訳(メタデータ) (2024-11-28T17:04:32Z) - InstantSplat: Sparse-view Gaussian Splatting in Seconds [91.77050739918037]
InstantSplatは,光速でスパークビュー3Dシーンを再現する新しい手法である。
InstantSplatでは,3Dシーン表現とカメラポーズを最適化する,自己管理フレームワークを採用している。
3D-GSの従来のSfMと比較して、30倍以上の再現を達成し、視覚的品質(SSIM)を0.3755から0.7624に改善する。
論文 参考訳(メタデータ) (2024-03-29T17:29:58Z) - Iterative Soft Shrinkage Learning for Efficient Image Super-Resolution [91.3781512926942]
画像超解像(SR)は、CNNからトランスフォーマーアーキテクチャへの広範なニューラルネットワーク設計を目撃している。
本研究は,市販のネットワーク設計を生かし,基礎となる計算オーバーヘッドを低減するため,超高解像度イテレーションにおけるネットワークプルーニングの可能性について検討する。
本研究では, ランダムネットワークのスパース構造を最適化し, 重要でない重みを小さめに微調整することにより, 反復型軟収縮率(ISS-P)法を提案する。
論文 参考訳(メタデータ) (2023-03-16T21:06:13Z) - Photometric Multi-View Mesh Refinement for High-Resolution Satellite
Images [24.245977127434212]
最先端の復元手法は一般的に2.5次元の標高データを生成する。
マルチビュー衛星画像から全3次元表面メッシュを復元する手法を提案する。
論文 参考訳(メタデータ) (2020-05-10T20:37:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。