Fugu-MT 論文翻訳(概要): Deep S2P: Integrating Learning Based Stereo Matching Into the Satellite Stereo Pipeline

論文の概要: Deep S2P: Integrating Learning Based Stereo Matching Into the Satellite Stereo Pipeline

arxiv url: http://arxiv.org/abs/2603.21882v1
Date: Mon, 23 Mar 2026 12:11:17 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-24 19:11:39.657417
Title: Deep S2P: Integrating Learning Based Stereo Matching Into the Satellite Stereo Pipeline
Title（参考訳）: Deep S2P: 衛星ステレオパイプラインに学習ベースのステレオマッチングを統合する
Authors: Elías Masquil, Thibaud Ehret, Pablo Musé, Gabriele Facciolo,
Abstract要約: 衛星画像からのデジタル表面モデル生成は、地球観測における中核的な課題である。最近の学習ベースのステレオマーカは、標準ベンチマークで最先端のパフォーマンスを達成する。我々は、StereoAnywhere、MonSter、Foundation Stereo、衛星微調整されたMonSterを衛星ステレオパイプラインに統合する。
参考スコア（独自算出の注目度）: 18.262323712986973
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Digital Surface Model generation from satellite imagery is a core task in Earth observation and is commonly addressed using classical stereoscopic matching algorithms in satellite pipelines as in the Satellite Stereo Pipeline (S2P). While recent learning-based stereo matchers achieve state-of-the-art performance on standard benchmarks, their integration into operational satellite pipelines remains challenging due to differences in viewing geometry and disparity assumptions. In this work, we integrate several modern learning-based stereo matchers, including StereoAnywhere, MonSter, Foundation Stereo, and a satellite fine-tuned variant of MonSter, into the Satellite Stereo Pipeline, adapting the rectification stage to enforce compatible disparity polarity and range. We release the corresponding code to enable reproducible use of these methods in large-scale Earth observation workflows. Experiments on satellite imagery show consistent improvements over classical cost-volume-based approaches in terms of Digital Surface Model accuracy, although commonly used metrics such as mean absolute error exhibit saturation effects. Qualitative results reveal substantially improved geometric detail and sharper structures, highlighting the need for evaluation strategies that better reflect perceptual and structural fidelity. At the same time, performance over challenging surface types such as vegetation remains limited across all evaluated models, indicating open challenges for learning-based stereo in natural environments.
Abstract（参考訳）: 衛星画像からのデジタル表面モデル生成は地球観測における中核的な課題であり、衛星ステレオパイプライン(S2P)のような衛星パイプラインにおける古典的な立体的マッチングアルゴリズムを用いて対処される。最近の学習ベースのステレオマーカは、標準的なベンチマークで最先端のパフォーマンスを達成するが、視幾何と不均一性の仮定の違いにより、運用衛星パイプラインへの統合は依然として困難である。本研究では、SteleoAnywhere、MonSter、Foundation Stereo、衛星微調整されたMonSterを衛星ステレオパイプラインに統合し、整合ステージを適用し、互換性のある偏極性と範囲を強制する。大規模な地球観測ワークフローにおいて,これらの手法の再現可能な利用を可能にするために,対応するコードをリリースする。衛星画像の実験では、平均絶対誤差の飽和効果などの指標が一般的に使用されるが、Digital Surface Modelの精度の観点からは古典的なコストボリュームベースのアプローチよりも一貫した改善が見られた。質的な結果は、幾何的細部とより鋭い構造を著しく改善し、知覚的および構造的忠実性をよりよく反映する評価戦略の必要性を強調している。同時に、植生のような挑戦的な表面タイプに対するパフォーマンスは、自然環境における学習ベースステレオのオープンな課題として、すべての評価モデルで制限されている。

関連論文リスト

StereoAdapter-2: Globally Structure-Consistent Underwater Stereo Depth Estimation [18.410248448681514]
本稿では,従来のConvGRU更新器を新しいConvSS2D演算子に置き換えるStereoAdapter-2を提案する。大規模合成水中ステレオデータセットUW-StereoDepth-80Kを構築した。本フレームワークは,水中ベンチマークにおいて,最先端のゼロショット性能を実現する。
論文参考訳（メタデータ） (2026-02-18T22:12:08Z)
SonarSweep: Fusing Sonar and Vision for Robust 3D Reconstruction via Plane Sweeping [6.826863809223021]
3次元再構成への単一モダリティアプローチは、視認性や幾何学的制約が低いために失敗する。それまでの融合技術は、欠陥のある幾何学に依存しており、重要なアーティファクトと複雑なシーンをモデル化することができない。本稿では,これらの制約を克服する新しいエンドツーエンドディープラーニングフレームワークであるSonarSweepを紹介する。
論文参考訳（メタデータ） (2025-11-01T04:12:27Z)
Satellite to GroundScape -- Large-scale Consistent Ground View Generation from Satellite Views [5.146618378243241]
本研究では,衛星ビューから生成された地上画像間の整合性を確保するために,新しいクロスビュー合成手法を提案する。本手法は, 固定潜時拡散モデルに基づいて, 衛星誘導復調法と衛星時変復調法という2つの条件付きモジュールを導入する。大規模な衛星地上データセットを10万対以上の視点で提供し,広範囲な地上環境や映像生成を容易にする。
論文参考訳（メタデータ） (2025-04-22T10:58:42Z)
Boosting Omnidirectional Stereo Matching with a Pre-trained Depth Foundation Model [70.67610495024459]
カメラベースの設定は、立体深度推定を用いて高解像度の高解像度深度マップを生成することで、コスト効率のよい選択肢を提供する。既存の全方位ステレオマッチング手法は、様々な環境において限られた深度精度しか達成できない。 DFI-OmniStereoは, 大規模事前学習基礎モデルを用いて, 相対的な単眼深度推定を行う新しい全方位ステレオマッチング法である。
論文参考訳（メタデータ） (2025-03-30T16:24:22Z)
FoundationStereo: Zero-Shot Stereo Matching [50.79202911274819]
FoundationStereoはステレオ深度推定の基礎モデルである。まず,大規模(1Mステレオペア)合成学習データセットを構築した。その後、スケーラビリティを高めるために、多数のネットワークアーキテクチャコンポーネントを設計します。
論文参考訳（メタデータ） (2025-01-17T01:01:44Z)
View Consistent Purification for Accurate Cross-View Localization [59.48131378244399]
本稿では,屋外ロボットのための微細な自己局在化手法を提案する。提案手法は,既存のクロスビューローカライゼーション手法の限界に対処する。これは、動的環境における知覚を増強する初めての疎視のみの手法である。
論文参考訳（メタデータ） (2023-08-16T02:51:52Z)
Unsupervised Discovery of Semantic Concepts in Satellite Imagery with Style-based Wavelet-driven Generative Models [27.62417543307831]
本稿では,衛星画像の広帯域合成が可能な,最初の事前学習型およびウェーブレット型GANモデルを提案する。ネットワークの中間的アクティベーションを解析することにより、解釈可能なセマンティックな方向を多数発見できることが示される。
論文参考訳（メタデータ） (2022-08-03T14:19:24Z)
ResDepth: A Deep Prior For 3D Reconstruction From High-resolution Satellite Images [28.975837416508142]
ResDepthは畳み込みニューラルネットワークで、例データからそのような表現幾何学を学習する。一連の実験において,提案手法はステレオDSMを定量的かつ定性的に一貫的に改善することがわかった。ネットワーク重みに符号化された先行符号化は、都市デザインの意義ある幾何学的特徴を捉えていることを示す。
論文参考訳（メタデータ） (2021-06-15T12:51:28Z)
SMD-Nets: Stereo Mixture Density Networks [68.56947049719936]
SMD-Nets(Stereo Mixture Density Networks)は、幅広い2Dおよび3Dアーキテクチャに対応したシンプルで効果的な学習フレームワークです。具体的には,バイモーダル混合密度を出力表現として活用し,不連続近傍の鋭く正確な不一致推定を可能にすることを示す。我々は8Mpx解像度のステレオペアと現実世界のステレオデータセットからなる、新しい高解像度でリアルな合成ステレオデータセットに関する包括的な実験を行う。
論文参考訳（メタデータ） (2021-04-08T16:15:46Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。