論文の概要: Geometric Consistency Protocol for Foundation Model Features in Multi-View Satellite Imagery
- arxiv url: http://arxiv.org/abs/2606.17564v1
- Date: Tue, 16 Jun 2026 06:09:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-17 17:15:32.302958
- Title: Geometric Consistency Protocol for Foundation Model Features in Multi-View Satellite Imagery
- Title(参考訳): 多視点衛星画像における基礎モデル特徴のための幾何学的整合性プロトコル
- Authors: Qiyan Luo, Jie Yang, Yingdong Pi, Lekang Wen, Mi Wang,
- Abstract要約: 本稿では,Rational Polynomial Coefficients (RPC)フレームワークに適した,幾何学的かつ再現可能なプロトコルを提案する。
このRPC一貫性の評価を受けると、最先端の2Dバックボーンは、特別な3D認識モデルに対して非常に競争力があることが示される。
- 参考スコア(独自算出の注目度): 11.56882902562207
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Standardized evaluation protocols are indispensable for robust benchmarking in remote sensing, particularly as foundation features are increasingly transferred across diverse sensors and complex imaging geometries. In satellite multi-view reconstruction, conventional evaluations relying on unconstrained 2D global matching are often misleading. The Rational Function Model (RFM) and its Rational Polynomial Coefficients (RPC) dictate a curved, height-dependent epipolar geometry that render flat 2D search spaces physically inconsistent. We propose a geometry-faithful and reproducible protocol tailored for the RPC framework. Our approach integrates an RPC-projected 3D consistency metric with a geometry-constrained dense matching proxy, specifically evaluating whether similarity responses remain localized and unique under physically plausible search manifolds. A pivotal finding of our joint reporting strategy is the decoupling of semantic agreement and geometric localization: high cross-view similarity at a projected 3D point does not guarantee reliable matchability in practical inference. Our benchmark demonstrates that incorporating geometric constraints is fundamental to the problem definition in satellite imagery. Furthermore, we show that state-of-the-art 2D backbones remain remarkably competitive against specialized 3D-aware models when subjected to this RPC-consistent evaluation.
- Abstract(参考訳): 標準化された評価プロトコルは、リモートセンシングにおける堅牢なベンチマークには不可欠である。
衛星多視点再構成では、制約のない2次元グローバルマッチングに依存する従来の評価がしばしば誤解を招く。
相対関数モデル (RFM) とその相対多項式係数 (RPC) は、平坦な2次元探索空間を物理的に不整合に描画する曲線化された高さ依存のエピポーラ幾何学を定めている。
本稿では,RPCフレームワークに適した幾何学的かつ再現可能なプロトコルを提案する。
提案手法は,RPCプロジェクションによる3次元整合性測定と幾何制約付き密マッチングプロキシを統合し,類似性応答が局所化され,物理的に可算な探索多様体の下で一意であるかどうかを実験的に評価する。
我々の共同報告戦略の重要な発見は、意味的合意と幾何学的局所化の分離である: 投影された3次元点における高いクロスビュー類似性は、実用的な推論において確実な一致性を保証するものではない。
本ベンチマークは,衛星画像における問題定義に幾何的制約を組み込むことが基本であることを実証する。
さらに、このRPC一貫性評価を受けると、最先端の2Dバックボーンは、特別な3D認識モデルに対して極めて競合的であることを示す。
関連論文リスト
- PASR: Pose-Aware 3D Shape Retrieval from Occluded Single Views [41.6619757077912]
本稿では,機能レベルの解析言語問題として検索を定式化するフレームワークであるPose-Aware 3D Shape Retrieval (PASR)を提案する。
ポーズ条件付き3Dプロジェクションを2次元特徴マップに整列させることで,実世界の画像と合成メッシュのギャップを埋める。
PASRは、クリーンかつ隠蔽された3次元形状検索データセットの既存の手法を、広いマージンで大幅に上回っている。
論文 参考訳(メタデータ) (2026-04-24T15:32:03Z) - URoPE: Universal Relative Position Embedding across Geometric Spaces [55.651792747815854]
URoPEは回転位置埋め込み(Rotary Position Embedding, RoPE)の普遍的な拡張である。
キー/値の画像パッチごとに、URoPEは事前に定義された奥行きアンカーで対応するカメラ線に沿って3Dポイントをサンプリングする。
標準2D RoPEは、投影されたピクセル座標を用いて適用することができる。
論文 参考訳(メタデータ) (2026-04-20T18:52:03Z) - LG-HCC: Local Geometry-Aware Hierarchical Context Compression for 3D Gaussian Splatting [77.81227097905865]
アンカーベースの3DGS圧縮スキームは、いくつかの高度な文脈モデルを通してガウスの冗長性を減少させる。
本稿では, アンカープルーニングとエントロピー符号化にアンカー幾何学的相関を組み込んだ3DGSのための局所幾何学的階層型コンテキスト圧縮フレームワークを提案する。
実験の結果、LG-HCCは構造保存の問題を効果的に緩和し、Mip-NeRF360データセット上のScaffold-GSベースラインと比較して最大30.85倍のストレージを削減した。
論文 参考訳(メタデータ) (2026-03-30T13:39:35Z) - UniQueR: Unified Query-based Feedforward 3D Reconstruction [68.01984215138098]
提案するUniQueRは,未提示画像からの3次元再構成を効率よく正確に行うための,クエリベースの統合フィードフォワードフレームワークである。
我々のモデルは、明示的な幾何学的クエリとして機能する3Dアンカー点のコンパクトな集合を学習する。
Mip-NeRF 360とVR-NeRFの実験により、UniQueRはレンダリング品質と幾何学的精度の両方において最先端のフィードフォワード法を上回ることを示した。
論文 参考訳(メタデータ) (2026-03-24T06:42:02Z) - GGPT: Geometry Grounded Point Transformer [22.64445696362087]
本稿では,GGPT(Geometry-Grounded Point Transformer)について紹介する。
この基礎の上に構築された幾何誘導型3次元点変換器は,比例的な部分幾何学的監督の下で高密度点マップを洗練する。
論文 参考訳(メタデータ) (2026-03-11T18:00:04Z) - Geometry OR Tracker: Universal Geometric Operating Room Tracking [61.399734016038614]
手術室(OR)では、世界規模のマルチビュー3Dトラッキングは、外科医の行動認識のような下流のアプリケーションをサポートする。
カメラのキャリブレーションとRGB-Dの登録は常に信頼性が低く、幾何学的不整合が生じる。
我々は、不正確なキャリブレーションをスケール一貫性と幾何学的に整合したカメラ設定に修正する2段階パイプラインであるGeometry OR Trackerを紹介する。
論文 参考訳(メタデータ) (2026-02-28T09:21:21Z) - Robust Mesh Saliency GT Acquisition in VR via View Cone Sampling and Geometric Smoothing [59.12032628787018]
バーチャルリアリティー(VR)における人中心視覚モデリングには3次元メッシュサリエンシ基底真理が不可欠である
現在のVRアイトラッキングパイプラインは、単一線サンプリングとユークリッドのスムース化に依存しており、テクスチャの注意を喚起し、ギャップをまたいだ信号の漏洩を引き起こす。
本稿では,これらの制約に対処する頑健な枠組みを提案する。
論文 参考訳(メタデータ) (2026-01-06T05:20:12Z) - TALO: Pushing 3D Vision Foundation Models Towards Globally Consistent Online Reconstruction [57.46712611558817]
3次元視覚基礎モデルでは、1つのフィードフォワードパスを通して、未校正画像からキー3D属性を再構成する際の強力な一般化が示されている。
近年の戦略は,グローバルトランスフォーメーションの解決によって連続的な予測と整合するが,本分析では,仮定の妥当性,局所的なアライメント範囲,雑音的幾何の下でのロバスト性といった基本的な限界を明らかにしている。
本研究では,グローバルに伝播する制御点を利用して空間的に異なる不整合を補正する,Tin Plate Splineに基づく高DOFおよび長期アライメントフレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-02T02:22:20Z) - SPIDER: Spatial Image CorresponDence Estimator for Robust Calibration [28.539636818320886]
本稿では,共有特徴抽出バックボーンを2つの専用ネットワークヘッドに統合した共通特徴マッチングフレームワークであるSPIDERを紹介する。
SPIDERはSoTA法よりも優れており、普遍的な画像マッチング法としての強い能力を示している。
論文 参考訳(メタデータ) (2025-11-21T20:02:08Z) - Dens3R: A Foundation Model for 3D Geometry Prediction [44.13431776180547]
Dens3Rは幾何学的密度予測のための3次元基礎モデルである。
画像対マッチング機能と本質的不変性モデリングを統合することにより、Dens3Rは複数の幾何学的量を正確に回帰する。
論文 参考訳(メタデータ) (2025-07-22T07:22:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。