論文の概要: LuMon: A Comprehensive Benchmark and Development Suite with Novel Datasets for Lunar Monocular Depth Estimation
- arxiv url: http://arxiv.org/abs/2604.09352v1
- Date: Fri, 10 Apr 2026 14:24:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.900855
- Title: LuMon: A Comprehensive Benchmark and Development Suite with Novel Datasets for Lunar Monocular Depth Estimation
- Title(参考訳): LuMon: Lunar単分子深度推定のための新しいデータセットを備えた総合ベンチマークと開発スイート
- Authors: Aytaç Sekmen, Fatih Emre Gunes, Furkan Horoz, Hüseyin Umut Işık, Mehmet Alp Ozaydin, Onur Altay Topaloglu, Şahin Umutcan Üstündaş, Yurdasen Alp Yeni, Halil Ersin Soken, Erol Sahin, Ramazan Gokberk Cinbis, Sinan Kalkan,
- Abstract要約: 月探査のためのMDE手法を評価するための総合的なベンチマークフレームワークであるLuMonについて述べる。
本稿では,実際のChang'e-3ミッションとCHERIダークアナログデータセットから,高品質なステレオグラウンド真理深度を特徴とする新しいデータセットを紹介する。
私たちは、クレーター、岩、極端な陰影、そして様々な深さ範囲といったミッションクリティカルな課題に対して、パフォーマンスを厳格に評価します。
- 参考スコア(独自算出の注目度): 10.338068283985413
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Monocular Depth Estimation (MDE) is crucial for autonomous lunar rover navigation using electro-optical cameras. However, deploying terrestrial MDE networks to the Moon brings a severe domain gap due to harsh shadows, textureless regolith, and zero atmospheric scattering. Existing evaluations rely on analogs that fail to replicate these conditions and lack actual metric ground truth. To address this, we present LuMon, a comprehensive benchmarking framework to evaluate MDE methods for lunar exploration. We introduce novel datasets featuring high-quality stereo ground truth depth from the real Chang'e-3 mission and the CHERI dark analog dataset. Utilizing this framework, we conduct a systematic zero-shot evaluation of state-of-the-art architectures across synthetic, analog, and real datasets. We rigorously assess performance against mission critical challenges like craters, rocks, extreme shading, and varying depth ranges. Furthermore, we establish a sim-to-real domain adaptation baseline by fine tuning a foundation model on synthetic data. While this adaptation yields drastic in-domain performance gains, it exhibits minimal generalization to authentic lunar imagery, highlighting a persistent cross-domain transfer gap. Our extensive analysis reveals the inherent limitations of current networks and sets a standard foundation to guide future advancements in extraterrestrial perception and domain adaptation.
- Abstract(参考訳): 単眼深度推定(MDE)は、電気光学カメラを用いた月面探査に不可欠である。
しかし、地球上のMDEネットワークを月へ展開すると、厳しい影、無テクスチャなリゴリス、大気の散乱がゼロとなるため、ドメインギャップが深刻になる。
既存の評価は、これらの条件を再現できず、実際の計量基底真理を欠いているアナログに依存している。
月探査のためのMDE手法を評価するための総合的なベンチマークフレームワークであるLuMonについて述べる。
本稿では,実際のChang'e-3ミッションとCHERIダークアナログデータセットから,高品質なステレオグラウンド真理深度を特徴とする新しいデータセットを紹介する。
このフレームワークを利用することで、合成、アナログ、および実際のデータセット間で最先端アーキテクチャの体系的なゼロショット評価を行う。
私たちは、クレーター、岩、極端な陰影、そして様々な深さ範囲といったミッションクリティカルな課題に対して、パフォーマンスを厳格に評価します。
さらに,合成データに基づく基礎モデルの微調整により,実領域適応ベースラインを確立する。
この適応はドメイン内での大幅なパフォーマンス向上をもたらすが、実際の月像への最小限の一般化を示し、永続的なクロスドメイン転送ギャップを浮き彫りにする。
我々の広範な分析は、現在のネットワークの本質的な限界を明らかにし、地球外知覚とドメイン適応の今後の進歩を導くための標準基盤を定めている。
関連論文リスト
- From Indoor to Open World: Revealing the Spatial Reasoning Gap in MLLMs [65.04549036809557]
我々は、ステレオカメラ、LiDAR、IMU/GPSセンサーで撮影された歩行者の視線映像から構築したベンチマークを紹介する。
このデータセットは、計量的に正確な3D情報を提供し、空間的推論質問の自動生成を可能にする。
評価の結果、構造化屋内ベンチマークで観測された性能向上は、オープンワールド環境では消滅することが明らかとなった。
論文 参考訳(メタデータ) (2025-12-22T18:58:12Z) - Underwater Monocular Metric Depth Estimation: Real-World Benchmarks and Synthetic Fine-Tuning with Vision Foundation Models [0.0]
実世界の水中データセットを用いたゼロショットおよび微調整単分子メートル法深度推定モデルのベンチマークを示す。
その結果,地上データ(実データや合成データ)に基づいて訓練した大規模モデルでは,水中での作業は不十分であることがわかった。
本研究では,水中における単分子距離深度推定の詳細な評価と可視化を行う。
論文 参考訳(メタデータ) (2025-07-02T21:06:39Z) - Topology-Aware Modeling for Unsupervised Simulation-to-Reality Point Cloud Recognition [63.55828203989405]
我々はオブジェクトポイントクラウド上でSim2Real UDAのための新しいTopology-Aware Modeling (TAM)フレームワークを紹介する。
提案手法は,低レベルの高周波3次元構造を特徴とするグローバル空間トポロジを利用して,領域間隙を緩和する。
本稿では,クロスドメイン・コントラスト学習と自己学習を組み合わせた高度な自己学習戦略を提案する。
論文 参考訳(メタデータ) (2025-06-26T11:53:59Z) - Look Ma, No Ground Truth! Ground-Truth-Free Tuning of Structure from Motion and Visual SLAM [64.57742015099531]
評価は、モーション(SfM)と視覚SLAM(VSLAM)システムから構造を開発・調整する上で重要である。
この土台真実への依存は、様々な環境におけるSfMおよびSLAMアプリケーションを制限する。
幾何学的基底真理の必要をなくすため,GTF評価手法を提案する。
論文 参考訳(メタデータ) (2024-12-02T04:40:03Z) - TanDepth: Leveraging Global DEMs for Metric Monocular Depth Estimation in UAVs [5.6168844664788855]
本研究は,推定時間における相対的推定から距離深度を求めるための実用的スケール回復手法であるTanDepthを提示する。
提案手法は,GDEM(Global Digital Elevation Models)のスパース計測をカメラビューに投影することで活用する。
推定深度マップから接地点を選択して、投影された基準点と相関するクラスフィルタシミュレーションへの適応を示す。
論文 参考訳(メタデータ) (2024-09-08T15:54:43Z) - On Robust Cross-View Consistency in Self-Supervised Monocular Depth Estimation [56.97699793236174]
本論文では,2種類の堅牢なクロスビュー整合性について検討する。
深度特徴空間と3次元ボクセル空間の時間的コヒーレンスを自己教師付き単眼深度推定に利用した。
いくつかのアウトドアベンチマークの実験結果から,本手法は最先端技術より優れていることが示された。
論文 参考訳(メタデータ) (2022-09-19T03:46:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。