論文の概要: Enhancing Glass Surface Reconstruction via Depth Prior for Robot Navigation
- arxiv url: http://arxiv.org/abs/2604.18336v1
- Date: Mon, 20 Apr 2026 14:35:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.937871
- Title: Enhancing Glass Surface Reconstruction via Depth Prior for Robot Navigation
- Title(参考訳): ロボットナビゲーションに先立つ奥行きによるガラス表面の再構築
- Authors: Jiamin Zheng, Jingwen Yu, Guangcheng Chen, Hong Zhang,
- Abstract要約: 本研究では,奥行き基礎モデルを構造的先行として活用する学習自由フレームワークを提案する。
ガラス領域に対して幾何学的に導出された基底真理を持つ新しいRGB-DデータセットであるtiGlassReconについても紹介する。
- 参考スコア(独自算出の注目度): 3.49604158786247
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Indoor robot navigation is often compromised by glass surfaces, which severely corrupt depth sensor measurements. While foundation models like Depth Anything 3 provide excellent geometric priors, they lack an absolute metric scale. We propose a training-free framework that leverages depth foundation models as a structural prior, employing a robust local RANSAC-based alignment to fuse it with raw sensor depth. This naturally avoids contamination from erroneous glass measurements and recovers an accurate metric scale. Furthermore, we introduce \ti{GlassRecon}, a novel RGB-D dataset with geometrically derived ground truth for glass regions. Extensive experiments demonstrate that our approach consistently outperforms state-of-the-art baselines, especially under severe sensor depth corruption. The dataset and related code will be released at https://github.com/jarvisyjw/GlassRecon.
- Abstract(参考訳): 室内ロボットのナビゲーションはガラスの表面によってしばしば損なわれ、深度センサーを著しく劣化させる。
Depth Anything 3のような基礎モデルは優れた幾何学的先行性を提供するが、絶対的な計量スケールは欠如している。
本研究では、RANSACをベースとした頑健な局所アライメントを用いて、深度基礎モデルを構造的先行として活用する学習自由フレームワークを提案する。
これは自然にガラスの不正な測定から汚染を回避し、正確な計量スケールを回復する。
さらに,ガラス領域に対して幾何学的に導出した基底真理を持つ新しいRGB-Dデータセットである \ti{GlassRecon} を紹介する。
広汎な実験により、我々のアプローチは最先端のベースライン、特に重度のセンサー深度破壊において一貫して上回っていることが示された。
データセットと関連するコードはhttps://github.com/jarvisyjw/GlassReconで公開される。
関連論文リスト
- In Depth We Trust: Reliable Monocular Depth Supervision for Gaussian Splatting [22.674046124865196]
幾何的監督にスケールあいまいでノイズの多い奥行きを取り入れたトレーニングフレームワークを導入する。
多様なデータセットに対する実験では、幾何精度が一貫した改善が見られた。
論文 参考訳(メタデータ) (2026-04-07T11:15:15Z) - Robust Depth Enhancement via Polarization Prompt Fusion Tuning [112.88371907047396]
様々な深度センサによる不正確な深度測定を改善するために偏光イメージングを利用するフレームワークを提案する。
まず、偏光データとセンサ深度マップから高密度で完全な深度マップを推定するために、ニューラルネットワークを訓練した学習ベースの戦略を採用する。
大規模データセット上で事前学習したRGBモデルを有効に活用するためのPPFT(Polarization Prompt Fusion Tuning)戦略を提案する。
論文 参考訳(メタデータ) (2024-04-05T17:55:33Z) - AONeuS: A Neural Rendering Framework for Acoustic-Optical Sensor Fusion [25.32113731681485]
水中の知覚と3次元表面の再構築は、建設、セキュリティ、海洋考古学、環境モニタリングにおける幅広い応用において難しい問題である。
本研究は,物理に基づく多モード音響-光学的ニューラルサーフェス再構成フレームワークの開発である。
これらの相補的なモダリティを融合させることで,本フレームワークは,高度に制限されたベースライン上での計測から高精度な高解像度3次元表面を再構築することができる。
論文 参考訳(メタデータ) (2024-02-05T18:59:31Z) - On the Importance of Accurate Geometry Data for Dense 3D Vision Tasks [61.74608497496841]
不正確または破損したデータのトレーニングは、モデルバイアスとハマーズ一般化能力を誘導する。
本稿では,深度推定と再構成における高密度3次元視覚課題に対するセンサ誤差の影響について検討する。
論文 参考訳(メタデータ) (2023-03-26T22:32:44Z) - Leveraging RGB-D Data with Cross-Modal Context Mining for Glass Surface Detection [47.87834602551456]
ガラスの表面は、現代の建物が多くのガラスパネルを使用する傾向にあるため、ますます広くなっている。
これは、ロボット、自動運転車、ドローンなどの自律システムの運用に重大な課題をもたらす。
RGBと深度情報を組み合わせた新しいガラス表面検出フレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-22T17:56:09Z) - Is my Depth Ground-Truth Good Enough? HAMMER -- Highly Accurate
Multi-Modal Dataset for DEnse 3D Scene Regression [34.95597838973912]
HAMMERは屋内深度推定のための複数の一般的なセンサーからの深度推定を含むデータセットである。
我々は3次元スキャナーとアライメントレンダリングの助けを借りて、信頼性の高い地上真理深度マップを構築した。
一般的な深度推定器は、このデータと典型的な深度センサに基づいて訓練されている。
論文 参考訳(メタデータ) (2022-05-09T21:25:09Z) - Mirror3D: Depth Refinement for Mirror Surfaces [15.825231649843332]
3つのRGBDデータセットに基づいた3DミラープレーンデータセットであるMirror3Dデータセットを作成します。
次に、ミラー表面の誤差を補正するために、生のセンサー深度や推定深度を洗練するモジュールであるMirror3DNetを開発する。
実験の結果,Mirror3DNetは入力深度データの誤りを著しく軽減することがわかった。
論文 参考訳(メタデータ) (2021-06-11T22:30:12Z) - Virtual Normal: Enforcing Geometric Constraints for Accurate and Robust
Depth Prediction [87.08227378010874]
深度予測における高次3次元幾何学的制約の重要性を示す。
単純な幾何学的制約を強制する損失項を設計することにより、単眼深度推定の精度とロバスト性を大幅に改善する。
The-of-the-art results of learning metric depth on NYU Depth-V2 and KITTI。
論文 参考訳(メタデータ) (2021-03-07T00:08:21Z) - GeoNet++: Iterative Geometric Neural Network with Edge-Aware Refinement
for Joint Depth and Surface Normal Estimation [204.13451624763735]
本研究では,エッジアウェア・リファインメント(GeoNet++)を用いた幾何ニューラルネットワークを提案し,単一の画像から深さと表面正規写像の両方を共同で予測する。
geonet++は、強い3d一貫性と鋭い境界を持つ深さと表面の正常を効果的に予測する。
画素単位の誤差/精度を評価することに焦点を当てた現在の測定値とは対照的に、3DGMは予測深度が高品質な3D表面の正常を再構築できるかどうかを測定する。
論文 参考訳(メタデータ) (2020-12-13T06:48:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。