Fugu-MT 論文翻訳(概要): Cross-Modal Reinforcement Learning for Navigation with Degraded Depth Measurements

論文の概要: Cross-Modal Reinforcement Learning for Navigation with Degraded Depth Measurements

arxiv url: http://arxiv.org/abs/2603.22182v1
Date: Mon, 23 Mar 2026 16:45:03 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-24 19:11:39.791178
Title: Cross-Modal Reinforcement Learning for Navigation with Degraded Depth Measurements
Title（参考訳）: 劣化深さ測定によるナビゲーションのためのクロスモーダル強化学習
Authors: Omkar Sawant, Luca Zanatta, Grzegorz Malczyk, Kostas Alexis,
Abstract要約: 我々は、クロスモーダルな一貫性を強制することによって共有潜在表現を学習するクロスモーダルなワッサースタインオートエンコーダを導入する。学習された表現は、非構造環境における衝突のないナビゲーションのための強化学習ベースのポリシーと統合される。
参考スコア（独自算出の注目度）: 9.487836148196713
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This paper presents a cross-modal learning framework that exploits complementary information from depth and grayscale images for robust navigation. We introduce a Cross-Modal Wasserstein Autoencoder that learns shared latent representations by enforcing cross-modal consistency, enabling the system to infer depth-relevant features from grayscale observations when depth measurements are corrupted. The learned representations are integrated with a Reinforcement Learning-based policy for collision-free navigation in unstructured environments when depth sensors experience degradation due to adverse conditions such as poor lighting or reflective surfaces. Simulation and real-world experiments demonstrate that our approach maintains robust performance under significant depth degradation and successfully transfers to real environments.
Abstract（参考訳）: 本稿では,奥行き画像とグレースケール画像の相補的な情報を利用して,ロバストなナビゲーションを実現するクロスモーダル学習フレームワークを提案する。クロスモーダル整合性を持たせることで、共有潜在表現を学習するクロスモーダルワッサースタインオートエンコーダを導入し、奥行き測定が破損した場合のグレースケール観測から深度関連特徴を推測できるようにする。学習された表現は、非構造環境における衝突のないナビゲーションのための強化学習に基づくポリシーと統合される。シミュレーションおよび実世界の実験により,本手法は大幅な深度劣化下で頑健な性能を維持し,実環境への移動に成功したことを示す。

関連論文リスト

From Seeing to Experiencing: Scaling Navigation Foundation Models with Reinforcement Learning [59.88543114325153]
本稿では,航法基礎モデルの強化学習能力を高めるためのSeeing-to-Experiencingフレームワークを提案する。 S2Eは、ビデオの事前トレーニングとRLによるポストトレーニングの長所を組み合わせたものだ。実世界のシーンを3DGSで再現した3D画像に基づく総合的なエンドツーエンド評価ベンチマークであるNavBench-GSを構築した。
論文参考訳（メタデータ） (2025-07-29T17:26:10Z)
DCIRNet: Depth Completion with Iterative Refinement for Dexterous Grasping of Transparent and Reflective Objects [9.235004977824026]
透過的および反射的オブジェクトのための新しいマルチモーダルディープコンプリートネットワークであるDCIRNetを提案する。提案手法は,RGB画像と不完全深度マップ間の補完情報を抽出するための,革新的なマルチモーダル機能融合モジュールを組み込んだものである。透明で反射的なオブジェクトの把握成功率を44%で改善しました。
論文参考訳（メタデータ） (2025-06-11T08:04:22Z)
Back to the Color: Learning Depth to Specific Color Transformation for Unsupervised Depth Estimation [45.07558105128673]
合成色と実世界の色の違いは、実世界のシーンにおける深度推定に重大な課題をもたらす。実世界のデータに基づいて訓練されたモデルを用いて,奥行きからリアルな色を予測するフレームワークBack2Colorを提案する。また、VADepthは、変換器よりも計算量が少なく、精度も高いVision Attention Networkをベースにしている。
論文参考訳（メタデータ） (2024-06-11T21:55:20Z)
Unveiling the Depths: A Multi-Modal Fusion Framework for Challenging Scenarios [103.72094710263656]
本稿では,学習に基づくフレームワークを用いて,支配的モダリティの奥行きを識別し,統合する手法を提案する。本稿では,信頼度予測ネットワークを操り,潜在電位深度領域を特定する信頼マップを作成する新しい信頼損失を提案する。得られた信頼度マップを用いて,最終深度をエンドツーエンドに融合するマルチモーダル融合ネットワークを提案する。
論文参考訳（メタデータ） (2024-02-19T04:39:16Z)
Depth-aware Volume Attention for Texture-less Stereo Matching [67.46404479356896]
実用的な屋外シナリオにおけるテクスチャ劣化に対処する軽量なボリューム改善手法を提案する。画像テクスチャの相対的階層を抽出し,地中深度マップによって教師される深度体積を導入する。局所的な微細構造と文脈は、体積凝集時のあいまいさと冗長性を緩和するために強調される。
論文参考訳（メタデータ） (2024-02-14T04:07:44Z)
Structure Flow-Guided Network for Real Depth Super-Resolution [28.63334760296165]
本稿では,新しい構造フロー誘導深度超解像(DSR)フレームワークを提案する。クロスモダリティフローマップを学習し、RGB構造情報転送を正確に深度アップサンプリングするためのガイドする。我々のフレームワークは最先端の手法と比較して優れた性能を実現している。
論文参考訳（メタデータ） (2023-01-31T05:13:55Z)
Learning Deep Context-Sensitive Decomposition for Low-Light Image Enhancement [58.72667941107544]
典型的なフレームワークは、照明と反射を同時に推定することであるが、特徴空間にカプセル化されたシーンレベルの文脈情報を無視する。本研究では,空間スケールにおけるシーンレベルのコンテキスト依存を生かした,コンテキスト依存型分解ネットワークアーキテクチャを提案する。チャネル数を減らして軽量なCSDNet(LiteCSDNet)を開発する。
論文参考訳（メタデータ） (2021-12-09T06:25:30Z)
Self-Guided Instance-Aware Network for Depth Completion and Enhancement [6.319531161477912]
既存の手法では,画素ワイド画像の内容とそれに対応する近傍の深度値に基づいて,欠落した深度測定を直接補間する。本稿では、自己誘導機構を利用して、深度復元に必要なインスタンスレベルの特徴を抽出する自己誘導型インスタンス認識ネットワーク(SG-IANet)を提案する。
論文参考訳（メタデータ） (2021-05-25T19:41:38Z)
Channel Attention based Iterative Residual Learning for Depth Map Super-Resolution [58.626803922196146]
我々は、合成データセットで訓練されたDSRモデルは制限的であり、実世界のDSRタスクを扱うのに有効ではないと論じる。我々は、異なる深度センサの現実世界の劣化に対処するために2つの貢献をしている。 4つのモジュールからなる実世界のDSRのための新しいフレームワークを提案する。
論文参考訳（メタデータ） (2020-06-02T09:12:23Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。