Fugu-MT 論文翻訳(概要): Renderable Neural Radiance Map for Visual Navigation

論文の概要: Renderable Neural Radiance Map for Visual Navigation

arxiv url: http://arxiv.org/abs/2303.00304v1
Date: Wed, 1 Mar 2023 08:00:46 GMT
ステータス: 翻訳完了
システム内更新日: 2023-03-02 15:32:57.687669
Title: Renderable Neural Radiance Map for Visual Navigation
Title（参考訳）: 視覚ナビゲーションのためのRenderable Neural Radiance Map
Authors: Obin Kwon, Jeongho Park, Songhwai Oh
Abstract要約: 視覚ナビゲーションのための新しいタイプのニューラルラディアンスマップ(RNR-Map)を提案する。 RNR-Mapはグリッド形式であり、各ピクセルの遅延符号で構成されている。記録された潜伏符号には環境に関する情報が暗黙的に含まれており、RNR-Mapは視覚的に記述される。
参考スコア（独自算出の注目度）: 18.903118231531973
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: We propose a novel type of map for visual navigation, a renderable neural radiance map (RNR-Map), which is designed to contain the overall visual information of a 3D environment. The RNR-Map has a grid form and consists of latent codes at each pixel. These latent codes are embedded from image observations, and can be converted to the neural radiance field which enables image rendering given a camera pose. The recorded latent codes implicitly contain visual information about the environment, which makes the RNR-Map visually descriptive. This visual information in RNR-Map can be a useful guideline for visual localization and navigation. We develop localization and navigation frameworks that can effectively utilize the RNR-Map. We evaluate the proposed frameworks on camera tracking, visual localization, and image-goal navigation. Experimental results show that the RNR-Map-based localization framework can find the target location based on a single query image with fast speed and competitive accuracy compared to other baselines. Also, this localization framework is robust to environmental changes, and even finds the most visually similar places when a query image from a different environment is given. The proposed navigation framework outperforms the existing image-goal navigation methods in difficult scenarios, under odometry and actuation noises. The navigation framework shows 65.7% success rate in curved scenarios of the NRNS dataset, which is an improvement of 18.6% over the current state-of-the-art.
Abstract（参考訳）: 本研究では,3d環境全体の視覚情報を含むように設計された,描画可能な神経放射マップ(rnr-map)である視覚ナビゲーションのための新しいタイプのマップを提案する。 RNR-Mapはグリッド形式であり、各ピクセルの遅延符号で構成されている。これらの潜在コードは画像観察から埋め込まれており、カメラのポーズによって画像レンダリングを可能にするニューラル・ラミアンス・フィールドに変換できる。記録された潜伏符号には環境に関する情報が暗黙的に含まれており、RNR-Mapは視覚的に記述される。 RNR-Mapのこのビジュアル情報は、視覚的なローカライゼーションとナビゲーションに有用なガイドラインである。 RNRマップを効果的に活用するローカライズおよびナビゲーションフレームワークを開発する。提案するカメラトラッキング,視覚的位置決め,画像ゴールナビゲーションのフレームワークを評価する。実験結果から,RNR-Mapベースのローカライゼーションフレームワークは,他のベースラインと比較して高速かつ競合的な精度で,単一のクエリ画像に基づいて目標位置を見つけることができることがわかった。また、このローカライゼーションフレームワークは環境変化に対して堅牢であり、異なる環境からのクエリイメージが与えられる場合に最も視覚的に類似した場所を見つける。提案したナビゲーションフレームワークは,既存の画像ゴールナビゲーション手法よりも,音韻法やアクティベーションノイズの下で,困難なシナリオにおいて優れている。ナビゲーションフレームワークはNRNSデータセットの湾曲したシナリオで65.7%の成功率を示しており、現在の最先端よりも18.6%改善されている。

関連論文リスト

From Street to Orbit: Training-Free Cross-View Retrieval via Location Semantics and LLM Guidance [10.533095161205358]
クロスビュー画像検索は、自律ナビゲーション、都市計画、GPSを用いた環境におけるローカライゼーションなどの応用において重要である。我々は、事前学習された視覚エンコーダと大規模言語モデル(LLM)を利用した、シンプルで効果的なクロスビュー画像検索フレームワークを提案する。しかし,提案手法は,ゼロショット設定下でのベンチマークデータセットに対する事前学習に基づくアプローチよりも優れていた。
論文参考訳（メタデータ） (2025-11-12T23:51:46Z)
Semantic Environment Atlas for Object-Goal Navigation [12.057544558656035]
エンボディエージェントの視覚ナビゲーション能力を高めるために,セマンティック環境アトラス (SEA) を導入した。 SEAは様々な環境からの複数のセマンティックマップを統合し、場所-対象関係の記憶を保持する。本手法は, 現状よりも12.4%向上した39.0%を達成できるが, 騒音・作動条件下では頑健性も維持できる。
論文参考訳（メタデータ） (2024-10-05T00:37:15Z)
Visual Localization in 3D Maps: Comparing Point Cloud, Mesh, and NeRF Representations [8.522160106746478]
様々な3次元地図表現にまたがる単一カメラ画像のローカライズが可能なグローバルな視覚的ローカライゼーションシステムを提案する。本システムは,シーンの新たなビューを合成し,RGBと深度画像のペアを作成することでデータベースを生成する。 NeRF合成画像は、クエリ画像を平均72%の成功率でローカライズし、優れた性能を示す。
論文参考訳（メタデータ） (2024-08-21T19:37:17Z)
MapLocNet: Coarse-to-Fine Feature Registration for Visual Re-Localization in Navigation Maps [8.373285397029884]
伝統的なローカライゼーションアプローチは、正確に注釈付けされたランドマークからなる高定義(HD)マップに依存している。本稿では,画像登録にインスパイアされたトランスフォーマーを用いたニューラルリローカライズ手法を提案する。提案手法は, nuScenes と Argoverse の両方のデータセット上で, 現在最先端の OrienterNet を著しく上回っている。
論文参考訳（メタデータ） (2024-07-11T14:51:18Z)
GaussNav: Gaussian Splatting for Visual Navigation [92.13664084464514]
インスタンスイメージゴールナビゲーション(IIN)では、エージェントが探索されていない環境で、目標画像に描かれた特定のオブジェクトを見つける必要がある。我々のフレームワークは3次元ガウススプラッティングに基づく新しい地図表現を構築する(3DGS) 我々のフレームワークは、Habitat-Matterport 3D(HM3D)データセットに挑戦するPath Length(SPL)が0.252から0.578に重み付けしたSuccessの増加によって証明された、パフォーマンスの著しい飛躍を示す。
論文参考訳（メタデータ） (2024-03-18T09:56:48Z)
Language-enhanced RNR-Map: Querying Renderable Neural Radiance Field maps with natural language [51.805056586678184]
自然言語クエリプロンプトを用いた視覚ナビゲーションのための言語拡張型Renderable Neural Radiance Mapを提案する。 Le-RNR-Mapは、各ピクセルに配置された遅延符号からなるグリッド構造を用いる。 CLIPをベースとした埋め込みコードによりRNRマップを強化し,ラベルデータを追加せずに自然言語検索を可能にする。
論文参考訳（メタデータ） (2023-08-17T08:27:01Z)
Neural Implicit Dense Semantic SLAM [83.04331351572277]
本稿では,屋内シーンのメモリ効率,高密度な3次元形状,セマンティックセマンティックセグメンテーションをオンラインで学習する新しいRGBD vSLAMアルゴリズムを提案する。私たちのパイプラインは、従来の3Dビジョンベースのトラッキングとループクローズとニューラルフィールドベースのマッピングを組み合わせたものです。提案アルゴリズムはシーン認識を大幅に向上させ,様々なロボット制御問題を支援する。
論文参考訳（メタデータ） (2023-04-27T23:03:52Z)
HPointLoc: Point-based Indoor Place Recognition using Synthetic RGB-D Images [58.720142291102135]
本稿では,屋内環境における視覚的位置認識能力の探索を目的とした,HPointLocという新しいデータセットを提案する。データセットは人気のあるHabitatシミュレータに基づいており、独自のセンサーデータとオープンデータセットの両方を使用して屋内シーンを生成することができる。
論文参考訳（メタデータ） (2022-12-30T12:20:56Z)
CroCo: Cross-Modal Contrastive learning for localization of Earth Observation data [62.96337162094726]
地上のLiDAR点雲をリモートセンシング画像上にローカライズすることに興味がある。本稿では,DEMと高分解能光学画像に基づいて学習を行うコントラスト学習手法を提案する。ベストシナリオは、トップ1スコア0.71、トップ5スコア0.81を得る。
論文参考訳（メタデータ） (2022-04-14T15:55:00Z)
Memory-Augmented Reinforcement Learning for Image-Goal Navigation [67.3963444878746]
本論文では,クロスエピソードメモリを活用したナビゲーション学習法を提案する。オーバーフィッティングを避けるため、トレーニング中にRGB入力にデータ拡張を適用することを提案する。この競合性能はRGB入力のみから得られるが,位置や深度などのセンサは利用できない。
論文参考訳（メタデータ） (2021-01-13T16:30:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。