論文の概要: Scene Representation using 360° Saliency Graph and its Application in Vision-based Indoor Navigation
- arxiv url: http://arxiv.org/abs/2603.20353v1
- Date: Fri, 20 Mar 2026 12:44:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:38.860824
- Title: Scene Representation using 360° Saliency Graph and its Application in Vision-based Indoor Navigation
- Title(参考訳): 360°高分解能グラフを用いたシーン表現と視覚を用いた屋内ナビゲーションへの応用
- Authors: Preeti Meena, Himanshu Kumar, Sandeep Yadav,
- Abstract要約: 本稿では,新しい360度鮮度グラフ表現法を提案する。
このリッチな表現は、360グラフ内のノード、エッジ、エッジウェイト、および角位置として、シーンの関連した視覚的、文脈的、意味的、幾何学的情報を明示的にエンコードする。
実験により,視覚に基づく屋内ナビゲーションとシーンローカライゼーションの両面において,提案した360度サリエンシグラフ表現の有効性が示された。
- 参考スコア(独自算出の注目度): 4.619828919345113
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A Scene, represented visually using different formats such as RGB-D, LiDAR scan, keypoints, rectangular, spherical, multi-views, etc., contains information implicitly embedded relevant to applications such as scene indexing, vision-based navigation. Thus, these representations may not be efficient for such applications. This paper proposes a novel 360° saliency graph representation of the scenes. This rich representation explicitly encodes the relevant visual, contextual, semantic, and geometric information of the scene as nodes, edges, edge weights, and angular position in the 360° graph. Also, this representation is robust against scene view change and addresses challenges of indoor environments such as varied illumination, occlusions, and shadows as in the case of existing traditional methods. We have utilized this rich and efficient representation for vision-based navigation and compared it with existing navigation methods using 360° scenes. However, these existing methods suffer from limitations of poor scene representation, lacking scene-specific information. This work utilizes the proposed representation first to localize the query scene in the given topological map, and then facilitate 2D navigation by estimating the next required movement directions towards the target destination in the topological map by using the embedded geometric information in the 360° saliency graph. Experimental results demonstrate the efficacy of the proposed 360° saliency graph representation in enhancing both scene localization and vision-based indoor navigation.
- Abstract(参考訳): RGB-D、LiDARスキャン、キーポイント、長方形、球面、マルチビューなどの異なるフォーマットを使用して視覚的に表現されたシーンには、シーンインデックス、視覚ベースのナビゲーションなどのアプリケーションに暗黙的に埋め込まれた情報が含まれている。
したがって、これらの表現はそのような応用には効率的ではないかもしれない。
本稿では,新しい360度鮮度グラフ表現法を提案する。
このリッチな表現は、360度グラフ内のノード、エッジ、エッジウェイト、および角位置として、シーンの関連した視覚的、文脈的、意味的、幾何学的情報を明示的にエンコードする。
また、この表現はシーンビューの変化に対して堅牢であり、従来の方法のように様々な照明、閉塞、影といった屋内環境の課題に対処する。
我々は、このリッチで効率的な表現を視覚ベースのナビゲーションに利用し、360度映像を用いた既存のナビゲーション手法と比較した。
しかし、これらの既存手法はシーン表現の限界に悩まされ、シーン固有の情報が欠如している。
本研究は,提案した表現を用いて,まず与えられたトポロジカルマップ内の問合せシーンをローカライズし,次に必要となる次の移動方向を,360度塩分グラフに埋め込まれた幾何学的情報を用いて,トポロジカルマップ内の目標目的地への移動方向を推定することにより,2次元ナビゲーションを容易にする。
実験の結果,360度透視グラフ表現がシーンの局所化と視覚に基づく屋内ナビゲーションを両立させる効果が示された。
関連論文リスト
- Self-supervised Learning of Neural Implicit Feature Fields for Camera Pose Refinement [32.335953514942474]
本稿では,3次元の高密度特徴場と2次元の特徴抽出器を併用してシーン表現を共同学習することを提案する。
暗黙の場に符号化された中間的幾何情報を活用するために、ボリュームレンダリングを通してシーンの基盤となる幾何学を学習し、特徴体を設計する。
次に、画像ベースの機能とレンダリングされたボリューム機能を調整することで、視覚的なローカライゼーションを実現する。
論文 参考訳(メタデータ) (2024-06-12T17:51:53Z) - GaussNav: Gaussian Splatting for Visual Navigation [92.13664084464514]
インスタンスイメージゴールナビゲーション(IIN)では、エージェントが探索されていない環境で、目標画像に描かれた特定のオブジェクトを見つける必要がある。
視覚ナビゲーションのためのガウススティング(GaussNav)であるIINの新しいフレームワークを提案し、3次元ガウススティング(DGS)に基づく新しい地図表現を構築した。
当社のGaussNavフレームワークは,Habitat-Matterport 3D(HM3D)データセットにおいて,SPL(Path Length)によるSuccessの重み付けを0.347から0.578に増加させ,大幅なパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2024-03-18T09:56:48Z) - Semantically-aware Neural Radiance Fields for Visual Scene
Understanding: A Comprehensive Review [26.436253160392123]
視覚的シーン理解における意味的認識型ニューラルレイディアンスフィールド(NeRF)の役割を概観する。
NeRFはシーン内の静止オブジェクトと動的オブジェクトの両方に対して3D表現を正確に推論する。
論文 参考訳(メタデータ) (2024-02-17T00:15:09Z) - Neural Implicit Dense Semantic SLAM [83.04331351572277]
本稿では,屋内シーンのメモリ効率,高密度な3次元形状,セマンティックセマンティックセグメンテーションをオンラインで学習する新しいRGBD vSLAMアルゴリズムを提案する。
私たちのパイプラインは、従来の3Dビジョンベースのトラッキングとループクローズとニューラルフィールドベースのマッピングを組み合わせたものです。
提案アルゴリズムはシーン認識を大幅に向上させ,様々なロボット制御問題を支援する。
論文 参考訳(メタデータ) (2023-04-27T23:03:52Z) - Renderable Neural Radiance Map for Visual Navigation [18.903118231531973]
視覚ナビゲーションのための新しいタイプのニューラルラディアンスマップ(RNR-Map)を提案する。
RNR-Mapはグリッド形式であり、各ピクセルの遅延符号で構成されている。
記録された潜伏符号には環境に関する情報が暗黙的に含まれており、RNR-Mapは視覚的に記述される。
論文 参考訳(メタデータ) (2023-03-01T08:00:46Z) - SceneGraphFusion: Incremental 3D Scene Graph Prediction from RGB-D
Sequences [76.28527350263012]
rgb-dフレームのシーケンスを与えられた3次元環境から意味的シーングラフを漸進的に構築する手法を提案する。
我々は、グラフニューラルネットワークを用いて、プリミティブシーンコンポーネントからpointnet機能を集約する。
提案手法は,35hzで動作する他の3dセマンティクスおよびパンオプティカルセグメンテーション法と同等の精度で,高いマージンで3dシーングラフ予測手法を上回る。
論文 参考訳(メタデータ) (2021-03-27T13:00:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。