Fugu-MT 論文翻訳(概要): Mapping High-level Semantic Regions in Indoor Environments without Object Recognition

論文の概要: Mapping High-level Semantic Regions in Indoor Environments without Object Recognition

arxiv url: http://arxiv.org/abs/2403.07076v1
Date: Mon, 11 Mar 2024 18:09:50 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-13 23:51:07.355084
Title: Mapping High-level Semantic Regions in Indoor Environments without Object Recognition
Title（参考訳）: 物体認識のない屋内環境における高レベルセマンティック領域のマッピング
Authors: Roberto Bigazzi, Lorenzo Baraldi, Shreyas Kousik, Rita Cucchiara, Marco Pavone
Abstract要約: 本研究では,屋内環境における埋め込みナビゲーションによる意味領域マッピング手法を提案する。地域識別を実現するために,視覚言語モデルを用いて地図作成のためのシーン情報を提供する。グローバルなフレームにエゴセントリックなシーン理解を投影することにより、提案手法は各場所の可能な領域ラベル上の分布としてのセマンティックマップを生成する。
参考スコア（独自算出の注目度）: 50.624970503498226
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Robots require a semantic understanding of their surroundings to operate in an efficient and explainable way in human environments. In the literature, there has been an extensive focus on object labeling and exhaustive scene graph generation; less effort has been focused on the task of purely identifying and mapping large semantic regions. The present work proposes a method for semantic region mapping via embodied navigation in indoor environments, generating a high-level representation of the knowledge of the agent. To enable region identification, the method uses a vision-to-language model to provide scene information for mapping. By projecting egocentric scene understanding into the global frame, the proposed method generates a semantic map as a distribution over possible region labels at each location. This mapping procedure is paired with a trained navigation policy to enable autonomous map generation. The proposed method significantly outperforms a variety of baselines, including an object-based system and a pretrained scene classifier, in experiments in a photorealistic simulator.
Abstract（参考訳）: ロボットは環境のセマンティックな理解を必要とし、人間の環境で効率的に説明可能な方法で操作する。文献では、オブジェクトのラベル付けと徹底的なシーングラフ生成に焦点が当てられ、大きな意味領域を純粋に識別しマッピングするタスクに、より少ない労力が注がれている。本研究では,屋内環境における具体化ナビゲーションによる意味領域マッピング手法を提案し,エージェントの知識の高レベル表現を生成する。地域識別を実現するために,視覚言語モデルを用いて地図作成のためのシーン情報を提供する。グローバルフレームにエゴセントリックなシーン理解を投影することにより,提案手法は各位置の可能な領域ラベル上の分布として意味マップを生成する。このマッピング手順は、訓練されたナビゲーションポリシーと組み合わせて、自律的なマップ生成を可能にする。提案手法は,フォトリアリスティックシミュレータの実験において,オブジェクトベースシステムや事前学習シーン分類器など,さまざまなベースラインを著しく上回る。

関連論文リスト

FindAnything: Open-Vocabulary and Object-Centric Mapping for Robot Exploration in Any Environment [16.987872206495897]
FindAnythingは、視覚言語情報を高密度のボリュームサブマップに組み込むオープンワールドマッピングフレームワークである。当社のシステムは,MAVなどのリソース制約されたデバイスにデプロイされる最初のシステムである。
論文参考訳（メタデータ） (2025-04-11T15:12:05Z)
Neural Semantic Map-Learning for Autonomous Vehicles [85.8425492858912]
本稿では,道路環境のコヒーレントな地図を作成するために,車両群から収集した局所部分写像を中心インスタンスに融合するマッピングシステムを提案する。本手法は,シーン特異的なニューラルサイン距離場を用いて,雑音と不完全局所部分写像を併用する。我々は,記憶効率の高いスパース機能グリッドを活用して大規模にスケールし,シーン再構築における不確実性をモデル化するための信頼スコアを導入する。
論文参考訳（メタデータ） (2024-10-10T10:10:03Z)
Learning Where to Look: Self-supervised Viewpoint Selection for Active Localization using Geometrical Information [68.10033984296247]
本稿では, 位置決めの精度を高めるために, 視点選択の重要性を強調し, アクティブな位置決め領域について検討する。私たちのコントリビューションは、リアルタイム操作用に設計されたシンプルなアーキテクチャ、自己教師付きデータトレーニング方法、および実世界のロボティクスアプリケーションに適した計画フレームワークにマップを一貫して統合する能力による、データ駆動型アプローチの使用に関するものです。
論文参考訳（メタデータ） (2024-07-22T12:32:09Z)
SymboSLAM: Semantic Map Generation in a Multi-Agent System [0.0]
サブシンボリックな人工知能手法は、環境タイプの分類と同時局所化とマッピングの分野を支配している。本稿では,共生的局所化とマッピングによる環境型分類への新たなアプローチ,SymboSLAMを提案し,その説明可能性のギャップを埋める。
論文参考訳（メタデータ） (2024-03-22T00:48:52Z)
Interactive Semantic Map Representation for Skill-based Visual Object Navigation [43.71312386938849]
本稿では,室内環境との相互作用にともなうシーンセマンティックマップの表現について紹介する。我々はこの表現をSkillTronと呼ばれる本格的なナビゲーション手法に実装した。提案手法により,ロボット探索の中間目標とオブジェクトナビゲーションの最終目標の両方を形成できる。
論文参考訳（メタデータ） (2023-11-07T16:30:12Z)
Weakly-Supervised Multi-Granularity Map Learning for Vision-and-Language Navigation [87.52136927091712]
我々は,ロボットエージェントが言語指導によって記述された経路をたどって,環境の中をナビゲートするよう訓練する,現実的かつ困難な問題に対処する。高精度かつ効率的なナビゲーションを実現するためには,環境オブジェクトの空間的位置と意味情報の両方を正確に表現した地図を構築することが重要である。より包括的にオブジェクトを表現するために,オブジェクトの細粒度(色,テクスチャなど)とセマンティッククラスの両方を含む多粒度マップを提案する。
論文参考訳（メタデータ） (2022-10-14T04:23:27Z)
Learning Semantics for Visual Place Recognition through Multi-Scale Attention [14.738954189759156]
本稿では,データの視覚的外観と意味的内容から,ロバストなグローバルな埋め込みを学習する最初のVPRアルゴリズムを提案する。さまざまなシナリオの実験により、この新しいアプローチが検証され、最先端の手法に対するパフォーマンスが実証される。
論文参考訳（メタデータ） (2022-01-24T14:13:12Z)
Lightweight Object-level Topological Semantic Mapping and Long-term Global Localization based on Graph Matching [19.706907816202946]
本稿では,高精度でロバストなオブジェクトレベルのマッピングとローカライズ手法を提案する。我々は、環境のランドマークをモデル化するために、意味情報と幾何学情報の両方を持つオブジェクトレベルの特徴を使用する。提案したマップに基づいて,新たな局所的シーングラフ記述子を構築することにより,ロバストなローカライゼーションを実現する。
論文参考訳（メタデータ） (2022-01-16T05:47:07Z)
Semantic Image Alignment for Vehicle Localization [111.59616433224662]
単眼カメラからのセマンティックセグメンテーションを用いた高密度セマンティックマップにおける車両位置推定手法を提案する。既存の視覚的ローカライゼーションアプローチとは対照的に、システムは追加のキーポイント機能、手作りのローカライゼーションランドマーク抽出器、高価なLiDARセンサーを必要としない。
論文参考訳（メタデータ） (2021-10-08T14:40:15Z)
SceneEncoder: Scene-Aware Semantic Segmentation of Point Clouds with A Learnable Scene Descriptor [51.298760338410624]
本研究では,グローバル情報の効果を高めるために,シーン認識型ガイダンスを付加するSceneEncoderモジュールを提案する。モジュールはシーン記述子を予測し、シーンに存在するオブジェクトのカテゴリを表現することを学習する。また,同じラベルを持つ隣接点に対する特徴の識別を伝搬する領域類似度損失を設計する。
論文参考訳（メタデータ） (2020-01-24T16:53:30Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。