論文の概要: Semantic Visual Simultaneous Localization and Mapping: A Survey
- arxiv url: http://arxiv.org/abs/2209.06428v1
- Date: Wed, 14 Sep 2022 05:45:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-15 13:33:36.696603
- Title: Semantic Visual Simultaneous Localization and Mapping: A Survey
- Title(参考訳): セマンティックな視覚的同時配置とマッピング:サーベイ
- Authors: Kaiqi Chen, Jianhua Zhang, Jialing Liu, Qiyi Tong, Ruyu Liu, Shengyong
Chen
- Abstract要約: 本稿ではまず, セマンティックvSLAMの開発について概観し, その強みと相違点に着目する。
次に、意味情報の抽出と関連付け、意味情報の応用、意味vSLAMの利点の3つについて検討する。
最後に,セマンティックvSLAMの今後の発展に向けた青写真を提供する今後の方向性について論じる。
- 参考スコア(独自算出の注目度): 18.372996585079235
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual Simultaneous Localization and Mapping (vSLAM) has achieved great
progress in the computer vision and robotics communities, and has been
successfully used in many fields such as autonomous robot navigation and AR/VR.
However, vSLAM cannot achieve good localization in dynamic and complex
environments. Numerous publications have reported that, by combining with the
semantic information with vSLAM, the semantic vSLAM systems have the capability
of solving the above problems in recent years. Nevertheless, there is no
comprehensive survey about semantic vSLAM. To fill the gap, this paper first
reviews the development of semantic vSLAM, explicitly focusing on its strengths
and differences. Secondly, we explore three main issues of semantic vSLAM: the
extraction and association of semantic information, the application of semantic
information, and the advantages of semantic vSLAM. Then, we collect and analyze
the current state-of-the-art SLAM datasets which have been widely used in
semantic vSLAM systems. Finally, we discuss future directions that will provide
a blueprint for the future development of semantic vSLAM.
- Abstract(参考訳): VSLAM(Visual Simultaneous Localization and Mapping)はコンピュータビジョンやロボティクスのコミュニティにおいて大きな進歩を遂げており、自律型ロボットナビゲーションやAR/VRといった多くの分野で成功している。
しかし、vSLAMは動的で複雑な環境ではうまく局在化できない。
多くの出版物が、セマンティック情報とvSLAMを組み合わせることで、近年、セマンティックvSLAMシステムは上記の問題を解決する能力を持っていると報告している。
それにもかかわらず、セマンティックvslamに関する包括的な調査はない。
このギャップを埋めるために,本論文はまずセマンティックvSLAMの開発をレビューし,その強みと相違点に着目した。
次に,意味的情報抽出と関連付け,意味的情報の応用,意味的vslamの利点という,semantic vslamの3つの主要な課題について考察する。
次に、セマンティックvSLAMシステムで広く使われている最先端SLAMデータセットを収集し、分析する。
最後に,セマンティックvSLAMの今後の発展に向けた青写真を提供する今後の方向性について論じる。
関連論文リスト
- UnitedVLN: Generalizable Gaussian Splatting for Continuous Vision-Language Navigation [71.97405667493477]
我々は,UnitedVLNと呼ばれる,新しい汎用3DGSベースの事前学習パラダイムを導入する。
エージェントは、高忠実度360度ビジュアルイメージとセマンティック特徴を統一してレンダリングすることで、将来の環境をよりよく探索することができる。
UnitedVLNは既存のVLN-CEベンチマークで最先端の手法より優れている。
論文 参考訳(メタデータ) (2024-11-25T02:44:59Z) - Hi-SLAM: Scaling-up Semantics in SLAM with a Hierarchically Categorical Gaussian Splatting [28.821276113559346]
Hi-SLAMは、新しい階層的分類表現を特徴とするセマンティックな3次元ガウススプラッティングSLAM法である。
正確なグローバルな3Dセマンティックマッピング、スケールアップ機能、および3D世界での明示的なセマンティックラベル予測を可能にする。
論文 参考訳(メタデータ) (2024-09-19T07:18:41Z) - SLAck: Semantic, Location, and Appearance Aware Open-Vocabulary Tracking [89.43370214059955]
Open-vocabulary Multiple Object Tracking (MOT)は、トレーニングセットにはない新しいカテゴリにトラッカーを一般化することを目的としている。
我々は,連合の初期段階において,意味論,位置,出現の先行を共同で検討する統一的な枠組みを提案する。
提案手法は,異なるキューを融合するための複雑な後処理を排除し,大規模オープン語彙追跡のための関連性能を大幅に向上させる。
論文 参考訳(メタデータ) (2024-09-17T14:36:58Z) - When LLMs step into the 3D World: A Survey and Meta-Analysis of 3D Tasks via Multi-modal Large Language Models [113.18524940863841]
本調査では,大規模言語モデルによる3Dデータの処理,理解,生成を可能にする方法論の概要について概説する。
我々の研究は、点雲からニューラル放射場(NeRF)まで、様々な3次元データ表現にまたがっている。
3Dシーン理解、キャプション、質問応答、対話などのタスクにおいて、LLMとの統合を検討する。
論文 参考訳(メタデータ) (2024-05-16T16:59:58Z) - TextSLAM: Visual SLAM with Semantic Planar Text Features [8.8100408194584]
本稿では,テキストオブジェクトをセマンティックな特徴として扱うことによって,テキストオブジェクトを密に統合する新しいビジュアルSLAM法を提案する。
地上の真理データを用いて様々な場面で本手法を検証した。
その結果、テクスチャ機能の統合により、日夜の画像にマッチするSLAMシステムがより優れていることがわかった。
論文 参考訳(メタデータ) (2023-05-17T08:16:26Z) - Visual SLAM: What are the Current Trends and What to Expect? [0.0]
視力に基づくセンサは、SLAMシステムにおいて、大幅な性能、精度、効率の向上を示した。
VSLAMs領域で発行された45件のインパクトのある論文について,詳細な文献調査を行った。
論文 参考訳(メタデータ) (2022-10-19T11:56:32Z) - Det-SLAM: A semantic visual SLAM for highly dynamic scenes using
Detectron2 [0.0]
本研究では,視覚的SLAMシステムであるORB-SLAM3とディテクトロン2を組み合わせて,Det-SLAMシステムを提案する。
Det-SLAMは従来の動的SLAMシステムよりも弾力性が高く、動的屋内シナリオにおけるカメラ姿勢推定誤差を低減できる。
論文 参考訳(メタデータ) (2022-10-01T13:25:11Z) - A Review on Visual-SLAM: Advancements from Geometric Modelling to
Learning-based Semantic Scene Understanding [3.0839245814393728]
自律移動ロボットの基本問題の一つに、同時局所マッピング(SLAM)がある。
Visual-SLAMは、地図の表現を収集し、検知するために、移動ロボットから様々なセンサーを使用する。
ディープラーニング技術などのコンピュータビジョンの最近の進歩は、Visual-SLAM問題に対処するためのデータ駆動型アプローチを提供してきた。
論文 参考訳(メタデータ) (2022-09-12T13:11:25Z) - Boosting Video-Text Retrieval with Explicit High-Level Semantics [115.66219386097295]
VTRのための新しい視覚言語整合モデルHiSEを提案する。
明示的なハイレベルなセマンティクスを取り入れることで、クロスモーダル表現を改善する。
提案手法は,3つのベンチマークデータセット上での最先端手法よりも優れた性能を実現する。
論文 参考訳(メタデータ) (2022-08-08T15:39:54Z) - NICE-SLAM: Neural Implicit Scalable Encoding for SLAM [112.6093688226293]
NICE-SLAMは階層的なシーン表現を導入することでマルチレベルローカル情報を組み込んだ高密度SLAMシステムである。
最近の暗黙的SLAMシステムと比較して、私たちのアプローチはよりスケーラブルで効率的で堅牢です。
論文 参考訳(メタデータ) (2021-12-22T18:45:44Z) - Named Entity Recognition for Social Media Texts with Semantic
Augmentation [70.44281443975554]
名前付きエンティティ認識のための既存のアプローチは、短いテキストと非公式テキストで実行される場合、データ空間の問題に悩まされる。
そこで我々は,NER によるソーシャルメディアテキストに対するニューラルベースアプローチを提案し,ローカルテキストと拡張セマンティクスの両方を考慮に入れた。
論文 参考訳(メタデータ) (2020-10-29T10:06:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。