論文の概要: Dynamic semantic VSLAM with known and unknown objects
- arxiv url: http://arxiv.org/abs/2412.14359v1
- Date: Wed, 18 Dec 2024 21:55:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-20 13:31:34.883370
- Title: Dynamic semantic VSLAM with known and unknown objects
- Title(参考訳): 未知と未知の物体を用いた動的意味論的VSLAM
- Authors: Sanghyoup Gu, Ratnesh Kumar,
- Abstract要約: 本稿では,未知の物体と未知の物体の両方の存在下での動的特徴を検出できる特徴量に基づくセマンティックVSLAMを提案する。
我々は、教師なしセグメンテーションネットワークを使用し、次に、オブジェクタ検出器を使用して、それらの中の既知のクラスを識別する。
次に、これを計算された高次光フロー情報と組み合わせて、未知のオブジェクトクラスと未知のオブジェクトクラスの両方の静的および動的セグメンテーションを識別する。
- 参考スコア(独自算出の注目度): 0.5683447641102242
- License:
- Abstract: Traditional Visual Simultaneous Localization and Mapping (VSLAM) systems assume a static environment, which makes them ineffective in highly dynamic settings. To overcome this, many approaches integrate semantic information from deep learning models to identify dynamic regions within images. However, these methods face a significant limitation as a supervised model cannot recognize objects not included in the training datasets. This paper introduces a novel feature-based Semantic VSLAM capable of detecting dynamic features in the presence of both known and unknown objects. By employing an unsupervised segmentation network, we achieve unlabeled segmentation, and next utilize an objector detector to identify any of the known classes among those. We then pair this with the computed high-gradient optical-flow information to next identify the static versus dynamic segmentations for both known and unknown object classes. A consistency check module is also introduced for further refinement and final classification into static versus dynamic features. Evaluations using public datasets demonstrate that our method offers superior performance than traditional VSLAM when unknown objects are present in the images while still matching the performance of the leading semantic VSLAM techniques when the images contain only the known objects
- Abstract(参考訳): 従来のVisual Simultaneous Localization and Mapping (VSLAM)システムは静的環境を前提としており、非常にダイナミックな設定では非効率である。
これを解決するために、多くのアプローチがディープラーニングモデルからの意味情報を統合し、画像内の動的領域を識別する。
しかし、これらの手法はトレーニングデータセットに含まれないオブジェクトを教師付きモデルでは認識できないため、かなりの制限に直面している。
本稿では,未知の物体と未知の物体の両方の存在下での動的特徴を検出できる特徴量に基づくセマンティックVSLAMを提案する。
教師なしセグメンテーションネットワークを用いることで、ラベルなしセグメンテーションを実現し、次に、オブジェクタ検出器を用いてそれらの中の既知のクラスを識別する。
次に、これを計算された高次光フロー情報と組み合わせて、未知のオブジェクトクラスと未知のオブジェクトクラスの両方の静的および動的セグメンテーションを識別する。
整合性チェックモジュールも導入され、さらなる改良と静的機能と動的機能への最終分類が行われた。
公開データセットを用いた評価では、画像中に未知のオブジェクトが存在する場合の従来のVSLAMよりも優れた性能を示し、画像が既知のオブジェクトのみを含む場合の主要なセマンティックVSLAM技術の性能は相変わらず一致している。
関連論文リスト
- Hierarchical Graph Interaction Transformer with Dynamic Token Clustering for Camouflaged Object Detection [57.883265488038134]
本稿では,HGINetと呼ばれる階層的なグラフ相互作用ネットワークを提案する。
このネットワークは、階層的トークン化機能間の効果的なグラフ相互作用を通じて、知覚不能なオブジェクトを発見することができる。
本実験は,既存の最先端手法と比較して,HGINetの優れた性能を示すものである。
論文 参考訳(メタデータ) (2024-08-27T12:53:25Z) - Dynamic Against Dynamic: An Open-set Self-learning Framework [44.81030487874529]
オープンセット認識では、既存のメソッドは既知のクラスを使用して静的に固定された決定境界を学習し、未知のクラスを拒否する。
本稿では,オープンセットの自己学習フレームワークが対応する,動的に変化するオープンセット世界に対する動的手法という,動的アイデアに対する新しい動的手法を提案する。
論文 参考訳(メタデータ) (2024-04-27T08:40:33Z) - Unsupervised Recognition of Unknown Objects for Open-World Object
Detection [28.787586991713535]
Open-World Object Detection (OWOD) はオブジェクト検出問題を現実的でダイナミックなシナリオに拡張する。
現在のOWODモデル(OREやOW-DETRなど)は、高い客観性スコアを持つ擬似ラベル領域に注目する。
本稿では,未知の物体を認識するために,教師なしの識別モデルを学ぶ新しい手法を提案する。
論文 参考訳(メタデータ) (2023-08-31T08:17:29Z) - Open World DETR: Transformer based Open World Object Detection [60.64535309016623]
そこで我々は,Deformable DETRに基づくオープンワールドオブジェクト検出のための2段階学習手法Open World DETRを提案する。
モデルのクラス固有のコンポーネントを多視点の自己ラベル戦略と一貫性制約で微調整する。
提案手法は、他の最先端のオープンワールドオブジェクト検出方法よりも大きなマージンで優れている。
論文 参考訳(メタデータ) (2022-12-06T13:39:30Z) - Contrastive Object Detection Using Knowledge Graph Embeddings [72.17159795485915]
一つのホットアプローチで学習したクラス埋め込みの誤差統計と、自然言語処理や知識グラフから意味的に構造化された埋め込みを比較した。
本稿では,キーポイントベースおよびトランスフォーマーベースオブジェクト検出アーキテクチャの知識埋め込み設計を提案する。
論文 参考訳(メタデータ) (2021-12-21T17:10:21Z) - Learning to Segment Dynamic Objects using SLAM Outliers [5.4310785842119795]
本稿では,SLAMアウトレイラを用いて動的オブジェクトのセグメントを自動的に学習する手法を提案する。
トレーニングには動的オブジェクトごとに1つのモノクラーシーケンスしか必要とせず、SLAMアウトリーチを使用して動的オブジェクトをローカライズし、マスクを作成し、これらのマスクを使用してセマンティックセグメンテーションネットワークをトレーニングする。
論文 参考訳(メタデータ) (2020-11-12T08:36:54Z) - Synthesizing the Unseen for Zero-shot Object Detection [72.38031440014463]
そこで本研究では,視覚領域における視覚的特徴と視覚的対象の両方を学習するために,視覚的特徴を合成することを提案する。
クラスセマンティックスを用いた新しい生成モデルを用いて特徴を生成するだけでなく,特徴を識別的に分離する。
論文 参考訳(メタデータ) (2020-10-19T12:36:11Z) - Empty Cities: a Dynamic-Object-Invariant Space for Visual SLAM [6.693607456009373]
本稿では,シーンの静的な画像を得るためのデータ駆動型アプローチを提案する。
本研究では,都市環境の画像を局所化とマッピングに適したリアルな静的フレームに変換するためのエンドツーエンドのディープラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2020-10-15T10:31:12Z) - DOT: Dynamic Object Tracking for Visual SLAM [83.69544718120167]
DOTはインスタンスセグメンテーションとマルチビュー幾何を組み合わせて、動的オブジェクトのマスクを生成する。
実際にどのオブジェクトが動いているかを判断するために、DOTは、潜在的にダイナミックなオブジェクトの最初のインスタンスを抽出し、次に推定されたカメラモーションで、測光再投射誤差を最小限にして、そのようなオブジェクトを追跡する。
提案手法はORB-SLAM 2の精度とロバスト性を大幅に向上することを示す。
論文 参考訳(メタデータ) (2020-09-30T18:36:28Z) - DyStaB: Unsupervised Object Segmentation via Dynamic-Static
Bootstrapping [72.84991726271024]
我々は,コヒーレントなシーン全体を移動しているように見えるシーンの画像の一部を検出し,分割するための教師なしの手法について述べる。
提案手法はまず,セグメント間の相互情報を最小化することにより,運動場を分割する。
セグメントを使用してオブジェクトモデルを学習し、静的なイメージの検出に使用することができる。
論文 参考訳(メタデータ) (2020-08-16T22:05:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。