Fugu-MT 論文翻訳(概要): 3DS-SLAM: A 3D Object Detection based Semantic SLAM towards Dynamic Indoor Environments

論文の概要: 3DS-SLAM: A 3D Object Detection based Semantic SLAM towards Dynamic Indoor Environments

arxiv url: http://arxiv.org/abs/2310.06385v1
Date: Tue, 10 Oct 2023 07:48:40 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-11 18:34:09.205823
Title: 3DS-SLAM: A 3D Object Detection based Semantic SLAM towards Dynamic Indoor Environments
Title（参考訳）: 3DS-SLAM:動的屋内環境に向けた3次元物体検出に基づく意味的SLAM
Authors: Ghanta Sai Krishna, Kundrapu Supriya, Sabur Baidya
Abstract要約: 3DS-SLAM, 3D Semantic SLAMを導入する。 3DS-SLAMは、意味的制約と幾何学的制約の両方を逐次解決する密結合アルゴリズムである。 TUM RGB-Dデータセットの動的シーケンスを平均98.01%改善している。
参考スコア（独自算出の注目度）: 1.4901625182926226
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The existence of variable factors within the environment can cause a decline in camera localization accuracy, as it violates the fundamental assumption of a static environment in Simultaneous Localization and Mapping (SLAM) algorithms. Recent semantic SLAM systems towards dynamic environments either rely solely on 2D semantic information, or solely on geometric information, or combine their results in a loosely integrated manner. In this research paper, we introduce 3DS-SLAM, 3D Semantic SLAM, tailored for dynamic scenes with visual 3D object detection. The 3DS-SLAM is a tightly-coupled algorithm resolving both semantic and geometric constraints sequentially. We designed a 3D part-aware hybrid transformer for point cloud-based object detection to identify dynamic objects. Subsequently, we propose a dynamic feature filter based on HDBSCAN clustering to extract objects with significant absolute depth differences. When compared against ORB-SLAM2, 3DS-SLAM exhibits an average improvement of 98.01% across the dynamic sequences of the TUM RGB-D dataset. Furthermore, it surpasses the performance of the other four leading SLAM systems designed for dynamic environments.
Abstract（参考訳）: 環境内の可変因子の存在は、同時局在化マッピング(slam)アルゴリズムにおける静的環境の基本的な仮定に違反するため、カメラの局在化精度が低下する可能性がある。動的環境に対する最近のセマンティックSLAMシステムは、2Dセマンティック情報にのみ依存するか、幾何学的情報にのみ依存するか、結果を緩く統合された方法で組み合わせる。本稿では,3dオブジェクト検出機能を備えた動的シーン用に調整した3dセマンティックスラム,3dセマンティックスラムを提案する。 3DS-SLAMは、意味的制約と幾何学的制約の両方を逐次解決する密結合アルゴリズムである。動的オブジェクトを識別する点クラウドに基づくオブジェクト検出のための3次元部分認識型ハイブリッドトランスを設計した。次に,HDBSCANクラスタリングに基づく動的特徴フィルタを提案する。 ORB-SLAM2と比較すると、3DS-SLAMはTUM RGB-Dデータセットの動的シーケンスの平均98.01%の改善を示す。さらに、動的環境向けに設計された他の4つのSLAMシステムの性能を上回る。

関連論文リスト

Dy3DGS-SLAM: Monocular 3D Gaussian Splatting SLAM for Dynamic Environments [5.050525952210101]
モノクロRGB入力を用いた動的シーンのための3次元ガウススティング(3DGS)SLAM法であるDy3DGS-SLAMを提案する。その結果,Dy3DGS-SLAMは動的環境下での最先端のトラッキングとレンダリングを実現することがわかった。
論文参考訳（メタデータ） (2025-06-06T10:43:41Z)
GSFF-SLAM: 3D Semantic Gaussian Splatting SLAM via Feature Field [18.520468059548865]
GSFF-SLAMは3次元ガウススプラッティングに基づく新しい意味論的SLAMシステムである。提案手法は, 様々な2次元先行情報, 特にスパース信号と雑音信号を用いた意味的再構成を支援する。 2D基底真理を利用する場合、GSFF-SLAMは95.03% mIoUで最先端のセマンティックセグメンテーション性能を達成する。
論文参考訳（メタデータ） (2025-04-28T01:21:35Z)
Embracing Dynamics: Dynamics-aware 4D Gaussian Splatting SLAM [0.0]
D4DGS-SLAMは動的環境のための4DGSマップ表現に基づく最初のSLAMである。時間次元をシーン表現に組み込むことで、D4DGS-SLAMは動的シーンの高品質な再構成を可能にする。提案手法は,カメラのポーズトラッキングとマップの品質の両方において,最先端の手法よりも優れていることを示す。
論文参考訳（メタデータ） (2025-04-07T08:56:35Z)
WildGS-SLAM: Monocular Gaussian Splatting SLAM in Dynamic Environments [48.51530726697405]
WildGS-SLAMは、動的環境を扱うために設計された、堅牢で効率的な単分子RGB SLAMシステムである。本研究では,浅い多層パーセプトロンとDINOv2の特徴によって予測される不確実性マップを導入し,追跡とマッピングの両方において動的物体除去を誘導する。その結果,WildGS-SLAMの動的環境における性能は最先端の手法に比べて優れていた。
論文参考訳（メタデータ） (2025-04-04T19:19:40Z)
PanoSLAM: Panoptic 3D Scene Reconstruction via Gaussian SLAM [105.01907579424362]
PanoSLAMは、幾何学的再構成、3Dセマンティックセマンティックセマンティクス、3Dインスタンスセマンティクスを統合フレームワークに統合する最初のSLAMシステムである。初めて、RGB-Dビデオから直接、オープンワールド環境のパノプティカル3D再構成を実現する。
論文参考訳（メタデータ） (2024-12-31T08:58:10Z)
V3D-SLAM: Robust RGB-D SLAM in Dynamic Environments with 3D Semantic Geometry Voting [1.3493547928462395]
動体とカメラのポーズの相関関係から,高度にダイナミックな環境下での同時位置決めとマッピング(SLAM)は困難である。 2つの軽量再評価段階を経て移動物体を除去するロバストな手法 V3D-SLAM を提案する。 TUM RGB-Dベンチマーク実験により,直近のSLAM法よりも高い性能を示した。
論文参考訳（メタデータ） (2024-10-15T21:08:08Z)
Dynamic Scene Understanding through Object-Centric Voxelization and Neural Rendering [57.895846642868904]
オブジェクト中心学習が可能な動的シーンのための3次元生成モデルDynaVol-Sを提案する。ボキセル化は、個々の空間的位置において、物体ごとの占有確率を推定する。提案手法は2次元セマンティックな特徴を統合して3次元セマンティック・グリッドを作成し,複数の不整合ボクセル・グリッドを通してシーンを表現する。
論文参考訳（メタデータ） (2024-07-30T15:33:58Z)
HUGS: Holistic Urban 3D Scene Understanding via Gaussian Splatting [53.6394928681237]
RGB画像に基づく都市景観の全体的理解は、難しいが重要な問題である。我々の主な考え方は、静的な3Dガウスと動的なガウスの組合せを用いた幾何学、外観、意味論、運動の合同最適化である。提案手法は,2次元および3次元のセマンティック情報を高精度に生成し,新たな視点をリアルタイムに描画する機能を提供する。
論文参考訳（メタデータ） (2024-03-19T13:39:05Z)
DDN-SLAM: Real-time Dense Dynamic Neural Implicit SLAM [5.267859554944985]
DDN-SLAMは,意味的特徴を統合した最初のリアルタイム高密度ニューラルネットワーク暗黙的SLAMシステムである。既存の暗黙的SLAMシステムと比較して、動的データセットの追跡結果は平均軌道誤差(ATE)の精度が平均90%向上していることを示している。
論文参考訳（メタデータ） (2024-01-03T05:42:17Z)
NID-SLAM: Neural Implicit Representation-based RGB-D SLAM in dynamic environments [9.706447888754614]
動的環境におけるニューラルSLAMの性能を大幅に向上させるNID-SLAMを提案する。本稿では, セマンティックマスクにおける不正確な領域, 特に辺縁領域における不正確な領域を強化するための新しいアプローチを提案する。また,ダイナミックシーンの選択戦略を導入し,大規模オブジェクトに対するカメラトラッキングの堅牢性を高める。
論文参考訳（メタデータ） (2024-01-02T12:35:03Z)
NeuSE: Neural SE(3)-Equivariant Embedding for Consistent Spatial Understanding with Objects [53.111397800478294]
本稿では,ニューラルSE(3)-等価なオブジェクトの埋め込みであるNeuSEを紹介する。 NeuSE は完全なオブジェクトモデルのためのコンパクトな点クラウドサロゲートとして機能する。提案するSLAMパラダイムは,物体形状やポーズ特性にNeuSEを用いて,通常のSLAMシステムと独立に,あるいは連携して動作することができる。
論文参考訳（メタデータ） (2023-03-13T17:30:43Z)
Using Detection, Tracking and Prediction in Visual SLAM to Achieve Real-time Semantic Mapping of Dynamic Scenarios [70.70421502784598]
RDS-SLAMは、一般的に使用されているIntel Core i7 CPUのみを使用して、動的シナリオのためのオブジェクトレベルでのセマンティックマップをリアルタイムで構築することができる。我々は, TUM RGB-DデータセットにおけるRDS-SLAMを評価し, 動的シナリオにおいて, RDS-SLAMはフレームあたり30.3msで動作可能であることを示した。
論文参考訳（メタデータ） (2022-10-10T11:03:32Z)
MOTSLAM: MOT-assisted monocular dynamic SLAM using single-view depth estimation [5.33931801679129]
MOTSLAMは動的ビジュアルSLAMシステムであり、動的オブジェクトのポーズとバウンディングボックスの両方を追跡する単分子構成を持つ。 KITTIデータセットを用いた実験により,カメラのエゴモーションとモノラルな動的SLAMでの物体追跡の両方において,我々のシステムが最高の性能を示した。
論文参考訳（メタデータ） (2022-10-05T06:07:10Z)
Visual-Inertial Multi-Instance Dynamic SLAM with Object-level Relocalisation [14.302118093865849]
密結合型ビジュアル・慣性オブジェクトレベルのマルチインスタンス動的SLAMシステムを提案する。カメラのポーズ、速度、IMUバイアスを強く最適化し、環境の高密度な3D再構成オブジェクトレベルマップを構築することができる。
論文参考訳（メタデータ） (2022-08-08T17:13:24Z)
DOT: Dynamic Object Tracking for Visual SLAM [83.69544718120167]
DOTはインスタンスセグメンテーションとマルチビュー幾何を組み合わせて、動的オブジェクトのマスクを生成する。実際にどのオブジェクトが動いているかを判断するために、DOTは、潜在的にダイナミックなオブジェクトの最初のインスタンスを抽出し、次に推定されたカメラモーションで、測光再投射誤差を最小限にして、そのようなオブジェクトを追跡する。提案手法はORB-SLAM 2の精度とロバスト性を大幅に向上することを示す。
論文参考訳（メタデータ） (2020-09-30T18:36:28Z)
Reinforced Axial Refinement Network for Monocular 3D Object Detection [160.34246529816085]
モノクロ3次元物体検出は、2次元入力画像から物体の位置と特性を抽出することを目的としている。従来のアプローチでは、空間から3D境界ボックスをサンプリングし、対象オブジェクトと各オブジェクトの関係を推定するが、有効サンプルの確率は3D空間で比較的小さい。我々は,まず最初の予測から始めて,各ステップで1つの3dパラメータだけを変えて,基礎的真理に向けて徐々に洗練することを提案する。これは、いくつかのステップの後に報酬を得るポリシーを設計する必要があるため、最適化するために強化学習を採用します。
論文参考訳（メタデータ） (2020-08-31T17:10:48Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。