論文の概要: Transformation & Translation Occupancy Grid Mapping: 2-Dimensional Deep Learning Refined SLAM
- arxiv url: http://arxiv.org/abs/2504.19654v1
- Date: Mon, 28 Apr 2025 10:13:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:54.399609
- Title: Transformation & Translation Occupancy Grid Mapping: 2-Dimensional Deep Learning Refined SLAM
- Title(参考訳): トランスフォーメーション・アンド・トランスフォーメーション・オーカバンシー・グリッドマッピング:2次元Deep Learning Refined SLAM
- Authors: Leon Davies, Baihua Li, Mohamad Saada, Simon Sølvsten, Qinggang Meng,
- Abstract要約: OGM(Occupancy Grid Mapping)は、しばしば騒々しく不明瞭な結果を生成する。
これは、証拠に基づく写像が不確実な観測に基づいて地図を表すという事実による。
我々は新しいトランスフォーメーションとトランスフォーメーション機能グリッドマッピング(TT-OGM)を提案する。
GAN(Generative Adversarial Networks)を用いて,3次元SLAMから2次元世界への高精度でロバストなポーズ推定手法を適用・実現し,地図品質を向上させる。
- 参考スコア(独自算出の注目度): 3.165861186278497
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: SLAM (Simultaneous Localisation and Mapping) is a crucial component for robotic systems, providing a map of an environment, the current location and previous trajectory of a robot. While 3D LiDAR SLAM has received notable improvements in recent years, 2D SLAM lags behind. Gradual drifts in odometry and pose estimation inaccuracies hinder modern 2D LiDAR-odometry algorithms in large complex environments. Dynamic robotic motion coupled with inherent estimation based SLAM processes introduce noise and errors, degrading map quality. Occupancy Grid Mapping (OGM) produces results that are often noisy and unclear. This is due to the fact that evidence based mapping represents maps according to uncertain observations. This is why OGMs are so popular in exploration or navigation tasks. However, this also limits OGMs' effectiveness for specific mapping based tasks such as floor plan creation in complex scenes. To address this, we propose our novel Transformation and Translation Occupancy Grid Mapping (TT-OGM). We adapt and enable accurate and robust pose estimation techniques from 3D SLAM to the world of 2D and mitigate errors to improve map quality using Generative Adversarial Networks (GANs). We introduce a novel data generation method via deep reinforcement learning (DRL) to build datasets large enough for training a GAN for SLAM error correction. We demonstrate our SLAM in real-time on data collected at Loughborough University. We also prove its generalisability on a variety of large complex environments on a collection of large scale well-known 2D occupancy maps. Our novel approach enables the creation of high quality OGMs in complex scenes, far surpassing the capabilities of current SLAM algorithms in terms of quality, accuracy and reliability.
- Abstract(参考訳): SLAM(Simultaneous Localisation and Mapping)は、ロボットシステムにとって重要なコンポーネントであり、環境、現在位置、およびロボットの以前の軌道の地図を提供する。
3D LiDAR SLAMは近年顕著に改善されているが、2D SLAMは遅れている。
大規模な複雑な環境での2次元LiDAR-オドメトリーアルゴリズムを妨げている。
固有推定に基づくSLAMプロセスと組み合わせた動的ロボット動作は、ノイズとエラーを導入し、マップの品質を劣化させる。
OGM(Occupancy Grid Mapping)は、しばしば騒々しく不明瞭な結果を生成する。
これは、証拠に基づく写像が不確実な観測に基づいて地図を表すという事実による。
これが、OGMが探索やナビゲーションのタスクでとても人気がある理由です。
しかし、これは複雑なシーンにおけるフロアプラン作成のような特定のマッピングベースのタスクに対するOGMの有効性を制限している。
そこで本研究では,TT-OGM(Transform and Translation Occupancy Grid Mapping)を提案する。
我々は,3次元SLAMから2次元世界への高精度かつ堅牢なポーズ推定手法を適用し,GANを用いた地図品質の向上を図る。
本稿では, SLAM誤り訂正のためのGANを訓練するのに十分なデータセットを構築するために, 深層強化学習(DRL)を用いた新しいデータ生成手法を提案する。
Loughborough Universityで収集したデータに基づいてリアルタイムでSLAMを実演する。
また、大規模でよく知られた2次元占有マップのコレクション上で、様々な複雑な環境において、その一般化可能性を証明する。
我々の新しいアプローチは、複雑なシーンにおける高品質なOGMの作成を可能にし、品質、精度、信頼性の点で現在のSLAMアルゴリズムの能力をはるかに上回っている。
関連論文リスト
- GAN-SLAM: Real-Time GAN Aided Floor Plan Creation Through SLAM [3.165861186278497]
我々は,新しいSLAMアプローチであるGAN-SLAMを紹介した。
我々は3次元SLAMで一般的に使用される正確なポーズ推定手法を2次元形式に適応し、統合する。
その結果、最小限のノイズと誤差で、マップの忠実度と品質が大幅に向上した。
論文 参考訳(メタデータ) (2025-04-28T10:13:38Z) - GEAL: Generalizable 3D Affordance Learning with Cross-Modal Consistency [50.11520458252128]
既存の3Dアベイランス学習手法は、注釈付きデータに制限があるため、一般化と堅牢性に苦慮している。
本稿では,大規模事前学習型2Dモデルを活用することで,3次元アベイランス学習の一般化と堅牢性を高めるための新しいフレームワークであるGEALを提案する。
GEALは、既存のメソッドと、新しいオブジェクトカテゴリ、および破損したデータにおいて、一貫して優れています。
論文 参考訳(メタデータ) (2024-12-12T17:59:03Z) - MAGiC-SLAM: Multi-Agent Gaussian Globally Consistent SLAM [23.318966306555915]
同時ローカライゼーションとマッピング(SLAM)システムは、拡張現実、ロボティクス、自律運転など、コンピュータビジョンで広く使われている。
近年の研究では、分散ニューラルシーン表現を用いてこの問題に対処している。
本稿では,厳格に変形可能な3次元ガウス型シーン表現を提案する。
合成および実世界のデータセット上でMAGiC-SLAMを評価し,その精度と精度について検討した。
論文 参考訳(メタデータ) (2024-11-25T08:34:01Z) - GeoLRM: Geometry-Aware Large Reconstruction Model for High-Quality 3D Gaussian Generation [65.33726478659304]
GeoLRM(Geometry-Aware Large Restruction Model)は、512kガウスと21の入力画像で11GBのGPUメモリで高品質な資産を予測できる手法である。
従来の作品では、3D構造の本質的な空間性は無視されており、3D画像と2D画像の間の明示的な幾何学的関係は利用されていない。
GeoLRMは、3Dポイントを直接処理し、変形可能なクロスアテンション機構を使用する新しい3D対応トランスフォーマー構造を導入することで、これらの問題に対処する。
論文 参考訳(メタデータ) (2024-06-21T17:49:31Z) - Splat-SLAM: Globally Optimized RGB-only SLAM with 3D Gaussians [87.48403838439391]
3D Splattingは、RGBのみの高密度SLAMの幾何学と外観の強力な表現として登場した。
本稿では,高密度な3次元ガウス写像表現を持つRGBのみのSLAMシステムを提案する。
Replica、TUM-RGBD、ScanNetのデータセットに対する実験は、グローバルに最適化された3Dガウスの有効性を示している。
論文 参考訳(メタデータ) (2024-05-26T12:26:54Z) - MM3DGS SLAM: Multi-modal 3D Gaussian Splatting for SLAM Using Vision, Depth, and Inertial Measurements [59.70107451308687]
カメラ画像と慣性測定による地図表現に3Dガウスアンを用いることで、精度の高いSLAMが実現できることを示す。
我々の手法であるMM3DGSは、より高速なスケール認識と軌道追跡の改善により、事前レンダリングの限界に対処する。
また,カメラと慣性測定ユニットを備えた移動ロボットから収集したマルチモーダルデータセットUT-MMもリリースした。
論文 参考訳(メタデータ) (2024-04-01T04:57:41Z) - DeepMIF: Deep Monotonic Implicit Fields for Large-Scale LiDAR 3D Mapping [46.80755234561584]
最近の学習ベース手法は,3次元シーンの表面を近似するために,ニューラル暗黙表現と最適化可能な特徴グリッドを統合している。
この作業では、LiDARデータを正確にフィッティングすることから離れ、代わりにネットワークが3D空間で定義された非メトリックモノトニック暗黙フィールドを最適化する。
提案アルゴリズムは,Mai City, Newer College, KITTIベンチマークで得られた複数の量的および知覚的測定値と視覚的結果を用いて,高品質な高密度3Dマッピング性能を実現する。
論文 参考訳(メタデータ) (2024-03-26T09:58:06Z) - Loopy-SLAM: Dense Neural SLAM with Loop Closures [53.11936461015725]
ポーズをグローバルに最適化するLoopy-SLAMと高密度3Dモデルを導入する。
我々は,データ駆動のポイントベースサブマップ生成手法を用いてフレーム・ツー・モデル追跡を行い,グローバルな位置認識を行うことで,オンラインのループクロージャをトリガーする。
合成Replicaおよび実世界のTUM-RGBDおよびScanNetデータセットの評価は、既存の高密度ニューラルネットワークRGBD SLAM法と比較して、追跡、マッピング、レンダリングの精度の競争力または優れた性能を示す。
論文 参考訳(メタデータ) (2024-02-14T18:18:32Z) - Volumetric Semantically Consistent 3D Panoptic Mapping [77.13446499924977]
非構造環境における自律エージェントに適したセマンティック3Dマップを生成することを目的としたオンライン2次元から3次元のセマンティック・インスタンスマッピングアルゴリズムを提案する。
マッピング中にセマンティック予測の信頼性を統合し、セマンティックおよびインスタンス一貫性のある3D領域を生成する新しい方法を導入する。
提案手法は,パブリックな大規模データセット上での最先端の精度を実現し,多くの広く使用されているメトリクスを改善した。
論文 参考訳(メタデータ) (2023-09-26T08:03:10Z) - SHINE-Mapping: Large-Scale 3D Mapping Using Sparse Hierarchical Implicit
Neural Representations [37.733802382489515]
本稿では, 3次元LiDAR計測を用いて, 暗示表現を用いた大規模3次元再構成を実現する際の課題について述べる。
我々はオクツリーに基づく階層構造を通じて暗黙的な特徴を学習し、保存する。
我々の3D再構成は、現在の最先端3Dマッピング法よりも正確で、完全で、メモリ効率が高いことを示す。
論文 参考訳(メタデータ) (2022-10-05T14:38:49Z) - Learning to Drop Points for LiDAR Scan Synthesis [5.132259673802809]
3Dシーンのジェネラティブモデリングは、モバイルロボットが信頼できない観察を改善するための重要なトピックです。
点雲に関する既存の研究のほとんどは、小さく均一な密度のデータに焦点を当てている。
移動ロボットで広く使われている3次元LiDAR点雲は、多数の点と様々な密度のために扱いにくい。
本論文では,リアルなLiDARデータを改良した2次元表現として合成する,ジェネレーティブ・アドバーサリ・ネットワークに基づく新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-23T21:53:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。