論文の概要: Improved Real-Time Monocular SLAM Using Semantic Segmentation on
Selective Frames
- arxiv url: http://arxiv.org/abs/2105.00114v1
- Date: Fri, 30 Apr 2021 22:34:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-04 14:05:53.051385
- Title: Improved Real-Time Monocular SLAM Using Semantic Segmentation on
Selective Frames
- Title(参考訳): 選択フレームのセマンティックセグメンテーションによるリアルタイム単眼SLAMの改善
- Authors: Jinkyu Lee, Muhyun Back, Sung Soo Hwang and Il Yong Chun
- Abstract要約: 先進的運転支援システムと自律運転システムでは単眼同時位置決めマッピング(slam)が登場している。
本稿では,深層学習に基づくセマンティックセグメンテーションを用いたリアルタイム一眼SLAMの改良を提案する。
6本の映像列を用いた実験により,提案方式により精度の高い軌道追尾精度が得られた。
- 参考スコア(独自算出の注目度): 15.455647477995312
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Monocular simultaneous localization and mapping (SLAM) is emerging in
advanced driver assistance systems and autonomous driving, because a single
camera is cheap and easy to install. Conventional monocular SLAM has two major
challenges leading inaccurate localization and mapping. First, it is
challenging to estimate scales in localization and mapping. Second,
conventional monocular SLAM uses inappropriate mapping factors such as dynamic
objects and low-parallax ares in mapping. This paper proposes an improved
real-time monocular SLAM that resolves the aforementioned challenges by
efficiently using deep learning-based semantic segmentation. To achieve the
real-time execution of the proposed method, we apply semantic segmentation only
to downsampled keyframes in parallel with mapping processes. In addition, the
proposed method corrects scales of camera poses and three-dimensional (3D)
points, using estimated ground plane from road-labeled 3D points and the real
camera height. The proposed method also removes inappropriate corner features
labeled as moving objects and low parallax areas. Experiments with six video
sequences demonstrate that the proposed monocular SLAM system achieves
significantly more accurate trajectory tracking accuracy compared to
state-of-the-art monocular SLAM and comparable trajectory tracking accuracy
compared to state-of-the-art stereo SLAM.
- Abstract(参考訳): 1台のカメラが安価で簡単にインストールできるため、先進的な運転支援システムや自動運転システムでは単眼同時ローカライズ・マッピング(slam)が登場している。
従来の単細胞スラムは、不正確な局在化とマッピングの2つの大きな課題がある。
まず、ローカライゼーションとマッピングのスケールを見積もることは困難である。
第二に、従来の単分子SLAMはマッピングにおいて動的対象や低パララックス等不適切なマッピング因子を用いる。
本稿では,ディープラーニングに基づくセマンティクスセグメンテーションを効率的に利用することにより,上記課題を解決するためのリアルタイム単眼スラムの改良を提案する。
提案手法のリアルタイム実行を実現するために,ダウンサンプリングされたキーフレームに対してのみ,マッピングプロセスと並行して意味セグメンテーションを適用する。
さらに,道路標識3D点と実カメラの高さから推定した地上面を用いて,カメラポーズと3次元3D点のスケールを補正する手法を提案する。
提案手法は,移動物体および低パララックス領域とラベル付けされた不適切なコーナー特徴を除去する。
6種類のビデオシーケンスを用いた実験により,提案方式は,最先端のモノクロスラムに比べて精度が向上し,最新のステレオスラムと比較して同等の追跡精度が得られた。
関連論文リスト
- MM3DGS SLAM: Multi-modal 3D Gaussian Splatting for SLAM Using Vision, Depth, and Inertial Measurements [59.70107451308687]
カメラ画像と慣性測定による地図表現に3Dガウスアンを用いることで、精度の高いSLAMが実現できることを示す。
我々の手法であるMM3DGSは、より高速なスケール認識と軌道追跡の改善により、事前レンダリングの限界に対処する。
また,カメラと慣性測定ユニットを備えた移動ロボットから収集したマルチモーダルデータセットUT-MMもリリースした。
論文 参考訳(メタデータ) (2024-04-01T04:57:41Z) - Q-SLAM: Quadric Representations for Monocular SLAM [89.05457684629621]
モノクラーSLAMは、3Dジオメトリを正確にモデル化するという課題に長い間取り組んできた。
ニューラルラジアンス場(NeRF)をベースとしたモノキュラーSLAMの最近の進歩は、将来性を示している。
本稿では,2次形式のレンズを通して体積表現を再現する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-03-12T23:27:30Z) - MoD-SLAM: Monocular Dense Mapping for Unbounded 3D Scene Reconstruction [2.3630527334737104]
MoD-SLAMは、非有界シーンにおけるリアルタイムな3次元再構成を可能にする、最初のモノクラーNeRFを用いた高密度マッピング法である。
追跡処理にロバストな深度損失項を導入することにより,大規模シーンにおけるより正確なポーズ推定を実現する。
2つの標準データセットを用いた実験により, MoD-SLAMは競争性能を向上し, 3次元再構成の精度を最大30%, 15%向上した。
論文 参考訳(メタデータ) (2024-02-06T07:07:33Z) - Cross-Modal Semi-Dense 6-DoF Tracking of an Event Camera in Challenging
Conditions [29.608665442108727]
イベントベースのカメラはバイオインスパイアされた視覚センサーであり、HDR条件でよく機能し、時間分解能が高い。
本研究は、代替センサのマッピングが許された場合、純粋にイベントベースのトラッキングの実現可能性を示す。
この手法は、半密度マップとイベントの幾何学的3D-2D登録に依存しており、信頼性が高く正確なクロスモーダル追跡結果が得られる。
論文 参考訳(メタデータ) (2024-01-16T01:48:45Z) - Gaussian Splatting SLAM [16.3858380078553]
単分子SLAMにおける3次元ガウス散乱の最初の応用について述べる。
我々の方法は3fpsで動作し、正確な追跡、マッピング、高品質なレンダリングに必要な表現を統一する。
ライブカメラから高忠実度で連続的に3Dシーンを再構築するためには、いくつかの革新が必要である。
論文 参考訳(メタデータ) (2023-12-11T18:19:04Z) - Comparative Study of Visual SLAM-Based Mobile Robot Localization Using
Fiducial Markers [4.918853205874711]
本稿では,視覚的SLAMに基づく3つの移動ロボット位置決め方式の比較検討を行った。
SLAMベースのアプローチを比較する理由は、以前の研究が機能のみのメソッドよりも優れたパフォーマンスを示しているためである。
ハードウェア実験では、3つのモードで一貫した軌道誤差レベルを示し、ローカライゼーションモードはその中で最も短いランタイムを示す。
論文 参考訳(メタデータ) (2023-09-08T17:05:24Z) - ParticleSfM: Exploiting Dense Point Trajectories for Localizing Moving
Cameras in the Wild [57.37891682117178]
本稿では,一対の光流からの高密度対応に基づく動画の高密度間接構造抽出手法を提案する。
不規則点軌道データを処理するために,新しいニューラルネットワークアーキテクチャを提案する。
MPIシンテルデータセットを用いた実験により,我々のシステムはより正確なカメラ軌道を生成することがわかった。
論文 参考訳(メタデータ) (2022-07-19T09:19:45Z) - TANDEM: Tracking and Dense Mapping in Real-time using Deep Multi-view
Stereo [55.30992853477754]
本稿では,リアルタイムな単分子追跡と高密度フレームワークであるTANDEMを紹介する。
ポーズ推定のために、TANDEMはアライメントのスライディングウィンドウに基づいて光度バンドル調整を行う。
TANDEMは最先端のリアルタイム3D再構成性能を示す。
論文 参考訳(メタデータ) (2021-11-14T19:01:02Z) - Self-Supervised Multi-Frame Monocular Scene Flow [61.588808225321735]
自己監督学習に基づくマルチフレーム一眼的シーンフローネットワークを導入。
自己監督学習に基づく単眼的シーンフロー法における最新の精度を観察する。
論文 参考訳(メタデータ) (2021-05-05T17:49:55Z) - Robust On-Manifold Optimization for Uncooperative Space Relative
Navigation with a Single Camera [4.129225533930966]
単分子装置のみを用いて、チェッカー宇宙船に対して対象物体の6次元ポーズを推定するために、革新的なモデルに基づくアプローチが実証された。
複雑な宇宙船エンビザットとランデブー軌道のリアルな合成と実験室のデータセットで検証されている。
論文 参考訳(メタデータ) (2020-05-14T16:23:04Z) - Lightweight Multi-View 3D Pose Estimation through Camera-Disentangled
Representation [57.11299763566534]
空間校正カメラで撮影した多視点画像から3次元ポーズを復元する手法を提案する。
我々は3次元形状を利用して、入力画像をカメラ視点から切り離したポーズの潜在表現に融合する。
アーキテクチャは、カメラプロジェクション演算子に学習した表現を条件付け、ビュー当たりの正確な2次元検出を生成する。
論文 参考訳(メタデータ) (2020-04-05T12:52:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。