論文の概要: SLAM-Former: Putting SLAM into One Transformer
- arxiv url: http://arxiv.org/abs/2509.16909v1
- Date: Sun, 21 Sep 2025 04:04:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-23 18:58:16.03214
- Title: SLAM-Former: Putting SLAM into One Transformer
- Title(参考訳): SLAM-Former:SLAMを1つのトランスにする
- Authors: Yijun Yuan, Zhuoguang Chen, Kenan Li, Weibang Wang, Hang Zhao,
- Abstract要約: SLAM-Formerは、完全なSLAMを単一の変換器に統合する新しいニューラルアプローチである。
SLAM-Formerは,最先端の高密度SLAM法と比較して,優れた,あるいは高い競争力を発揮することを示す。
- 参考スコア(独自算出の注目度): 28.173503112119374
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present SLAM-Former, a novel neural approach that integrates full SLAM capabilities into a single transformer. Similar to traditional SLAM systems, SLAM-Former comprises both a frontend and a backend that operate in tandem. The frontend processes sequential monocular images in real-time for incremental mapping and tracking, while the backend performs global refinement to ensure a geometrically consistent result. This alternating execution allows the frontend and backend to mutually promote one another, enhancing overall system performance. Comprehensive experimental results demonstrate that SLAM-Former achieves superior or highly competitive performance compared to state-of-the-art dense SLAM methods.
- Abstract(参考訳): SLAM-Formerは、完全なSLAM機能を単一のトランスに組み込む、新しいニューラルアプローチである。
従来のSLAMシステムと同様、SLAM-Formerはフロントエンドとバックエンドの両方をタンデムで運用する。
フロントエンドは、インクリメンタルマッピングとトラッキングのために、シーケンシャルなモノクロ画像をリアルタイムに処理し、バックエンドは、幾何学的に一貫した結果を保証するために、グローバルな洗練を行う。
この交互実行により、フロントエンドとバックエンドが相互に促進され、システム全体のパフォーマンスが向上する。
SLAM-Formerは, 最先端の高密度SLAM法と比較して, 優れた, 高い競争性能を示すことを示す。
関連論文リスト
- Improving Progressive Generation with Decomposable Flow Matching [50.63174319509629]
Decomposable Flow Matching (DFM)は、ビジュアルメディアのプログレッシブな生成のためのシンプルで効果的なフレームワークである。
Imagenet-1k 512pxでは、DFMはベースアーキテクチャよりも35.2%改善され、ベースラインは26.4%向上した。
論文 参考訳(メタデータ) (2025-06-24T17:58:02Z) - VSLAM-LAB: A Comprehensive Framework for Visual SLAM Methods and Datasets [64.57742015099531]
VSLAM-LABは、VSLAMシステムの開発、評価、デプロイを効率化する統合フレームワークである。
VSLAMアルゴリズムのシームレスなコンパイルと構成、データセットの自動ダウンロードと前処理、標準化された実験設計、実行、評価を可能にする。
論文 参考訳(メタデータ) (2025-04-06T12:02:19Z) - Q-SLAM: Quadric Representations for Monocular SLAM [85.82697759049388]
四角形のレンズを通して体積表現を再現する。
我々は、RGB入力からノイズの深い深さ推定を正すために二次仮定を用いる。
本研究では,新たな二次分割変換器を導入し,二次情報を集約する。
論文 参考訳(メタデータ) (2024-03-12T23:27:30Z) - CP-SLAM: Collaborative Neural Point-based SLAM System [54.916578456416204]
本稿では,RGB-D画像シーケンスを用いた協調型暗黙的ニューラルローカライゼーションとマッピング(SLAM)システムを提案する。
これらすべてのモジュールを統一的なフレームワークで実現するために,ニューラルポイントに基づく新しい3次元シーン表現を提案する。
協調的な暗黙的SLAMに対して,一貫性と協調性を改善するために,分散分散型学習戦略を提案する。
論文 参考訳(メタデータ) (2023-11-14T09:17:15Z) - iSLAM: Imperative SLAM [5.135133301600283]
SLAMシステムは、しばしば、動き推定のためのフロントエンドコンポーネントと、推定ドリフトを除去するバックエンドシステムから構成される。
本稿では,フロントエンドとバックエンドの相互修正を促進する,命令型SLAMという,自己指導型命令型学習フレームワークを提案する。
実験の結果,iSLAMトレーニング戦略はベースラインモデルよりも平均22%の精度向上を実現していることがわかった。
論文 参考訳(メタデータ) (2023-06-13T16:39:39Z) - NICER-SLAM: Neural Implicit Scene Encoding for RGB SLAM [111.83168930989503]
NICER-SLAMは、カメラポーズと階層的なニューラル暗黙マップ表現を同時に最適化するRGB SLAMシステムである。
近年のRGB-D SLAMシステムと競合する高密度マッピング,追跡,新しいビュー合成において,高い性能を示す。
論文 参考訳(メタデータ) (2023-02-07T17:06:34Z) - NICE-SLAM: Neural Implicit Scalable Encoding for SLAM [112.6093688226293]
NICE-SLAMは階層的なシーン表現を導入することでマルチレベルローカル情報を組み込んだ高密度SLAMシステムである。
最近の暗黙的SLAMシステムと比較して、私たちのアプローチはよりスケーラブルで効率的で堅牢です。
論文 参考訳(メタデータ) (2021-12-22T18:45:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。