論文の概要: From Perfect to Noisy World Simulation: Customizable Embodied Multi-modal Perturbations for SLAM Robustness Benchmarking
- arxiv url: http://arxiv.org/abs/2406.16850v1
- Date: Mon, 24 Jun 2024 17:57:05 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-25 13:36:22.118409
- Title: From Perfect to Noisy World Simulation: Customizable Embodied Multi-modal Perturbations for SLAM Robustness Benchmarking
- Title(参考訳): 完全からノイズの多い世界シミュレーション:SLAMロバストネスベンチマークのためのカスタマイズ可能なマルチモーダル摂動
- Authors: Xiaohao Xu, Tianyi Zhang, Sibo Wang, Xiang Li, Yongqi Chen, Ye Li, Bhiksha Raj, Matthew Johnson-Roberson, Xiaonan Huang,
- Abstract要約: エンボディードエージェントは、非構造環境で運用するために堅牢なナビゲーションシステムを必要とする。
ノイズの多いデータ合成のための,新しい,カスタマイズ可能なパイプラインを提案する。
我々はニューラル(NeRF)モデルと非ニューラルSLAMモデルの両方の障害に対する感受性を明らかにする。
- 参考スコア(独自算出の注目度): 32.52171076424419
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Embodied agents require robust navigation systems to operate in unstructured environments, making the robustness of Simultaneous Localization and Mapping (SLAM) models critical to embodied agent autonomy. While real-world datasets are invaluable, simulation-based benchmarks offer a scalable approach for robustness evaluations. However, the creation of a challenging and controllable noisy world with diverse perturbations remains under-explored. To this end, we propose a novel, customizable pipeline for noisy data synthesis, aimed at assessing the resilience of multi-modal SLAM models against various perturbations. The pipeline comprises a comprehensive taxonomy of sensor and motion perturbations for embodied multi-modal (specifically RGB-D) sensing, categorized by their sources and propagation order, allowing for procedural composition. We also provide a toolbox for synthesizing these perturbations, enabling the transformation of clean environments into challenging noisy simulations. Utilizing the pipeline, we instantiate the large-scale Noisy-Replica benchmark, which includes diverse perturbation types, to evaluate the risk tolerance of existing advanced RGB-D SLAM models. Our extensive analysis uncovers the susceptibilities of both neural (NeRF and Gaussian Splatting -based) and non-neural SLAM models to disturbances, despite their demonstrated accuracy in standard benchmarks. Our code is publicly available at https://github.com/Xiaohao-Xu/SLAM-under-Perturbation.
- Abstract(参考訳): エージェントは、非構造環境で動作するために堅牢なナビゲーションシステムを必要とし、エージェントの自律性に不可欠な同時局在マッピング(SLAM)モデルの堅牢性を実現する。
実世界のデータセットは貴重なものだが、シミュレーションベースのベンチマークは堅牢性評価のためのスケーラブルなアプローチを提供する。
しかし、多種多様な摂動を持つ困難で制御可能なノイズの多い世界を作ることは、いまだ探索されていない。
そこで本研究では,様々な摂動に対するマルチモーダルSLAMモデルのレジリエンスを評価することを目的とした,ノイズの多いデータ合成のための,新しいカスタマイズ可能なパイプラインを提案する。
本発明のパイプラインは、そのソースおよび伝播順序によって分類された、具体化されたマルチモーダル(特にRGB−D)センシングのための、センサ及び運動摂動の包括的分類と、手続き的合成を可能にする。
また、これらの摂動を合成するためのツールボックスも提供し、クリーン環境をノイズの多いシミュレーションに変換することができる。
パイプラインを利用して、様々な摂動型を含む大規模ノイズ・レプリカベンチマークをインスタンス化し、既存のRGB-D SLAMモデルのリスク許容性を評価する。
我々の広範な分析により、標準ベンチマークでの精度が証明されているにもかかわらず、ニューラル(NeRFとガウススプラッティングに基づく)モデルと非ニューラルSLAMモデルの障害に対する感受性が明らかになった。
私たちのコードはhttps://github.com/Xiaohao-Xu/SLAM-under-Perturbationで公開されています。
関連論文リスト
- Training-free Quantum-Inspired Image Edge Extraction Method [4.8188571652305185]
トレーニング不要で量子にインスパイアされたエッジ検出モデルを提案する。
提案手法は,古典的なソベルエッジ検出,シュリンガー波動方程式の洗練,ハイブリッドフレームワークを統合する。
トレーニングの必要性をなくすことで、モデルは軽量で多様なアプリケーションに適用できます。
論文 参考訳(メタデータ) (2025-01-31T07:24:38Z) - Scalable Benchmarking and Robust Learning for Noise-Free Ego-Motion and 3D Reconstruction from Noisy Video [30.89206445146674]
ノイズフリーデータへの依存という限界に対処することで、ロバストなエゴモーション推定とフォトリアリスティックな3D再構成を再定義することを目指している。
スケーラブルなデータ生成、包括的な堅牢性、モデルの強化という3つの課題に取り組んでいます。
Robust-Ego3Dという,ノイズによるパフォーマンス劣化の顕在化を目的としたベンチマークを作成しました。
論文 参考訳(メタデータ) (2025-01-24T08:25:48Z) - Sparse identification of nonlinear dynamics and Koopman operators with Shallow Recurrent Decoder Networks [3.1484174280822845]
本稿では,SINDy-SHRED(SINDy-SHRED)とSINDY-SHRED(SINDy-SHRED)を併用したダイナミクスの同定について述べる。
SINDy-SHRED は Gated Recurrent Units (GRU) を用いて、センサー計測の時間的シーケンスを浅層デコーダネットワークと共にモデル化し、潜在状態空間から全フィールドを再構築する。
我々は, 合成PDEデータ, 海面温度の実環境センサ計測, 直接ビデオデータを含む系統的研究を行った。
論文 参考訳(メタデータ) (2025-01-23T02:18:13Z) - Divide-and-Conquer: Confluent Triple-Flow Network for RGB-T Salient Object Detection [70.84835546732738]
RGB-Thermal Salient Object Detectionは、目視と熱赤外画像のペア内の目立つ物体をピンポイントすることを目的としている。
従来のエンコーダ・デコーダアーキテクチャは、欠陥モードから生じるノイズに対する頑健さを十分に考慮していなかったかもしれない。
本稿では,Divide-and-Conquer戦略を用いた,堅牢なConfluent Triple-Flow NetworkであるConTriNetを提案する。
論文 参考訳(メタデータ) (2024-12-02T14:44:39Z) - SMILE: Zero-Shot Sparse Mixture of Low-Rank Experts Construction From Pre-Trained Foundation Models [85.67096251281191]
我々は、ゼロショットスパースミクチャー(SMILE)と呼ばれるモデル融合に対する革新的なアプローチを提案する。
SMILEは、余分なデータやさらなるトレーニングなしに、ソースモデルをMoEモデルにアップスケーリングできる。
画像分類やテキスト生成タスクなど,さまざまなシナリオに対して,フル微調整とLoRA微調整を用いて広範な実験を行う。
論文 参考訳(メタデータ) (2024-08-19T17:32:15Z) - Customizable Perturbation Synthesis for Robust SLAM Benchmarking [33.74471840597803]
ノイズの多いデータ合成のための,新しい,カスタマイズ可能なパイプラインを提案する。
このパイプラインには、カスタマイズ可能なハードウェアセットアップ、ソフトウェアコンポーネント、摂動環境が含まれている。
多様な摂動型を含むRobust-SLAMベンチマークをインスタンス化し、既存の高度SLAMモデルのリスク許容性を評価する。
論文 参考訳(メタデータ) (2024-02-12T23:49:40Z) - DeNoising-MOT: Towards Multiple Object Tracking with Severe Occlusions [52.63323657077447]
DNMOTは、複数のオブジェクト追跡のためのエンドツーエンドのトレーニング可能なDeNoising Transformerである。
具体的には、トレーニング中にノイズを伴って軌道を拡大し、エンコーダ・デコーダアーキテクチャのデノイング過程をモデルに学習させる。
我々はMOT17,MOT20,DanceTrackのデータセットについて広範な実験を行い,実験結果から,提案手法が従来の最先端手法よりも明確なマージンで優れていることが示された。
論文 参考訳(メタデータ) (2023-09-09T04:40:01Z) - HaDR: Applying Domain Randomization for Generating Synthetic Multimodal
Dataset for Hand Instance Segmentation in Cluttered Industrial Environments [0.0]
本研究では、ドメインランダム化を用いて、マルチモーダルインスタンスセグメンテーションモデルのトレーニングのための合成RGB-Dデータセットを生成する。
提案手法により,既存の最先端データセットでトレーニングしたモデルよりも優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2023-04-12T13:02:08Z) - Bridging the Gap Between Clean Data Training and Real-World Inference
for Spoken Language Understanding [76.89426311082927]
既存のモデルはクリーンデータに基づいてトレーニングされ、クリーンデータトレーニングと現実世界の推論の間にtextitgapが発生する。
本稿では,良質なサンプルと低品質のサンプルの両方が類似ベクトル空間に埋め込まれた領域適応法を提案する。
広く使用されているデータセット、スニップス、および大規模な社内データセット(1000万のトレーニング例)に関する実験では、この方法は実世界の(騒々しい)コーパスのベースラインモデルを上回るだけでなく、堅牢性、すなわち、騒々しい環境下で高品質の結果を生み出すことを実証しています。
論文 参考訳(メタデータ) (2021-04-13T17:54:33Z) - Anomaly Detection of Time Series with Smoothness-Inducing Sequential
Variational Auto-Encoder [59.69303945834122]
Smoothness-Inducing Sequential Variational Auto-Encoder (SISVAE) モデルを提案する。
我々のモデルは、フレキシブルニューラルネットワークを用いて各タイムスタンプの平均と分散をパラメータ化する。
合成データセットと公開実世界のベンチマークの両方において,本モデルの有効性を示す。
論文 参考訳(メタデータ) (2021-02-02T06:15:15Z) - Crowd Counting via Hierarchical Scale Recalibration Network [61.09833400167511]
本稿では,群集カウントの課題に取り組むために,階層型大規模校正ネットワーク(HSRNet)を提案する。
HSRNetは、リッチなコンテキスト依存をモデル化し、複数のスケール関連情報を再検討する。
提案手法は,様々なノイズを選択的に無視し,適切な群集スケールに自動的に焦点を合わせることができる。
論文 参考訳(メタデータ) (2020-03-07T10:06:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。