Fugu-MT 論文翻訳(概要): From Perfect to Noisy World Simulation: Customizable Embodied Multi-modal Perturbations for SLAM Robustness Benchmarking

論文の概要: From Perfect to Noisy World Simulation: Customizable Embodied Multi-modal Perturbations for SLAM Robustness Benchmarking

arxiv url: http://arxiv.org/abs/2406.16850v1
Date: Mon, 24 Jun 2024 17:57:05 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-25 13:36:22.118409
Title: From Perfect to Noisy World Simulation: Customizable Embodied Multi-modal Perturbations for SLAM Robustness Benchmarking
Title（参考訳）: 完全からノイズの多い世界シミュレーション:SLAMロバストネスベンチマークのためのカスタマイズ可能なマルチモーダル摂動
Authors: Xiaohao Xu, Tianyi Zhang, Sibo Wang, Xiang Li, Yongqi Chen, Ye Li, Bhiksha Raj, Matthew Johnson-Roberson, Xiaonan Huang,
Abstract要約: エンボディードエージェントは、非構造環境で運用するために堅牢なナビゲーションシステムを必要とする。ノイズの多いデータ合成のための,新しい,カスタマイズ可能なパイプラインを提案する。我々はニューラル(NeRF)モデルと非ニューラルSLAMモデルの両方の障害に対する感受性を明らかにする。
参考スコア（独自算出の注目度）: 32.52171076424419
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Embodied agents require robust navigation systems to operate in unstructured environments, making the robustness of Simultaneous Localization and Mapping (SLAM) models critical to embodied agent autonomy. While real-world datasets are invaluable, simulation-based benchmarks offer a scalable approach for robustness evaluations. However, the creation of a challenging and controllable noisy world with diverse perturbations remains under-explored. To this end, we propose a novel, customizable pipeline for noisy data synthesis, aimed at assessing the resilience of multi-modal SLAM models against various perturbations. The pipeline comprises a comprehensive taxonomy of sensor and motion perturbations for embodied multi-modal (specifically RGB-D) sensing, categorized by their sources and propagation order, allowing for procedural composition. We also provide a toolbox for synthesizing these perturbations, enabling the transformation of clean environments into challenging noisy simulations. Utilizing the pipeline, we instantiate the large-scale Noisy-Replica benchmark, which includes diverse perturbation types, to evaluate the risk tolerance of existing advanced RGB-D SLAM models. Our extensive analysis uncovers the susceptibilities of both neural (NeRF and Gaussian Splatting -based) and non-neural SLAM models to disturbances, despite their demonstrated accuracy in standard benchmarks. Our code is publicly available at https://github.com/Xiaohao-Xu/SLAM-under-Perturbation.
Abstract（参考訳）: エージェントは、非構造環境で動作するために堅牢なナビゲーションシステムを必要とし、エージェントの自律性に不可欠な同時局在マッピング(SLAM)モデルの堅牢性を実現する。実世界のデータセットは貴重なものだが、シミュレーションベースのベンチマークは堅牢性評価のためのスケーラブルなアプローチを提供する。しかし、多種多様な摂動を持つ困難で制御可能なノイズの多い世界を作ることは、いまだ探索されていない。そこで本研究では,様々な摂動に対するマルチモーダルSLAMモデルのレジリエンスを評価することを目的とした,ノイズの多いデータ合成のための,新しいカスタマイズ可能なパイプラインを提案する。本発明のパイプラインは、そのソースおよび伝播順序によって分類された、具体化されたマルチモーダル(特にRGB−D)センシングのための、センサ及び運動摂動の包括的分類と、手続き的合成を可能にする。また、これらの摂動を合成するためのツールボックスも提供し、クリーン環境をノイズの多いシミュレーションに変換することができる。パイプラインを利用して、様々な摂動型を含む大規模ノイズ・レプリカベンチマークをインスタンス化し、既存のRGB-D SLAMモデルのリスク許容性を評価する。我々の広範な分析により、標準ベンチマークでの精度が証明されているにもかかわらず、ニューラル(NeRFとガウススプラッティングに基づく)モデルと非ニューラルSLAMモデルの障害に対する感受性が明らかになった。私たちのコードはhttps://github.com/Xiaohao-Xu/SLAM-under-Perturbationで公開されています。

関連論文リスト

AgentNoiseBench: Benchmarking Robustness of Tool-Using LLM Agents Under Noisy Condition [72.24180896265192]
本稿では,騒音環境下でのエージェントモデルのロバスト性を評価するためのフレームワークであるAgentNoiseBenchを紹介する。まず、実世界のシナリオにおけるバイアスと不確実性の詳細な分析を行う。次に,環境騒音をユーザノイズとツールノイズの2つの主要なタイプに分類する。この分析に基づいて,既存のエージェント中心ベンチマークに制御可能なノイズを注入する自動パイプラインを開発した。
論文参考訳（メタデータ） (2026-02-11T20:33:10Z)
World Model Robustness via Surprise Recognition [2.019328356430632]
我々は,世界モデルに基づく強化学習エージェントにおける雑音の影響を低減するアルゴリズムを開発した。本手法は,ノイズの種類やレベルによって,ベースラインに対する性能を保っていることを示す。提案手法は,基礎となるアーキテクチャが著しく異なる2つの最先端世界モデルの安定性を向上させることを実証する。
論文参考訳（メタデータ） (2025-11-30T22:25:45Z)
FAIM: Frequency-Aware Interactive Mamba for Time Series Classification [87.84511960413715]
時系列分類(TSC)は、環境モニタリング、診断、姿勢認識など、多くの実世界の応用において重要である。本稿では,周波数対応対話型マンバモデルであるFAIMを提案する。 FAIMは既存の最先端(SOTA)手法を一貫して上回り、精度と効率のトレードオフが優れていることを示す。
論文参考訳（メタデータ） (2025-11-26T08:36:33Z)
Simulating Environments with Reasoning Models for Agent Training [55.98861707136674]
トレーニング用の起動環境の構築は重く、脆く、進捗を制限します。我々はSimia-SFTとSimia-RLの2つのフレームワークを提案する。 Simia-SFTとSimia-RLは、環境工学を使わずにスケーラブルなエージェントトレーニングを可能にする。
論文参考訳（メタデータ） (2025-11-03T18:29:57Z)
Benchmarking M-LTSF: Frequency and Noise-Based Evaluation of Multivariate Long Time Series Forecasting Models [24.354866692885466]
パラメータ化可能な合成データセットを生成するシミュレーションに基づく評価フレームワークを提案する。これらのコンポーネントは、未知のノイズのあいまいさを伴わずに、実世界の多変量時系列データをモデル化することを目的としている。このフレームワークは、制御および多種多様なシナリオ下でのM-LTSFモデルのきめ細かい体系的評価を可能にする。
論文参考訳（メタデータ） (2025-10-06T15:16:52Z)
MLE-Dojo: Interactive Environments for Empowering LLM Agents in Machine Learning Engineering [57.156093929365255]
自律型大規模言語モデル(LLM)エージェントを体系的に強化し、評価し、改善するためのガイムスタイルのフレームワーク。 MLE-Dojoは、現実的なエンジニアリングシナリオを反映した、多様でオープンなMLEタスクを慎重にキュレートする。完全に実行可能な環境は、教師付き微調整と強化学習の両方を通して包括的なエージェントトレーニングをサポートする。
論文参考訳（メタデータ） (2025-05-12T17:35:43Z)
Open-set Anomaly Segmentation in Complex Scenarios [88.11076112792992]
本稿では,複雑なシナリオにおけるオープンセット異常セグメンテーションのベンチマークであるComsAmyを紹介する。 ComsAmyは、幅広い悪天候、動的な運転環境、様々な異常タイプを含む。本稿では,エネルギーとエントロピーの相補的情報を統合する新しいエネルギ-エントロピー学習(EEL)戦略を提案する。
論文参考訳（メタデータ） (2025-04-28T12:00:10Z)
Whenever, Wherever: Towards Orchestrating Crowd Simulations with Spatio-Temporal Spawn Dynamics [65.72663487116439]
ニューラル・テンポラル・ポイント・プロセスを用いて生成時間生成ダイナミクスをモデル化するnTPP-GMMを提案する。我々は,nTPP-GMMを用いた3つの実世界のデータセットのシミュレーションによるアプローチの評価を行った。
論文参考訳（メタデータ） (2025-03-20T18:46:41Z)
Training-free Quantum-Inspired Image Edge Extraction Method [4.8188571652305185]
トレーニング不要で量子にインスパイアされたエッジ検出モデルを提案する。提案手法は,古典的なソベルエッジ検出,シュリンガー波動方程式の洗練,ハイブリッドフレームワークを統合する。トレーニングの必要性をなくすことで、モデルは軽量で多様なアプリケーションに適用できます。
論文参考訳（メタデータ） (2025-01-31T07:24:38Z)
Scalable Benchmarking and Robust Learning for Noise-Free Ego-Motion and 3D Reconstruction from Noisy Video [30.89206445146674]
ノイズフリーデータへの依存という限界に対処することで、ロバストなエゴモーション推定とフォトリアリスティックな3D再構成を再定義することを目指している。スケーラブルなデータ生成、包括的な堅牢性、モデルの強化という3つの課題に取り組んでいます。 Robust-Ego3Dという,ノイズによるパフォーマンス劣化の顕在化を目的としたベンチマークを作成しました。
論文参考訳（メタデータ） (2025-01-24T08:25:48Z)
Sparse identification of nonlinear dynamics and Koopman operators with Shallow Recurrent Decoder Networks [3.1484174280822845]
本稿では, 簡易な実装, 効率的, 堅牢な性能で, センサとモデル識別の問題を共同で解決する手法を提案する。 SINDy-SHREDはGated Recurrent Unitsを使用してスパースセンサー計測と浅いネットワークデコーダをモデル化し、潜在状態空間からフルタイムフィールドを再構築する。本研究では, 乱流, 海面温度の実環境センサ計測, 直接ビデオデータなどのPDEデータに関する系統的研究を行った。
論文参考訳（メタデータ） (2025-01-23T02:18:13Z)
Divide-and-Conquer: Confluent Triple-Flow Network for RGB-T Salient Object Detection [70.84835546732738]
RGB-Thermal Salient Object Detectionは、目視と熱赤外画像のペア内の目立つ物体をピンポイントすることを目的としている。従来のエンコーダ・デコーダアーキテクチャは、欠陥モードから生じるノイズに対する頑健さを十分に考慮していなかったかもしれない。本稿では,Divide-and-Conquer戦略を用いた,堅牢なConfluent Triple-Flow NetworkであるConTriNetを提案する。
論文参考訳（メタデータ） (2024-12-02T14:44:39Z)
SMILE: Zero-Shot Sparse Mixture of Low-Rank Experts Construction From Pre-Trained Foundation Models [85.67096251281191]
我々は、ゼロショットスパースミクチャー(SMILE)と呼ばれるモデル融合に対する革新的なアプローチを提案する。 SMILEは、余分なデータやさらなるトレーニングなしに、ソースモデルをMoEモデルにアップスケーリングできる。画像分類やテキスト生成タスクなど,さまざまなシナリオに対して,フル微調整とLoRA微調整を用いて広範な実験を行う。
論文参考訳（メタデータ） (2024-08-19T17:32:15Z)
Addressing Misspecification in Simulation-based Inference through Data-driven Calibration [43.811367860375825]
近年の研究では、モデルの不特定がシミュレーションに基づく推論の信頼性を損なうことが示されている。本研究は, モデル誤特定を克服し, 地上真実パラメータ測定の小さな実世界の校正セットであるロバスト後部推定(ROPE)を導入する。
論文参考訳（メタデータ） (2024-05-14T16:04:39Z)
Koopman-Based Surrogate Modelling of Turbulent Rayleigh-Bénard Convection [4.248022697109535]
我々は,LRAN(Linear Recurrent Autoencoder Network)と呼ばれるクープマンにインスパイアされたアーキテクチャを用いて,対流中の低次ダイナミクスを学習する。従来の流体力学法であるKernel Dynamic Mode Decomposition (KDMD)を用いてLRANを比較する。我々は,最も乱流条件下では,KDMDよりもLRANの方が正確な予測値を得た。
論文参考訳（メタデータ） (2024-05-10T12:15:02Z)
Customizable Perturbation Synthesis for Robust SLAM Benchmarking [33.74471840597803]
ノイズの多いデータ合成のための,新しい,カスタマイズ可能なパイプラインを提案する。このパイプラインには、カスタマイズ可能なハードウェアセットアップ、ソフトウェアコンポーネント、摂動環境が含まれている。多様な摂動型を含むRobust-SLAMベンチマークをインスタンス化し、既存の高度SLAMモデルのリスク許容性を評価する。
論文参考訳（メタデータ） (2024-02-12T23:49:40Z)
DeNoising-MOT: Towards Multiple Object Tracking with Severe Occlusions [52.63323657077447]
DNMOTは、複数のオブジェクト追跡のためのエンドツーエンドのトレーニング可能なDeNoising Transformerである。具体的には、トレーニング中にノイズを伴って軌道を拡大し、エンコーダ・デコーダアーキテクチャのデノイング過程をモデルに学習させる。我々はMOT17,MOT20,DanceTrackのデータセットについて広範な実験を行い,実験結果から,提案手法が従来の最先端手法よりも明確なマージンで優れていることが示された。
論文参考訳（メタデータ） (2023-09-09T04:40:01Z)
A Bayesian Non-parametric Approach to Generative Models: Integrating Variational Autoencoder and Generative Adversarial Networks using Wasserstein and Maximum Mean Discrepancy [2.5109359014278954]
本稿では,GAN(generative adversarial network)とVAE(variantal autoencoder)において,いくつかの顕著な障害モードに対処する,ベイズ非パラメトリック学習(BNPL)フレームワークの新たな生成モデルを提案する。我々は、BNPLフレームワークがトレーニングの安定性を高め、WMMD(Wsserstein distance and maximum mean discrepancy measure)をモデルの損失関数に組み込む際に、堅牢性と精度の保証を提供することを示す。
論文参考訳（メタデータ） (2023-08-27T08:58:31Z)
Realistic Noise Synthesis with Diffusion Models [68.48859665320828]
Deep Image Denoisingモデルは、しばしば高品質なパフォーマンスのために大量のトレーニングデータに依存します。本稿では,拡散モデル,すなわちRealistic Noise Synthesize Diffusor(RNSD)を用いて現実的な雑音を合成する新しい手法を提案する。 RNSDは、より現実的なノイズや空間的相関を複数の周波数で生成できるような、ガイド付きマルチスケールコンテンツを組み込むことができる。
論文参考訳（メタデータ） (2023-05-23T12:56:01Z)
HaDR: Applying Domain Randomization for Generating Synthetic Multimodal Dataset for Hand Instance Segmentation in Cluttered Industrial Environments [0.0]
本研究では、ドメインランダム化を用いて、マルチモーダルインスタンスセグメンテーションモデルのトレーニングのための合成RGB-Dデータセットを生成する。提案手法により,既存の最先端データセットでトレーニングしたモデルよりも優れた性能が得られることを示す。
論文参考訳（メタデータ） (2023-04-12T13:02:08Z)
Bridging the Gap Between Clean Data Training and Real-World Inference for Spoken Language Understanding [76.89426311082927]
既存のモデルはクリーンデータに基づいてトレーニングされ、クリーンデータトレーニングと現実世界の推論の間にtextitgapが発生する。本稿では,良質なサンプルと低品質のサンプルの両方が類似ベクトル空間に埋め込まれた領域適応法を提案する。広く使用されているデータセット、スニップス、および大規模な社内データセット(1000万のトレーニング例)に関する実験では、この方法は実世界の(騒々しい)コーパスのベースラインモデルを上回るだけでなく、堅牢性、すなわち、騒々しい環境下で高品質の結果を生み出すことを実証しています。
論文参考訳（メタデータ） (2021-04-13T17:54:33Z)
Anomaly Detection of Time Series with Smoothness-Inducing Sequential Variational Auto-Encoder [59.69303945834122]
Smoothness-Inducing Sequential Variational Auto-Encoder (SISVAE) モデルを提案する。我々のモデルは、フレキシブルニューラルネットワークを用いて各タイムスタンプの平均と分散をパラメータ化する。合成データセットと公開実世界のベンチマークの両方において,本モデルの有効性を示す。
論文参考訳（メタデータ） (2021-02-02T06:15:15Z)
Crowd Counting via Hierarchical Scale Recalibration Network [61.09833400167511]
本稿では,群集カウントの課題に取り組むために,階層型大規模校正ネットワーク(HSRNet)を提案する。 HSRNetは、リッチなコンテキスト依存をモデル化し、複数のスケール関連情報を再検討する。提案手法は,様々なノイズを選択的に無視し,適切な群集スケールに自動的に焦点を合わせることができる。
論文参考訳（メタデータ） (2020-03-07T10:06:47Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。