論文の概要: ICD-Net: Inertial Covariance Displacement Network for Drone Visual-Inertial SLAM
- arxiv url: http://arxiv.org/abs/2512.00037v1
- Date: Thu, 13 Nov 2025 11:25:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-07 19:06:32.397691
- Title: ICD-Net: Inertial Covariance Displacement Network for Drone Visual-Inertial SLAM
- Title(参考訳): ICD-Net:ドローン・ビジュアル・慣性SLAMのための慣性共分散変位ネットワーク
- Authors: Tali Orlev Shapira, Itzik Klein,
- Abstract要約: 視覚-慣性SLAM性能を向上させる新しいフレームワークであるICD-Netを提案する。
従来のVINS-Fusionと比較して,軌道推定精度は有意に向上した。
ニューラルネットワークの強化は,SLAM劣化の複数の要因に効果的に対処できることを示す。
- 参考スコア(独自算出の注目度): 5.5217350574838875
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual-inertial SLAM systems often exhibit suboptimal performance due to multiple confounding factors including imperfect sensor calibration, noisy measurements, rapid motion dynamics, low illumination, and the inherent limitations of traditional inertial navigation integration methods. These issues are particularly problematic in drone applications where robust and accurate state estimation is critical for safe autonomous operation. In this work, we present ICD-Net, a novel framework that enhances visual-inertial SLAM performance by learning to process raw inertial measurements and generating displacement estimates with associated uncertainty quantification. Rather than relying on analytical inertial sensor models that struggle with real-world sensor imperfections, our method directly extracts displacement maps from sensor data while simultaneously predicting measurement covariances that reflect estimation confidence. We integrate ICD-Net outputs as additional residual constraints into the VINS-Fusion optimization framework, where the predicted uncertainties appropriately weight the neural network contributions relative to traditional visual and inertial terms. The learned displacement constraints provide complementary information that compensates for various error sources in the SLAM pipeline. Our approach can be used under both normal operating conditions and in situations of camera inconsistency or visual degradation. Experimental evaluation on challenging high-speed drone sequences demonstrated that our approach significantly improved trajectory estimation accuracy compared to standard VINS-Fusion, with more than 38% improvement in mean APE and uncertainty estimates proving crucial for maintaining system robustness. Our method shows that neural network enhancement can effectively address multiple sources of SLAM degradation while maintaining real-time performance requirements.
- Abstract(参考訳): 視覚慣性SLAMシステムは、不完全なセンサーキャリブレーション、ノイズ測定、ラピッドモーションダイナミクス、低照度、従来の慣性ナビゲーション統合法固有の制限など、複数の相反する要因により、しばしば最適以下の性能を示す。
これらの問題は、堅牢で正確な状態推定が安全な自律運転に不可欠であるドローンアプリケーションにおいて特に問題となる。
In this work, we present ICD-Net, a novel framework that a visual-inertial SLAM performance by learning to process raw inertial measured and generated displacement estimates with associated uncertainty Quantification。
実世界のセンサ不完全性に苦しむ解析的慣性センサモデルに頼るのではなく、センサデータから変位マップを直接抽出し、推定信頼性を反映した測定共分散を同時に予測する。
我々は、ISD-Net出力をVINS-Fusion最適化フレームワークに追加の残差制約として統合し、予測された不確実性は、従来の視覚的および慣性項に対するニューラルネットワークの寄与を適切に重み付けする。
学習された変位制約は、SLAMパイプラインの様々なエラー源を補う補完情報を提供する。
本手法は通常の操作条件とカメラの不整合や視覚的劣化の状況の両方で使用することができる。
提案手法は, 従来のVINS-Fusionに比べて軌道推定精度が有意に向上し, 平均APEが38%以上向上し, システムロバスト性維持に欠かせない不確実性評価が得られた。
提案手法は,リアルタイムな性能要件を維持しつつ,複数のSLAM劣化源を効果的に扱えることを示す。
関連論文リスト
- Diffuse to Detect: A Generalizable Framework for Anomaly Detection with Diffusion Models Applications to UAVs and Beyond [2.4449457537548036]
UAVセンサーの読み取りなどの複雑な高次元データにおける異常検出は、運用上の安全性に不可欠である。
本稿では,拡散モデルを適用して異常検出を行うDiffuse to Detect(DTD)フレームワークを提案する。
DTDは1ステップの拡散プロセスを用いてノイズパターンを予測し、再構成エラーのない異常の迅速かつ正確な同定を可能にする。
論文 参考訳(メタデータ) (2025-10-27T02:08:08Z) - ResAD: Normalized Residual Trajectory Modeling for End-to-End Autonomous Driving [64.42138266293202]
ResADは正規化された残留軌道モデリングフレームワークである。
学習タスクを再編成し、慣性参照からの残留偏差を予測する。
NAVSIMベンチマークでは、ResADはバニラ拡散ポリシーを用いて最先端のPDMS 88.6を達成している。
論文 参考訳(メタデータ) (2025-10-09T17:59:36Z) - Over-the-Air Federated Learning and Optimization [52.5188988624998]
エッジ・ザ・エア計算(AirComp)によるフェデレーション学習(FL)に焦点を当てる。
本稿では,AirComp ベースの FedAvg (AirFedAvg) アルゴリズムの凸および非凸条件下での収束について述べる。
エッジデバイス(モデル、勾配、モデル差など)で送信できるローカルアップデートの種類によって、AirFedAvgで送信するとアグリゲーションエラーが発生する可能性がある。
さらに、より実用的な信号処理方式を検討し、通信効率を改善し、これらの信号処理方式によって引き起こされるモデル集約誤差の異なる形式に収束解析を拡張する。
論文 参考訳(メタデータ) (2023-10-16T05:49:28Z) - UncLe-SLAM: Uncertainty Learning for Dense Neural SLAM [60.575435353047304]
我々は、高密度ニューラルネットワークの同時局所化とマッピング(SLAM)のための不確実性学習フレームワークを提案する。
本稿では,2次元入力データのみから自己教師付きで学習可能なセンサ不確実性推定のためのオンラインフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-19T16:26:25Z) - Constrained Reinforcement Learning using Distributional Representation for Trustworthy Quadrotor UAV Tracking Control [2.325021848829375]
本研究では, 未知の空力効果に対する分散強化学習障害推定器を統合した新しいトラジェクトリトラッカーを提案する。
提案手法は, 空気力学効果の真値と推定値の不確かさを正確に同定する。
本システムは,最近の技術と比較して,累積追尾誤差を少なくとも70%改善することを示した。
論文 参考訳(メタデータ) (2023-02-22T23:15:56Z) - MotionHint: Self-Supervised Monocular Visual Odometry with Motion
Constraints [70.76761166614511]
モノクローナルビジュアル・オドメトリー(VO)のための新しい自己教師型アルゴリズムMotionHintを提案する。
我々のMotionHintアルゴリズムは、既存のオープンソースSSM-VOシステムに容易に適用できる。
論文 参考訳(メタデータ) (2021-09-14T15:35:08Z) - Pushing the Envelope of Rotation Averaging for Visual SLAM [69.7375052440794]
視覚SLAMシステムのための新しい最適化バックボーンを提案する。
従来の単分子SLAMシステムの精度, 効率, 堅牢性を向上させるために, 平均化を活用している。
我々のアプローチは、公開ベンチマークの最先端技術に対して、同等の精度で最大10倍高速に表示することができる。
論文 参考訳(メタデータ) (2020-11-02T18:02:26Z) - Neural Control Variates [71.42768823631918]
ニューラルネットワークの集合が、積分のよい近似を見つけるという課題に直面していることを示す。
理論的に最適な分散最小化損失関数を導出し、実際に安定したオンライントレーニングを行うための代替の複合損失を提案する。
具体的には、学習した光場近似が高次バウンスに十分な品質であることを示し、誤差補正を省略し、無視可能な可視バイアスのコストでノイズを劇的に低減できることを示した。
論文 参考訳(メタデータ) (2020-06-02T11:17:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。