論文の概要: IONext: Unlocking the Next Era of Inertial Odometry
- arxiv url: http://arxiv.org/abs/2507.17089v1
- Date: Wed, 23 Jul 2025 00:09:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-24 22:33:14.80956
- Title: IONext: Unlocking the Next Era of Inertial Odometry
- Title(参考訳): IONext:次世代の慣性オドメトリーを解き放つ
- Authors: Shanshan Zhang, Siyue Wang, Tianshui Wen, Qi Zhang, Ziheng Zhou, Lingxiang Zheng, Yu Yang,
- Abstract要約: 我々は,CNNを用いた新しい慣性眼振背骨, Next Era of Inertial Odometry (IONext) を提案する。
IONextは、最先端(SOTA)トランスフォーマーとCNNベースのメソッドを一貫して上回っている。
例えばRNINデータセットでは、IONextは代表モデルのiMOTと比較して平均ATEを10%、平均RTEを12%削減する。
- 参考スコア(独自算出の注目度): 24.137981640306034
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Researchers have increasingly adopted Transformer-based models for inertial odometry. While Transformers excel at modeling long-range dependencies, their limited sensitivity to local, fine-grained motion variations and lack of inherent inductive biases often hinder localization accuracy and generalization. Recent studies have shown that incorporating large-kernel convolutions and Transformer-inspired architectural designs into CNN can effectively expand the receptive field, thereby improving global motion perception. Motivated by these insights, we propose a novel CNN-based module called the Dual-wing Adaptive Dynamic Mixer (DADM), which adaptively captures both global motion patterns and local, fine-grained motion features from dynamic inputs. This module dynamically generates selective weights based on the input, enabling efficient multi-scale feature aggregation. To further improve temporal modeling, we introduce the Spatio-Temporal Gating Unit (STGU), which selectively extracts representative and task-relevant motion features in the temporal domain. This unit addresses the limitations of temporal modeling observed in existing CNN approaches. Built upon DADM and STGU, we present a new CNN-based inertial odometry backbone, named Next Era of Inertial Odometry (IONext). Extensive experiments on six public datasets demonstrate that IONext consistently outperforms state-of-the-art (SOTA) Transformer- and CNN-based methods. For instance, on the RNIN dataset, IONext reduces the average ATE by 10% and the average RTE by 12% compared to the representative model iMOT.
- Abstract(参考訳): 研究者たちは、慣性オードメトリーのためのTransformerベースのモデルをますます採用している。
トランスフォーマーは長距離依存のモデリングに優れていますが、局所的、きめ細かい動きの変化に対する感度の制限や、固有の帰納バイアスの欠如は、ローカライゼーションの精度と一般化を妨げます。
近年の研究では、大カーネルの畳み込みとトランスフォーマーにインスパイアされたアーキテクチャ設計をCNNに組み込むことで、受容場を効果的に拡張し、グローバルな動き知覚を向上させることが示されている。
これらの知見を反映して,グローバルな動きパターンと局所的,微細な動き特徴を動的入力から適応的にキャプチャするDual-wing Adaptive Dynamic Mixer (DADM) と呼ばれる新しいCNNベースのモジュールを提案する。
このモジュールは、入力に基づいて選択的重みを動的に生成し、効率的なマルチスケール機能アグリゲーションを実現する。
時間領域における代表的およびタスク関連動作特徴を選択的に抽出する時空間ゲーティングユニット(STGU)を導入する。
このユニットは、既存のCNNアプローチで観測される時間的モデリングの限界に対処する。
DADMとSTGUをベースとした新しいCNNベースの慣性オドメトリーバックボーンであるNext Era of Inertial Odometry(IONext)を報告する。
6つの公開データセットに対する大規模な実験により、IONextは、最先端(SOTA)トランスフォーマーとCNNベースのメソッドを一貫して上回っていることが示された。
例えばRNINデータセットでは、IONextは代表モデルのiMOTと比較して平均ATEを10%、平均RTEを12%削減する。
関連論文リスト
- Langevin Flows for Modeling Neural Latent Dynamics [81.81271685018284]
逐次変分自動エンコーダであるLangevinFlowを導入し、潜伏変数の時間的進化をアンダーダム化したLangevin方程式で制御する。
われわれのアプローチは、慣性、減衰、学習されたポテンシャル関数、力などの物理的事前を組み込んで、ニューラルネットワークにおける自律的および非自律的プロセスの両方を表現する。
本手法は,ロレンツ誘引器によって生成される合成神経集団に対する最先端のベースラインより優れる。
論文 参考訳(メタデータ) (2025-07-15T17:57:48Z) - T-SHRED: Symbolic Regression for Regularization and Model Discovery with Transformer Shallow Recurrent Decoders [2.8820361301109365]
シャローリカレントデコーダ(SHRED)はスパースセンサ測定からシステム同定と予測に有効である。
我々は、次のステップ状態予測の性能を向上させる時間符号化に変換器(T-SHRED)を活用することにより、SHREDを改善する。
シンボリック回帰は、トレーニング中の潜在空間のダイナミクスを学習し、規則化することによって、モデルの解釈可能性を改善する。
論文 参考訳(メタデータ) (2025-06-18T21:14:38Z) - Multi-Head Self-Attending Neural Tucker Factorization [5.734615417239977]
本稿では,高次元および不完全(HDI)テンソルの学習表現に適したニューラルネットワークに基づくテンソル分解手法を提案する。
提案したMSNTucFモデルでは,観測結果の欠落を推定する上で,最先端のベンチマークモデルと比較して優れた性能を示す。
論文 参考訳(メタデータ) (2025-01-16T13:04:15Z) - A Multi-Layer CNN-GRUSKIP model based on transformer for spatial TEMPORAL traffic flow prediction [0.06597195879147556]
交通流予測は、インテリジェント交通システムITSの基盤のままである。
CNN-GRUSKIPモデルは先駆的なアプローチとして現れる。
このモデルは、ARIMA、Graph Wave Net、HA、LSTM、STGCN、APTといった確立したモデルよりも一貫して優れていた。
強力な予測能力と適応アーキテクチャにより、CNN-GRUSKIPモデルはITSアプリケーションを再定義する。
論文 参考訳(メタデータ) (2025-01-09T21:30:02Z) - Equivariant Graph Neural Operator for Modeling 3D Dynamics [148.98826858078556]
我々は,次のステップの予測ではなく,ダイナミックスを直接トラジェクトリとしてモデル化するために,Equivariant Graph Neural Operator (EGNO)を提案する。
EGNOは3次元力学の時間的進化を明示的に学習し、時間とともに関数として力学を定式化し、それを近似するためにニューラル演算子を学習する。
粒子シミュレーション、人間のモーションキャプチャー、分子動力学を含む複数の領域における総合的な実験は、既存の手法と比較して、EGNOの極めて優れた性能を示す。
論文 参考訳(メタデータ) (2024-01-19T21:50:32Z) - Event-based Shape from Polarization with Spiking Neural Networks [5.200503222390179]
表面正規化を効果的かつ効率的に行うために,シングルタイムステップとマルチタイムステップ・スパイキング・ユニセットを導入する。
本研究は,イベントベースセンシングにおけるSNNの進歩に寄与する。
論文 参考訳(メタデータ) (2023-12-26T14:43:26Z) - EmerNeRF: Emergent Spatial-Temporal Scene Decomposition via
Self-Supervision [85.17951804790515]
EmerNeRFは動的駆動シーンの時空間表現を学習するためのシンプルだが強力なアプローチである。
シーンの幾何学、外観、動き、セマンティクスを自己ブートストラップで同時にキャプチャする。
本手法はセンサシミュレーションにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2023-11-03T17:59:55Z) - Generative Modeling with Phase Stochastic Bridges [49.4474628881673]
拡散モデル(DM)は、連続入力のための最先端の生成モデルを表す。
我々はtextbfphase space dynamics に基づく新しい生成モデリングフレームワークを提案する。
我々のフレームワークは、動的伝播の初期段階において、現実的なデータポイントを生成する能力を示す。
論文 参考訳(メタデータ) (2023-10-11T18:38:28Z) - Disentangling Structured Components: Towards Adaptive, Interpretable and
Scalable Time Series Forecasting [52.47493322446537]
本研究では,時空間パターンの各コンポーネントを個別にモデル化する適応的,解釈可能,スケーラブルな予測フレームワークを開発する。
SCNNは、空間時間パターンの潜在構造を算術的に特徴づける、MSSの事前定義された生成プロセスで動作する。
SCNNが3つの実世界のデータセットの最先端モデルよりも優れた性能を達成できることを示すため、大規模な実験が行われた。
論文 参考訳(メタデータ) (2023-05-22T13:39:44Z) - REMuS-GNN: A Rotation-Equivariant Model for Simulating Continuum
Dynamics [0.0]
本稿では,連続体力学系をシミュレーションする回転同変マルチスケールモデルREMuS-GNNを紹介する。
楕円円柱まわりの非圧縮性流れについて,本手法の実証と評価を行った。
論文 参考訳(メタデータ) (2022-05-05T16:20:37Z) - A Generative Learning Approach for Spatio-temporal Modeling in Connected
Vehicular Network [55.852401381113786]
本稿では,コネクテッドカーの無線アクセス遅延を実現するための総合的時間品質フレームワークであるLaMI(Latency Model Inpainting)を提案する。
LaMIはイメージインペイントと合成のアイデアを採用し、2段階の手順で欠落したレイテンシサンプルを再構築することができる。
特に、パッチ方式のアプローチを用いて各地域で収集されたサンプル間の空間的相関を初めて発見し、その後、原点および高度に相関したサンプルをバラエナオートコーダ(VAE)に供給する。
論文 参考訳(メタデータ) (2020-03-16T03:43:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。