論文の概要: DefVINS: Visual-Inertial Odometry for Deformable Scenes
- arxiv url: http://arxiv.org/abs/2601.00702v1
- Date: Fri, 02 Jan 2026 14:40:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-05 15:04:33.586554
- Title: DefVINS: Visual-Inertial Odometry for Deformable Scenes
- Title(参考訳): DefVINS: 変形可能なシーンのためのビジュアル慣性オドメトリー
- Authors: Samuel Cerezo, Javier Civera,
- Abstract要約: 変形可能なシーンは、視覚-慣性オードメトリーの根底にある剛性仮定に反する。
我々は,厳密なIMUアンコール状態と非剛性ワープを分離する視覚慣性オドメトリーフレームワークであるDefVINSを紹介する。
- 参考スコア(独自算出の注目度): 14.028399155214068
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deformable scenes violate the rigidity assumptions underpinning classical visual-inertial odometry (VIO), often leading to over-fitting to local non-rigid motion or severe drift when deformation dominates visual parallax. We introduce DefVINS, a visual-inertial odometry framework that explicitly separates a rigid, IMU-anchored state from a non--rigid warp represented by an embedded deformation graph. The system is initialized using a standard VIO procedure that fixes gravity, velocity, and IMU biases, after which non-rigid degrees of freedom are activated progressively as the estimation becomes well conditioned. An observability analysis is included to characterize how inertial measurements constrain the rigid motion and render otherwise unobservable modes identifiable in the presence of deformation. This analysis motivates the use of IMU anchoring and informs a conditioning-based activation strategy that prevents ill-posed updates under poor excitation. Ablation studies demonstrate the benefits of combining inertial constraints with observability-aware deformation activation, resulting in improved robustness under non-rigid environments.
- Abstract(参考訳): 変形可能なシーンは、古典的視覚慣性眼球運動(VIO)を支える剛性仮定に反し、しばしば局所的な非剛性運動や、変形が視覚視差を支配する場合の激しいドリフトに過度に適合する。
組込み変形グラフで表される非剛体ワープから厳密なIMUアンコール状態を明確に分離する視覚慣性オドメトリーフレームワークであるDefVINSを紹介する。
このシステムは、重力、速度、IMUバイアスを補正する標準のVIO法を用いて初期化され、その後、推定が良好になるにつれて、非厳密な自由度が徐々に活性化される。
可観測性解析は、慣性測定が剛性運動をいかに制限するかを特徴付け、変形の有無で識別できないモードをレンダリングする。
この分析は、IMUアンカーの使用を動機付け、低励起下での不正な更新を防止する条件付けベースのアクティベーション戦略を通知する。
アブレーション研究は、慣性制約と可観測性を考慮した変形活性化を組み合わせ、非剛性環境下での堅牢性を改善する利点を示す。
関連論文リスト
- Same Answer, Different Representations: Hidden instability in VLMs [65.36933543377346]
本稿では,内部埋め込みドリフト,スペクトル感度,構造的滑らかさを計測する表現認識・周波数認識評価フレームワークを提案する。
このフレームワークを,SEEDBench,MMMU,POPEデータセットを対象とする最新のビジョン言語モデル(VLM)に適用する。
論文 参考訳(メタデータ) (2026-02-06T12:24:26Z) - Adaptive Visual Autoregressive Acceleration via Dual-Linkage Entropy Analysis [50.48301331112126]
我々は,Visual AutoRegressive モデリングのためのトレーニング不要なトークン削減促進フレームワーク NOVA を提案する。
NOVAは、スケールエントロピー成長の屈折点をオンライン同定することにより、推論中のアクティベーションアクティベーションスケールを適応的に決定する。
実験と解析により、NOVAはシンプルで効果的なトレーニングフリー加速フレームワークとして評価される。
論文 参考訳(メタデータ) (2026-02-01T17:29:42Z) - GO-OSC and VASH: Geometry-Aware Representation Learning for Early Degradation Detection in Oscillatory Systems [0.0]
本稿では,振動時系列の幾何学的表現学習フレームワークGO-OSCを紹介する。
初期位相のみの劣化下では、エネルギーベースの統計は1次検出能力がゼロであるのに対し、幾何プローブは厳密に正の感度を得る。
解析では, 線形探索が不特定表現の下でいつ, なぜ失敗するのかを特徴付けるとともに, 正準化が統計的検出性を回復することを示す。
論文 参考訳(メタデータ) (2026-01-24T09:35:57Z) - Machine learning assisted state prediction of misspecified linear dynamical system via modal reduction [0.0]
固定されたパラメータを持つパラメトリックモデルは、幾何学、物質的挙動、減衰、境界条件の単純化による重要な物理的効果を省略することが多い。
本研究は、高次元有限要素に基づく構造力学系におけるMFE推定と補正のための包括的枠組みを導入する。
計算的トラクタビリティを確保するため、FEシステムは縮小されたモーダルベースに投影され、メッシュ不変のニューラルネットワークは、モーダル状態を不一致推定にマッピングする。
論文 参考訳(メタデータ) (2026-01-08T10:14:27Z) - SIGMA: Scalable Spectral Insights for LLM Collapse [51.863164847253366]
SIGMA(Spectral Inequalities for Gram Matrix Analysis)は,モデル崩壊のための統一的なフレームワークである。
行列のスペクトル上の決定論的境界を導出するベンチマークを利用することで、SIGMAは表現空間の収縮を追跡するために数学的に基底化された計量を提供する。
我々は、SIGMAが状態への遷移を効果的に捉え、崩壊のメカニズムに関する理論的知見の両方を提供することを示した。
論文 参考訳(メタデータ) (2026-01-06T19:47:11Z) - PIS: A Generalized Physical Inversion Solver for Arbitrary Sparse Observations via Set-Conditioned Diffusion [1.7257650649008898]
真に任意の観測集合からの逆変換が可能な集合条件拡散フレームワークを提案する。
PISはSet Transformerベースのエンコーダを使用して、任意の数や幾何学の測定や、例外的な堅牢性のためのコサインアニーリングされたスペーサ性カリキュラムを扱う。
PISはDarcy flow, wavefield inversion (Helmholtz), structure health monitoring (Hooke's Law)の3つの困難PDE逆問題に対して評価される。
論文 参考訳(メタデータ) (2025-12-14T06:28:55Z) - LyTimeT: Towards Robust and Interpretable State-Variable Discovery [7.505092370141079]
LyTimeTは、解釈可能な変数抽出のためのフレームワークである。
動的ビデオシステムの堅牢で安定した潜伏表現を学習する。
その結果,時間的注意と安定性の制約を組み合わせることで,予測モデルが得られることがわかった。
論文 参考訳(メタデータ) (2025-10-22T16:03:10Z) - Detection and Recovery of Adversarial Slow-Pose Drift in Offloaded Visual-Inertial Odometry [0.0]
エッジサーバにVIOをオフロードする現在のトレンドは、サーバ側の脅威表面を導く可能性がある。
非教師付きラベルなし検出・回復機構を提案する。
ILLIXRテストベッドを用いたリアルオフロードVIO環境におけるアプローチの評価を行った。
論文 参考訳(メタデータ) (2025-09-08T18:31:40Z) - MASIV: Toward Material-Agnostic System Identification from Videos [76.36666848173141]
MASIVは、物質に依存しないシステム識別のためのビジョンベースのフレームワークである。
学習可能なニューラルモデルを採用し、シーン固有の物質を事前に仮定することなく、オブジェクトのダイナミクスを推定する。
幾何的精度、レンダリング品質、一般化能力において最先端の性能を達成する。
論文 参考訳(メタデータ) (2025-08-01T23:23:45Z) - Solving Inverse Problems with FLAIR [68.87167940623318]
本稿では,フローベース生成モデルを逆問題に先立って活用する学習自由変分フレームワークFLAIRを提案する。
標準画像ベンチマークの結果、FLAIRは再現性やサンプルの多様性の観点から、既存の拡散法や流れ法よりも一貫して優れていることが示された。
論文 参考訳(メタデータ) (2025-06-03T09:29:47Z) - A Plug-and-Play Learning-based IMU Bias Factor for Robust Visual-Inertial Odometry [27.62788405443008]
Inertial Prior Network (IPNet) を利用した新しいプラグアンドプレイモジュールを提案する。
IPNetは、特定のプラットフォームの動作特性を暗黙的にキャプチャすることで、IMUバイアスを推論する。
本研究では、まず、スライドウインドウアプローチを用いて生のIMUデータのみを用いてバイアスを直接推測する。
論文 参考訳(メタデータ) (2025-03-16T14:45:19Z) - DynaVINS++: Robust Visual-Inertial State Estimator in Dynamic Environments by Adaptive Truncated Least Squares and Stable State Recovery [11.37707868611451]
我々はmboxtextitDynaVINS++と呼ばれる堅牢なVINSフレームワークを提案する。
我々のアプローチは、突然の動的オブジェクトを含む動的環境における有望なパフォーマンスを示す。
論文 参考訳(メタデータ) (2024-10-20T12:13:45Z) - Extreme Miscalibration and the Illusion of Adversarial Robustness [66.29268991629085]
敵の訓練は、しばしばモデルの堅牢性を高めるために使用される。
我々は、この観測されたロバストネスの利得はロバストネスの錯覚(IOR)であることを示した。
我々は,NLPコミュニティに対して,試験時間温度のスケーリングを堅牢性評価に組み込むよう促す。
論文 参考訳(メタデータ) (2024-02-27T13:49:12Z) - Towards Scale-Aware, Robust, and Generalizable Unsupervised Monocular
Depth Estimation by Integrating IMU Motion Dynamics [74.1720528573331]
教師なし単眼深度と自我運動推定は近年広く研究されている。
我々は、視覚情報とIMUモーションダイナミクスを統合した新しいスケールアウェアフレームワークDynaDepthを提案する。
我々は、KITTIおよびMake3Dデータセット上で広範囲な実験とシミュレーションを行うことにより、DynaDepthの有効性を検証する。
論文 参考訳(メタデータ) (2022-07-11T07:50:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。