論文の概要: Minimalist Visual Inertial Odometry
- arxiv url: http://arxiv.org/abs/2605.19990v1
- Date: Tue, 19 May 2026 15:27:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:09.486252
- Title: Minimalist Visual Inertial Odometry
- Title(参考訳): ミニマリスト視覚慣性オドメトリー
- Authors: Francesco Pasti, Jeremy Klotz, Nicola Bellotto, Shree K. Nayar,
- Abstract要約: 本研究は,4つの視覚的計測とIMUで差動駆動ロボットの頑健な動作推定が可能であることを示す,平面計測に対する最小限のアプローチを示す。
私たちの重要な洞察は、光ガボルマスクを通して世界を感知する4つの下向きフォトダイオードが、速度を符号化する信号を生成するということです。
差動駆動ロボットに搭載されたプロトタイプセンサを用いて,本手法の有効性を検証した。
- 参考スコア(独自算出の注目度): 12.117662372066768
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Visual-Inertial Odometry(VIO), which is critical to mobile robot navigation, uses cameras with a large number of pixels. Capturing and processing camera images requires significant resources. This work presents a minimalist approach to planar odometry, demonstrating that just four visual measurements and an IMU can provide robust motion estimation for differential-drive robots. Our key insight is that four downward-facing photodiodes that sense the world through optical Gabor masks produce signals that encode speed. Based on this, we jointly optimize the mask parameters alongside a Temporal Convolutional Network (TCN) using a physically-grounded simulator. The resulting model decodes speed from just the four measurements produced by the photodiodes. Pairing these estimates with the angular speed from an IMU yields a continuous planar trajectory. We validate our approach with a prototype sensor mounted on a differential drive robot. Across diverse indoor and outdoor terrains, our system closely tracks the reference ground truth without any real-world fine-tuning. Our work shows that minimalist sensing enables efficient and accurate planar odometry.
- Abstract(参考訳): 移動ロボットナビゲーションにとって重要な視覚慣性オドメトリー(VIO)は、多数の画素を持つカメラを使用する。
カメラ画像のキャプチャと処理には、かなりのリソースが必要である。
本研究は,4つの視覚的計測とIMUで差動駆動ロボットの頑健な動作推定が可能であることを示す,平面計測に対する最小限のアプローチを示す。
私たちの重要な洞察は、光ガボルマスクを通して世界を感知する4つの下向きフォトダイオードが、速度を符号化する信号を生成するということです。
そこで本研究では,物理的に座屈したシミュレータを用いて,仮面パラメータと仮面畳み込みネットワーク(TCN)を協調的に最適化する。
得られたモデルは、フォトダイオードによって生成された4つの測定結果から速度をデコードする。
これらの推定をIMUから角速度でペアリングすると、連続した平面軌道が得られる。
差動駆動ロボットに搭載されたプロトタイプセンサを用いて,本手法の有効性を検証した。
様々な屋内および屋外の地形において、我々のシステムは現実世界の微調整なしで、参照された地上の真実を綿密に追跡する。
我々の研究は、最小限のセンシングが効率的かつ正確な平面オードメトリーを可能にすることを示している。
関連論文リスト
- Low Latency Gaze Tracking via Latent Optical Sensing [12.829480947195412]
完全受動光エンコーダを用いてタスク関連潜在機能を直接取得するリアルタイム視線追跡システムを提案する。
本研究では,実世界のシミュレーションデータと実世界のデータにアプローチの有効性を実証し,競合する視線推定精度を実現する。
この研究は、超低レイテンシ、計算効率の人-コンピュータインタラクションシステムにおけるタスク駆動型光センシングの可能性を強調した。
論文 参考訳(メタデータ) (2026-05-18T07:46:25Z) - Driving on Registers [95.27138642798472]
DrivoRは、エンドツーエンドの自動運転のためのシンプルで効率的なトランスフォーマーベースのアーキテクチャである。
提案手法は、事前訓練された視覚変換器(ViT)上に構築され、マルチカメラ機能をコンパクトなシーン表現に圧縮するカメラ対応レジスタトークンを導入している。
この結果から,純変圧器アーキテクチャと目標トークン圧縮を組み合わせることで,高精度で適応的なエンド・ツー・エンド・ドライブを実現するのに十分であることが示唆された。
論文 参考訳(メタデータ) (2026-01-08T16:28:24Z) - MM3DGS SLAM: Multi-modal 3D Gaussian Splatting for SLAM Using Vision, Depth, and Inertial Measurements [59.70107451308687]
カメラ画像と慣性測定による地図表現に3Dガウスアンを用いることで、精度の高いSLAMが実現できることを示す。
我々の手法であるMM3DGSは、より高速なスケール認識と軌道追跡の改善により、事前レンダリングの限界に対処する。
また,カメラと慣性測定ユニットを備えた移動ロボットから収集したマルチモーダルデータセットUT-MMもリリースした。
論文 参考訳(メタデータ) (2024-04-01T04:57:41Z) - Trajectory Poisson multi-Bernoulli mixture filter for traffic monitoring
using a drone [17.636403357588897]
本稿では,光・熱カメラを搭載したドローンを用いた交通監視のための多目的追跡(MOT)アルゴリズムを提案する。
画像上の物体検出は、カメラの種類ごとにニューラルネットワークを用いて行われる。
合成および実験データセットにおけるTPMBMフィルタの精度を検証した。
論文 参考訳(メタデータ) (2023-06-29T12:22:47Z) - Neural Scene Representation for Locomotion on Structured Terrain [56.48607865960868]
本研究では,都市環境を横断する移動ロボットの局所的な地形を再構築する学習手法を提案する。
搭載されたカメラとロボットの軌道からの深度測定のストリームを用いて、ロボットの近傍の地形を推定する。
ノイズ測定とカメラ配置の盲点からの大量の欠落データにもかかわらず,シーンを忠実に再構築する3次元再構成モデルを提案する。
論文 参考訳(メタデータ) (2022-06-16T10:45:17Z) - Deep Learning for Real Time Satellite Pose Estimation on Low Power Edge
TPU [58.720142291102135]
本稿では,ニューラルネットワークアーキテクチャを利用したポーズ推定ソフトウェアを提案する。
我々は、低消費電力の機械学習アクセラレーターが宇宙での人工知能の活用を可能にしていることを示す。
論文 参考訳(メタデータ) (2022-04-07T08:53:18Z) - CNN-based Omnidirectional Object Detection for HermesBot Autonomous
Delivery Robot with Preliminary Frame Classification [53.56290185900837]
予備的バイナリフレーム分類を用いた物体検出のためのニューラルネットワークの最適化アルゴリズムを提案する。
周囲に6台のローリングシャッターカメラを備えた自律移動ロボットを360度視野として実験装置として使用した。
論文 参考訳(メタデータ) (2021-10-22T15:05:37Z) - VILENS: Visual, Inertial, Lidar, and Leg Odometry for All-Terrain Legged Robots [5.789654849162465]
本報告では,足ロボットのための視覚的慣性ライダー脚ナビゲーションシステム(VILENS)について述べる。
重要な新規性は、信頼性の高い動作を実現するために、4つの異なるセンサーモードの密接な融合である。
最先端の疎結合アプローチと比較して, 平均62%の翻訳誤差と51%の回転誤差が改善した。
論文 参考訳(メタデータ) (2021-07-15T11:05:00Z) - End-to-end Learning for Inter-Vehicle Distance and Relative Velocity
Estimation in ADAS with a Monocular Camera [81.66569124029313]
本稿では,ディープニューラルネットワークのエンドツーエンドトレーニングに基づくカメラによる車間距離と相対速度推定手法を提案する。
提案手法の重要な特徴は,2つの時間的単眼フレームによって提供される複数の視覚的手がかりの統合である。
また,移動場における視線歪みの影響を緩和する車両中心サンプリング機構を提案する。
論文 参考訳(メタデータ) (2020-06-07T08:18:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。