論文の概要: Tracking and Planning with Spatial World Models
- arxiv url: http://arxiv.org/abs/2201.10335v1
- Date: Tue, 25 Jan 2022 14:16:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-26 16:17:53.027657
- Title: Tracking and Planning with Spatial World Models
- Title(参考訳): 空間的世界モデルによる追跡と計画
- Authors: Baris Kayalibay, Atanas Mirchev, Patrick van der Smagt, Justin Bayer
- Abstract要約: 本研究では,異なる世界モデルを用いたリアルタイムナビゲーションとトラッキング手法を提案する。
画像と深度観測のみを用いて15Hzの周波数で最大92%の航法成功率を実現した。
- 参考スコア(独自算出の注目度): 17.698319441265223
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce a method for real-time navigation and tracking with
differentiably rendered world models. Learning models for control has led to
impressive results in robotics and computer games, but this success has yet to
be extended to vision-based navigation. To address this, we transfer advances
in the emergent field of differentiable rendering to model-based control. We do
this by planning in a learned 3D spatial world model, combined with a pose
estimation algorithm previously used in the context of TSDF fusion, but now
tailored to our setting and improved to incorporate agent dynamics. We evaluate
over six simulated environments based on complex human-designed floor plans and
provide quantitative results. We achieve up to 92% navigation success rate at a
frequency of 15 Hz using only image and depth observations under stochastic,
continuous dynamics.
- Abstract(参考訳): 本研究では,異なる世界モデルを用いたリアルタイムナビゲーションとトラッキング手法を提案する。
制御のための学習モデルは、ロボティクスやコンピュータゲームにおいて驚くべき結果をもたらしたが、この成功はまだビジョンベースのナビゲーションに拡張されていない。
これを解決するために、微分可能レンダリングの創発的な分野の進歩をモデルベース制御に転送する。
学習した3次元空間世界モデルで計画し, tsdfフュージョンの文脈で使用されていたポーズ推定アルゴリズムと組み合わせて, エージェントダイナミクスを組み込むように改良した。
複雑な人間設計フロアプランに基づくシミュレーション環境を6つ以上評価し,定量的な結果を得た。
確率的・連続的力学下での画像と深度観測のみを用いて、15Hzの周波数で最大92%の航法成功率を達成する。
関連論文リスト
- 3D Multi-Object Tracking with Semi-Supervised GRU-Kalman Filter [6.13623925528906]
3D Multi-Object Tracking (MOT)は、自律運転やロボットセンシングのようなインテリジェントなシステムに不可欠である。
本稿では,学習可能なカルマンフィルタを移動モジュールに導入するGRUベースのMOT法を提案する。
このアプローチは、データ駆動学習を通じてオブジェクトの動き特性を学習することができ、手動モデル設計やモデルエラーを回避することができる。
論文 参考訳(メタデータ) (2024-11-13T08:34:07Z) - Gaussian Splatting to Real World Flight Navigation Transfer with Liquid Networks [93.38375271826202]
本研究では,シミュレート・トゥ・リアルな視覚四重項ナビゲーションタスクにおける分布シフトに対する一般化とロバスト性を改善する手法を提案する。
まず,擬似飛行力学とガウススプラッティングを統合してシミュレータを構築し,その後,液状ニューラルネットワークを用いてロバストなナビゲーションポリシーを訓練する。
このようにして、我々は3次元ガウススプラッティングラディアンス場レンダリング、専門家による実演訓練データのプログラミング、およびLiquid Networkのタスク理解能力の進歩を組み合わせたフルスタックの模倣学習プロトコルを得る。
論文 参考訳(メタデータ) (2024-06-21T13:48:37Z) - 3D Hand Mesh Recovery from Monocular RGB in Camera Space [3.0453197258042213]
本研究では,ルート相対格子とルート回復タスクの並列処理を行うネットワークモデルを提案する。
暗黙的な学習手法を2次元ヒートマップに適用し、異なるサブタスク間の2次元キューの互換性を向上させる。
提案モデルは最先端のモデルに匹敵する。
論文 参考訳(メタデータ) (2024-05-12T05:36:37Z) - DO3D: Self-supervised Learning of Decomposed Object-aware 3D Motion and
Depth from Monocular Videos [76.01906393673897]
本研究では,モノクラービデオから3次元運動と深度を協調的に学習する自己教師手法を提案する。
本システムでは,深度を推定する深度推定モジュールと,エゴモーションと3次元物体の動きを推定する新しい分解対象3次元運動推定モジュールを備える。
我々のモデルは評価されたすべての設定において優れたパフォーマンスを提供する。
論文 参考訳(メタデータ) (2024-03-09T12:22:46Z) - Predictive Experience Replay for Continual Visual Control and
Forecasting [62.06183102362871]
視覚力学モデリングのための新しい連続学習手法を提案し,その視覚制御と予測における有効性について検討する。
まず,タスク固有のダイナミクスをガウスの混合で学習する混合世界モデルを提案し,その上で,破滅的な忘れを克服するための新たなトレーニング戦略を提案する。
我々のモデルは,DeepMind Control と Meta-World のベンチマークにおいて,既存の連続的学習アルゴリズムと視覚的RLアルゴリズムの単純な組み合わせよりも優れている。
論文 参考訳(メタデータ) (2023-03-12T05:08:03Z) - Data-Driven Machine Learning Models for a Multi-Objective Flapping Fin
Unmanned Underwater Vehicle Control System [0.5522489572615558]
我々は,キネマティクスからスラストへのニューラルネットワークモデルを利用した検索に基づく逆モデルを構築し,制御系の設計を行う。
この逆モデルを統合した制御系が、オンラインのサイクル・ツー・サイクルの調整を行い、異なるシステムの目的を優先順位付けする方法を実証する。
論文 参考訳(メタデータ) (2022-09-14T01:55:15Z) - Physics-Inspired Temporal Learning of Quadrotor Dynamics for Accurate
Model Predictive Trajectory Tracking [76.27433308688592]
クオーロタのシステムダイナミクスを正確にモデル化することは、アジャイル、安全、安定したナビゲーションを保証する上で非常に重要です。
本稿では,ロボットの経験から,四重項系の力学を純粋に学習するための新しい物理インスパイアされた時間畳み込みネットワーク(PI-TCN)を提案する。
提案手法は,スパース時間的畳み込みと高密度フィードフォワード接続の表現力を組み合わせて,正確なシステム予測を行う。
論文 参考訳(メタデータ) (2022-06-07T13:51:35Z) - Gradient-Based Trajectory Optimization With Learned Dynamics [80.41791191022139]
データからシステムの微分可能なダイナミクスモデルを学習するために、機械学習技術を使用します。
ニューラルネットワークは、大規模な時間的地平線に対して、非常に非線形な振る舞いを正確にモデル化できることが示される。
ハードウェア実験において、学習したモデルがSpotとRadio- controlled (RC)の両方の複雑な力学を表現できることを実証した。
論文 参考訳(メタデータ) (2022-04-09T22:07:34Z) - Model-Based Visual Planning with Self-Supervised Functional Distances [104.83979811803466]
モデルに基づく視覚的目標達成のための自己監視手法を提案する。
私たちのアプローチは、オフラインでラベルなしのデータを使って完全に学習します。
このアプローチは,モデルフリーとモデルベース先行手法の両方で大幅に性能が向上することがわかった。
論文 参考訳(メタデータ) (2020-12-30T23:59:09Z) - Variational State-Space Models for Localisation and Dense 3D Mapping in
6 DoF [17.698319441265223]
深部状態空間モデルにおける近似ベイズ推定として,空間環境における6-DoFの局所化と3次元密度再構成の問題を解く。
この結果、現在の最先端のビジュアルSLAMソリューションに欠ける、世界の表現力のある予測モデルが生まれる。
我々は、最先端のビジュアル・慣性オドメトリーシステムの性能に近づいた、現実的な無人航空機の飛行データに対するアプローチを評価した。
論文 参考訳(メタデータ) (2020-06-17T22:06:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。