論文の概要: Visual Forecasting as a Mid-level Representation for Avoidance
- arxiv url: http://arxiv.org/abs/2310.07724v1
- Date: Sun, 17 Sep 2023 13:32:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-15 14:17:00.487929
- Title: Visual Forecasting as a Mid-level Representation for Avoidance
- Title(参考訳): 回避のための中水準表現としての視覚予測
- Authors: Hsuan-Kung Yang, Tsung-Chih Chiang, Ting-Ru Liu, Chun-Wei Huang,
Jou-Min Liu, Chun-Yi Lee
- Abstract要約: 動的物体を持つ環境におけるナビゲーションの課題は、自律エージェントの研究において依然として中心的な課題である。
予測手法は約束を守るが、正確な状態情報に依存しているため、実際の実装では実用的ではない。
本研究では,視覚的予測を革新的な代替手段として提示する。
- 参考スコア(独自算出の注目度): 8.712750753534532
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The challenge of navigation in environments with dynamic objects continues to
be a central issue in the study of autonomous agents. While predictive methods
hold promise, their reliance on precise state information makes them less
practical for real-world implementation. This study presents visual forecasting
as an innovative alternative. By introducing intuitive visual cues, this
approach projects the future trajectories of dynamic objects to improve agent
perception and enable anticipatory actions. Our research explores two distinct
strategies for conveying predictive information through visual forecasting: (1)
sequences of bounding boxes, and (2) augmented paths. To validate the proposed
visual forecasting strategies, we initiate evaluations in simulated
environments using the Unity engine and then extend these evaluations to
real-world scenarios to assess both practicality and effectiveness. The results
confirm the viability of visual forecasting as a promising solution for
navigation and obstacle avoidance in dynamic environments.
- Abstract(参考訳): 動的物体を持つ環境におけるナビゲーションの課題は、自律エージェントの研究における中心的な課題である。
予測手法は約束を守るが、正確な状態情報に依存しているため、実際の実装では実用的ではない。
本研究は,視覚予測を革新的な代替手段として提示する。
直感的な視覚的手がかりを導入することにより、動的物体の将来の軌跡を投影し、エージェント知覚を改善し、予測行動を可能にする。
本研究は,(1)境界ボックスのシーケンス,(2)拡張経路の2つの異なる予測情報伝達戦略を探索する。
提案する視覚予測戦略を検証するために,unityエンジンを用いたシミュレーション環境における評価を開始し,実用性と有効性を評価する実世界シナリオに拡張する。
その結果,動的環境におけるナビゲーションと障害物回避のための有望なソリューションとしての視覚予測の有効性が確認された。
関連論文リスト
- Narrowing the Gap between Vision and Action in Navigation [28.753809306008996]
本稿では,高レベル動作予測を併用した低レベル動作デコーダを提案する。
我々のエージェントは、ハイレベルアクションとローレベルアクションの両方の強力なベースラインと比較して、ナビゲーション性能の指標を改善することができる。
論文 参考訳(メタデータ) (2024-08-19T20:09:56Z) - AdaOcc: Adaptive Forward View Transformation and Flow Modeling for 3D Occupancy and Flow Prediction [56.72301849123049]
CVPR 2024 における nuScenes Open-Occ データセットチャレンジにおいて,視覚中心の3次元活動とフロー予測トラックのソリューションを提案する。
我々の革新的なアプローチは、適応的なフォワード・ビュー・トランスフォーメーションとフロー・モデリングを取り入れることで、3次元の占有率とフロー予測を向上させる2段階のフレームワークである。
提案手法は回帰と分類を組み合わせることで,様々な場面におけるスケールの変動に対処し,予測フローを利用して将来のフレームに現行のボクセル特徴をワープする。
論文 参考訳(メタデータ) (2024-07-01T16:32:15Z) - OOSTraj: Out-of-Sight Trajectory Prediction With Vision-Positioning Denoising [49.86409475232849]
軌道予測はコンピュータビジョンと自律運転の基本である。
この分野における既存のアプローチは、しばしば正確で完全な観測データを仮定する。
本稿では,視覚的位置決め技術を利用した視線外軌道予測手法を提案する。
論文 参考訳(メタデータ) (2024-04-02T18:30:29Z) - A Reliable Representation with Bidirectional Transition Model for Visual
Reinforcement Learning Generalization [39.6041403130768]
本稿では, 環境遷移を前方と後方の両方で双方向に予測し, 信頼性のある表現を抽出するBidirectional Transition (BiT) モデルを提案する。
本モデルでは,DeepMind Controlスイートの2つの設定に対して,競合一般化性能とサンプル効率を示す。
論文 参考訳(メタデータ) (2023-12-04T14:19:36Z) - Towards Motion Forecasting with Real-World Perception Inputs: Are
End-to-End Approaches Competitive? [93.10694819127608]
実世界の知覚入力を用いた予測手法の統一評価パイプラインを提案する。
我々の詳細な調査では、キュレートされたデータから知覚ベースのデータへ移行する際の大きなパフォーマンスギャップが明らかになりました。
論文 参考訳(メタデータ) (2023-06-15T17:03:14Z) - Motion-Scenario Decoupling for Rat-Aware Video Position Prediction:
Strategy and Benchmark [49.58762201363483]
本研究では,個人や環境の影響要因を考慮し,生物ロボットの動き予測データセットであるRatPoseを紹介する。
本稿では,シナリオ指向とモーション指向を効果的に分離するDual-stream Motion-Scenario Decouplingフレームワークを提案する。
難易度が異なるタスクに対して,提案したtextitDMSD フレームワークの大幅な性能向上を示す。
論文 参考訳(メタデータ) (2023-05-17T14:14:31Z) - Predictive Experience Replay for Continual Visual Control and
Forecasting [62.06183102362871]
視覚力学モデリングのための新しい連続学習手法を提案し,その視覚制御と予測における有効性について検討する。
まず,タスク固有のダイナミクスをガウスの混合で学習する混合世界モデルを提案し,その上で,破滅的な忘れを克服するための新たなトレーニング戦略を提案する。
我々のモデルは,DeepMind Control と Meta-World のベンチマークにおいて,既存の連続的学習アルゴリズムと視覚的RLアルゴリズムの単純な組み合わせよりも優れている。
論文 参考訳(メタデータ) (2023-03-12T05:08:03Z) - Dynamics-Aware Spatiotemporal Occupancy Prediction in Urban Environments [37.00873004170998]
本稿では,ディープネットワークアーキテクチャを用いて2つの機能を統合するフレームワークを提案する。
本手法は実世界のOpenデータセット上で検証され,ベースライン法よりも高い予測精度を示す。
論文 参考訳(メタデータ) (2022-09-27T06:12:34Z) - Visual Sensor Pose Optimisation Using Rendering-based Visibility Models
for Robust Cooperative Perception [4.5144287492490625]
Visual Sensor Networksは、複雑な道路セグメントにおける自動運転のためのインフラストラクチャのサポートなど、さまざまな認識アプリケーションで使用することができる。
このようなネットワーク内のセンサーのポーズは、環境と対象のカバレッジを直接決定する。
本稿では,勾配上昇法とプログラミング法に基づく2つの新しいセンサポーズ最適化手法を提案する。
論文 参考訳(メタデータ) (2021-06-09T18:02:32Z) - Instance-Aware Predictive Navigation in Multi-Agent Environments [93.15055834395304]
エージェント間の相互作用と将来のシーン構造を予測するIPC(Instance-Aware Predictive Control)アプローチを提案する。
我々は,ego中心の視点でエージェント間のインタラクションを推定するために,新しいマルチインスタンスイベント予測モジュールを採用する。
シーンレベルとインスタンスレベルの両方の予測状態をより有効活用するために、一連のアクションサンプリング戦略を設計します。
論文 参考訳(メタデータ) (2021-01-14T22:21:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。