論文の概要: Learning Efficient Navigation in Vortical Flow Fields
- arxiv url: http://arxiv.org/abs/2102.10536v1
- Date: Sun, 21 Feb 2021 07:25:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-23 14:47:57.134877
- Title: Learning Efficient Navigation in Vortical Flow Fields
- Title(参考訳): 渦流場における効率的なナビゲーションの学習
- Authors: Peter Gunnarson, Ioannis Mandralis, Guido Novati, Petros Koumoutsakos,
John O. Dabiri
- Abstract要約: 非定常2次元流れ場を介して固定速度スイマーを操るために,新しい強化学習アルゴリズムを適用した。
このアルゴリズムは、環境の手がかりを深層ニューラルネットワークに入力し、スイマーの行動を決定する。
速度センシングアプローチは、バイオミメティック渦センシングアプローチをほぼ2倍の成功率で上回った。
- 参考スコア(独自算出の注目度): 6.585044528359311
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Efficient point-to-point navigation in the presence of a background flow
field is important for robotic applications such as ocean surveying. In such
applications, robots may only have knowledge of their immediate surroundings or
be faced with time-varying currents, which limits the use of optimal control
techniques for planning trajectories. Here, we apply a novel Reinforcement
Learning algorithm to discover time-efficient navigation policies to steer a
fixed-speed swimmer through an unsteady two-dimensional flow field. The
algorithm entails inputting environmental cues into a deep neural network that
determines the swimmer's actions, and deploying Remember and Forget Experience
replay. We find that the resulting swimmers successfully exploit the background
flow to reach the target, but that this success depends on the type of sensed
environmental cue. Surprisingly, a velocity sensing approach outperformed a
bio-mimetic vorticity sensing approach by nearly two-fold in success rate.
Equipped with local velocity measurements, the reinforcement learning algorithm
achieved near 100% success in reaching the target locations while approaching
the time-efficiency of paths found by a global optimal control planner.
- Abstract(参考訳): 海洋測量などのロボットアプリケーションでは、バックグラウンドフローフィールドの存在下での効率的なポイントツーポイントナビゲーションが重要です。
このようなアプリケーションでは、ロボットは周囲の状況を知るか、時間的に変化する電流に直面するだけであり、軌道計画に最適な制御技術を使うことは制限される。
本研究では,新しい強化学習アルゴリズムを適用し,非定常2次元流れ場を介して固定速度スイマーを操る時間効率のよいナビゲーションポリシを探索する。
このアルゴリズムは、環境手がかりをディープニューラルネットワークに入力し、スイマーの行動を判断し、記憶と記憶のリプレイを展開する。
得られたスイマーは,目標に達するために背景の流れをうまく利用できたが,この成功は知覚された環境条件の種類に依存している。
驚くべきことに、速度センシングアプローチは、バイオミメティック渦センシングアプローチをほぼ2倍の成功率で上回った。
局所速度測定を取り入れた強化学習アルゴリズムは,グローバルな最適制御プランナーが発見する経路の時間効率に近づきながら,目標地点に到達するのにほぼ100%の成功を収めた。
関連論文リスト
- MPVO: Motion-Prior based Visual Odometry for PointGoal Navigation [3.9974562667271507]
視覚計測(VO)は,室内環境におけるエンボディエージェントの正確なポイントゴールナビゲーションを可能にするために不可欠である。
近年の深層学習VO法は, 頑健な性能を示すが, トレーニング中のサンプル不効率に悩まされている。
エージェントが環境をナビゲートしている間に利用可能な動作先に基づいて、ロバストでサンプル効率の良いVOパイプラインを提案する。
論文 参考訳(メタデータ) (2024-11-07T15:36:49Z) - LLM-A*: Large Language Model Enhanced Incremental Heuristic Search on Path Planning [91.95362946266577]
経路計画はロボット工学と自律航法における基本的な科学的問題である。
A*やその変種のような伝統的なアルゴリズムは、パスの妥当性を保証することができるが、状態空間が大きくなるにつれて、計算とメモリの非効率が著しく低下する。
本稿では, A* の正確なパスフィニング能力と LLM のグローバルな推論能力とを相乗的に組み合わせた LLM ベースの経路計画法を提案する。
このハイブリッドアプローチは、特に大規模シナリオにおいて、パス妥当性の完全性を維持しながら、時間と空間の複雑さの観点からパスフィニング効率を向上させることを目的としている。
論文 参考訳(メタデータ) (2024-06-20T01:24:30Z) - Histogram Layer Time Delay Neural Networks for Passive Sonar
Classification [58.720142291102135]
時間遅延ニューラルネットワークとヒストグラム層を組み合わせた新しい手法により,特徴学習の改善と水中音響目標分類を実現する。
提案手法はベースラインモデルより優れており,受動的ソナー目標認識のための統計的文脈を取り入れた有効性を示す。
論文 参考訳(メタデータ) (2023-07-25T19:47:26Z) - CCE: Sample Efficient Sparse Reward Policy Learning for Robotic Navigation via Confidence-Controlled Exploration [72.24964965882783]
CCE (Confidence-Controlled Exploration) は、ロボットナビゲーションのようなスパース報酬設定のための強化学習アルゴリズムのトレーニングサンプル効率を高めるために設計された。
CCEは、勾配推定と政策エントロピーの間の新しい関係に基づいている。
我々は、CCEが一定軌跡長とエントロピー正規化を用いる従来の手法より優れるシミュレーションおよび実世界の実験を通して実証する。
論文 参考訳(メタデータ) (2023-06-09T18:45:15Z) - Visual-Language Navigation Pretraining via Prompt-based Environmental
Self-exploration [83.96729205383501]
本稿では,言語埋め込みの高速適応を実現するために,プロンプトベースの学習を導入する。
我々のモデルは、VLNやREVERIEを含む多様な視覚言語ナビゲーションタスクに適応することができる。
論文 参考訳(メタデータ) (2022-03-08T11:01:24Z) - Deep Learning Aided Packet Routing in Aeronautical Ad-Hoc Networks
Relying on Real Flight Data: From Single-Objective to Near-Pareto
Multi-Objective Optimization [79.96177511319713]
航空アドホックネットワーク(AANET)のルーティングを支援するために、ディープラーニング(DL)を起動する。
フォワードノードによって観測された局所的な地理的情報を最適な次のホップを決定するために必要な情報にマッピングするために、ディープニューラルネットワーク(DNN)が考案される。
DL支援ルーティングアルゴリズムを多目的シナリオに拡張し,遅延を最小化し,経路容量を最大化し,経路寿命を最大化する。
論文 参考訳(メタデータ) (2021-10-28T14:18:22Z) - Integrating Deep Reinforcement and Supervised Learning to Expedite
Indoor Mapping [0.0]
その結果,両手法を組み合わせることで,フロンティアをベースとした移動計画に比べて最大75%のマッピング時間を短縮できることがわかった。
一つは、深層強化学習を用いて、運動プランナーを訓練することである。
2つ目は、事前訓練された生成深部ニューラルネットワークがマップ予測器として機能することである。
論文 参考訳(メタデータ) (2021-09-17T12:07:07Z) - Autonomous Drone Racing with Deep Reinforcement Learning [39.757652701917166]
ドローンレースのような多くのロボットタスクにおいて、ゴールはできるだけ速くコースポイントを移動することである。
重要な課題は、事前に通過するウェイポイントの完全な知識を想定して解決される最小時間軌道を計画することです。
本研究では,クワッドロータの最小時間軌道生成法を提案する。
論文 参考訳(メタデータ) (2021-03-15T18:05:49Z) - Optimal control of point-to-point navigation in turbulent time-dependent
flows using Reinforcement Learning [0.0]
複素流体中の2点間の移動時間を最小化する経路を求める問題に関する理論的および数値的な結果を示す。
我々は、ActorCriticアルゴリズムが時間非依存またはカオス的に進化するフロー構成の存在下で準最適解を見つけることができることを示した。
論文 参考訳(メタデータ) (2021-02-27T21:31:18Z) - End-to-end Learning for Inter-Vehicle Distance and Relative Velocity
Estimation in ADAS with a Monocular Camera [81.66569124029313]
本稿では,ディープニューラルネットワークのエンドツーエンドトレーニングに基づくカメラによる車間距離と相対速度推定手法を提案する。
提案手法の重要な特徴は,2つの時間的単眼フレームによって提供される複数の視覚的手がかりの統合である。
また,移動場における視線歪みの影響を緩和する車両中心サンプリング機構を提案する。
論文 参考訳(メタデータ) (2020-06-07T08:18:31Z) - Enhance the performance of navigation: A two-stage machine learning
approach [13.674463804942837]
リアルタイム交通ナビゲーションはスマートトランスポート技術において重要な機能である。
本稿では,アンサンブル学習の考え方を採用し,正確なナビゲーション結果を与えるための2段階の機械学習モデルを開発する。
論文 参考訳(メタデータ) (2020-04-02T08:55:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。