論文の概要: Learning Continuous Cost-to-Go Functions for Non-holonomic Systems
- arxiv url: http://arxiv.org/abs/2103.11168v1
- Date: Sat, 20 Mar 2021 12:31:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-23 14:49:36.758332
- Title: Learning Continuous Cost-to-Go Functions for Non-holonomic Systems
- Title(参考訳): 非ホロノミックシステムのための連続コスト対Go関数の学習
- Authors: Jinwook Huh, Daniel D. Lee and Volkan Isler
- Abstract要約: 本稿では,非ホロノミックシステムの連続的なコスト対ゴー関数を生成するための教師付き学習手法を提案する。
その結果,ネットワークは障害物を回避しつつ,非ホロノミックシステムに対して最適に近い軌道を生成できることがわかった。
- 参考スコア(独自算出の注目度): 40.443409760112395
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a supervised learning method to generate continuous
cost-to-go functions of non-holonomic systems directly from the workspace
description. Supervision from informative examples reduces training time and
improves network performance. The manifold representing the optimal
trajectories of a non-holonomic system has high-curvature regions which can not
be efficiently captured with uniform sampling. To address this challenge, we
present an adaptive sampling method which makes use of sampling-based planners
along with local, closed-form solutions to generate training samples. The
cost-to-go function over a specific workspace is represented as a neural
network whose weights are generated by a second, higher order network. The
networks are trained in an end-to-end fashion. In our previous work, this
architecture was shown to successfully learn to generate the cost-to-go
functions of holonomic systems using uniform sampling. In this work, we show
that uniform sampling fails for non-holonomic systems. However, with the
proposed adaptive sampling methodology, our network can generate near-optimal
trajectories for non-holonomic systems while avoiding obstacles. Experiments
show that our method is two orders of magnitude faster compared to traditional
approaches in cluttered environments.
- Abstract(参考訳): 本稿では,ワークスペース記述から直接,非ホロノミックシステムの連続的なコスト対ゴー関数を生成する教師あり学習手法を提案する。
情報的な例からのスーパービジョンは、トレーニング時間を短縮し、ネットワークパフォーマンスを改善する。
非ホロノミック系の最適軌跡を表す多様体は、均一サンプリングでは効率的に捕捉できない高い曲率領域を有する。
この課題に対処するために,サンプリングベースプランナと局所閉形式のソリューションを併用して,トレーニングサンプルを生成する適応サンプリング手法を提案する。
特定のワークスペース上のコスト・ツー・ゴー関数は、第2の高次ネットワークによって重みが生成されるニューラルネットワークとして表現される。
ネットワークはエンドツーエンドでトレーニングされる。
これまでの研究で、このアーキテクチャは一様サンプリングを用いてホロノミックシステムのコスト・ツー・ゴー関数を生成することに成功していることが示された。
本研究では,非ホロノミック系において均一サンプリングが失敗することを示す。
しかし, 適応サンプリング手法を用いることで, 非ホロノミックシステムに対して, 障害物を回避しつつ, ほぼ最適軌道を生成できる。
実験により, この手法は, 散在環境における従来の手法に比べて2桁高速であることがわかった。
関連論文リスト
- Adaptive teachers for amortized samplers [76.88721198565861]
償却推論(英: Amortized inference)とは、ニューラルネットワークなどのパラメトリックモデルをトレーニングし、正確なサンプリングが可能な所定の非正規化密度で分布を近似するタスクである。
オフ・ポリティクスのRLトレーニングは多様でハイ・リワードな候補の発見を促進するが、既存の手法は依然として効率的な探索の課題に直面している。
そこで本研究では,高次領域の優先順位付けにより,初等補正標本作成者(学生)の指導を指導する適応学習分布(教師)を提案する。
論文 参考訳(メタデータ) (2024-10-02T11:33:13Z) - Robust Model-Based Optimization for Challenging Fitness Landscapes [96.63655543085258]
タンパク質の設計には、フィットネスのランドスケープの最適化が含まれる。
指導法は, トレーニングセットにおける高適合度サンプルの多彩さに課題を呈する。
デザイン空間における「分離」というこの問題は、既存のモデルベース最適化ツールにおいて重大なボトルネックとなっていることを示す。
本稿では,新しいVAEを検索モデルとして利用して問題を克服する手法を提案する。
論文 参考訳(メタデータ) (2023-05-23T03:47:32Z) - Adaptive Client Sampling in Federated Learning via Online Learning with
Bandit Feedback [36.05851452151107]
統合学習(FL)システムは、トレーニングの各ラウンドに関与するクライアントのサブセットをサンプリングする必要があります。
その重要性にもかかわらず、クライアントを効果的にサンプリングする方法には制限がある。
提案手法は,最適化アルゴリズムの収束速度をいかに向上させるかを示す。
論文 参考訳(メタデータ) (2021-12-28T23:50:52Z) - Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。
我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。
コア最適化問題の実用的なパラメトリゼーションを提供する。
論文 参考訳(メタデータ) (2021-07-08T18:01:02Z) - Practical Convex Formulation of Robust One-hidden-layer Neural Network
Training [12.71266194474117]
本研究では,一層型スカラーアウトプット完全接続型ReLULUニューラルネットワークのトレーニングを,有限次元凸プログラムとして再構成可能であることを示す。
我々は「敵の訓練」問題を効率的に解くために凸最適化手法を導出する。
本手法は二項分類と回帰に応用でき、現在の対角訓練法に代わる手段を提供する。
論文 参考訳(メタデータ) (2021-05-25T22:06:27Z) - qRRT: Quality-Biased Incremental RRT for Optimal Motion Planning in
Non-Holonomic Systems [16.323822608442836]
本稿では,非ホロノミックシステムにおける最適動作計画のためのサンプリングベース手法を提案する。
経験を通じて学習する原則を使用して、ワークスペース内の領域のコスト対効果を推定します。
論文 参考訳(メタデータ) (2021-01-07T17:10:11Z) - Neural-iLQR: A Learning-Aided Shooting Method for Trajectory
Optimization [17.25824905485415]
制約のない制御空間上の学習支援シューティング手法であるNeural-iLQRを提案する。
システムモデルにおける不正確さの存在下で、従来のiLQRよりも著しく優れていることが示されている。
論文 参考訳(メタデータ) (2020-11-21T07:17:28Z) - Automatic Recall Machines: Internal Replay, Continual Learning and the
Brain [104.38824285741248]
ニューラルネットワークのリプレイには、記憶されたサンプルを使ってシーケンシャルなデータのトレーニングが含まれる。
本研究では,これらの補助サンプルをフライ時に生成する手法を提案する。
代わりに、評価されたモデル自体内の学習したサンプルの暗黙の記憶が利用されます。
論文 参考訳(メタデータ) (2020-06-22T15:07:06Z) - Subset Sampling For Progressive Neural Network Learning [106.12874293597754]
プログレッシブニューラルネットワーク学習は、ネットワークのトポロジを漸進的に構築し、トレーニングデータに基づいてパラメータを最適化するアルゴリズムのクラスである。
段階的なトレーニングステップ毎にトレーニングデータのサブセットを活用することで,このプロセスの高速化を提案する。
オブジェクト,シーン,顔の認識における実験結果から,提案手法が最適化手順を大幅に高速化することを示す。
論文 参考訳(メタデータ) (2020-02-17T18:57:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。