論文の概要: Myriad: a real-world testbed to bridge trajectory optimization and deep
learning
- arxiv url: http://arxiv.org/abs/2202.10600v1
- Date: Tue, 22 Feb 2022 00:47:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-23 15:05:37.997534
- Title: Myriad: a real-world testbed to bridge trajectory optimization and deep
learning
- Title(参考訳): Myriad: 軌道最適化とディープラーニングを橋渡しする現実世界のテストベッド
- Authors: Nikolaus H. R. Howe, Simon Dufort-Labb\'e, Nitarshan Rajkumar,
Pierre-Luc Bacon
- Abstract要約: JAXで書かれたテストベッドであるMyriadを紹介します。
Myriadは、機械学習の実践者がアプリケーションのための軌道最適化技術にアクセスできるようにする。
ミリアドは生物学から医学、工学まで、多くの現実世界の最適制御問題を提示している。
- 参考スコア(独自算出の注目度): 5.468674927807954
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present Myriad, a testbed written in JAX for learning and planning in
real-world continuous environments. The primary contributions of Myriad are
threefold. First, Myriad provides machine learning practitioners access to
trajectory optimization techniques for application within a typical automatic
differentiation workflow. Second, Myriad presents many real-world optimal
control problems, ranging from biology to medicine to engineering, for use by
the machine learning community. Formulated in continuous space and time, these
environments retain some of the complexity of real-world systems often
abstracted away by standard benchmarks. As such, Myriad strives to serve as a
stepping stone towards application of modern machine learning techniques for
impactful real-world tasks. Finally, we use the Myriad repository to showcase a
novel approach for learning and control tasks. Trained in a fully end-to-end
fashion, our model leverages an implicit planning module over neural ordinary
differential equations, enabling simultaneous learning and planning with
complex environment dynamics.
- Abstract(参考訳): 実世界の継続的環境での学習と計画のためのjaxで書かれたテストベッドであるmyriadを提案する。
Myriadの主な貢献は3倍である。
まず、Myriadは機械学習の実践者が典型的な自動微分ワークフロー内で応用するための軌道最適化技術にアクセスできるようにする。
第二に、Myriadは、生物学から医学、工学まで、機械学習コミュニティが使用する多くの現実の最適制御問題を提示している。
連続空間と時間で定式化されたこれらの環境は、しばしば標準ベンチマークによって抽象化された実世界のシステムの複雑さを保ちます。
そのため、Myriadは、インパクトのある現実世界のタスクにモダンな機械学習技術を適用するための足掛かりとなるように努力している。
最後に、myriadリポジトリを使用して、タスクの学習と制御のための新しいアプローチを示します。
モデルは完全にエンドツーエンドでトレーニングされ、ニューラルネットワークの通常の微分方程式よりも暗黙の計画モジュールを活用し、複雑な環境ダイナミクスを用いた同時学習と計画を可能にする。
関連論文リスト
- A Practitioner's Guide to Continual Multimodal Pretraining [83.63894495064855]
マルチモーダル・ファンデーション・モデルは視覚と言語を交わす多くのアプリケーションに役立っている。
モデルを更新し続けるために、継続事前トレーニングの研究は主に、大規模な新しいデータに対する頻度の低い、差別的な更新、あるいは頻繁に行われるサンプルレベルの更新のシナリオを探求する。
本稿では,FoMo-in-Flux(FoMo-in-Flux)について紹介する。
論文 参考訳(メタデータ) (2024-08-26T17:59:01Z) - Open-world Machine Learning: A Review and New Outlooks [83.6401132743407]
本稿では,新たなオープンワールド機械学習パラダイムを包括的に紹介することを目的としている。
研究者がそれぞれの分野でより強力なAIシステムを構築するのを支援し、人工知能の開発を促進することを目的としている。
論文 参考訳(メタデータ) (2024-03-04T06:25:26Z) - ReProHRL: Towards Multi-Goal Navigation in the Real World using
Hierarchical Agents [1.3194749469702445]
本稿では、強化学習によって誘導される階層的マルチゴールナビゲーションでタスクを分割する生産階層RL(ReProHRL)について述べる。
また、物体検出装置を前処理のステップとして使用して、マルチゴールナビゲーションを学習し、それを現実世界に転送する。
実世界の実装と概念実証のために,提案手法をフロントカメラを用いたナノドローンCrzyflieに展開する。
論文 参考訳(メタデータ) (2023-08-17T02:23:59Z) - Navigating to Objects in the Real World [76.1517654037993]
本稿では,古典的,モジュール的,エンド・ツー・エンドの学習手法と比較した,意味的視覚ナビゲーション手法に関する大規模な実証的研究について述べる。
モジュラー学習は実世界ではうまく機能し、90%の成功率に達しています。
対照的に、エンド・ツー・エンドの学習は、シミュレーションと現実の間の画像領域の差が大きいため、77%のシミュレーションから23%の実際の成功率へと低下する。
論文 参考訳(メタデータ) (2022-12-02T01:10:47Z) - Discrete Control in Real-World Driving Environments using Deep
Reinforcement Learning [2.467408627377504]
本研究では,現実の環境をゲーム環境に移行させる,現実の運転環境におけるフレームワーク(知覚,計画,制御)を紹介する。
実環境における離散制御を学習し,実行するために,既存の強化学習(RL)アルゴリズムを多エージェント設定で提案する。
論文 参考訳(メタデータ) (2022-11-29T04:24:03Z) - A Walk in the Park: Learning to Walk in 20 Minutes With Model-Free
Reinforcement Learning [86.06110576808824]
深層強化学習は、制御されていない環境での学習ポリシーに対する有望なアプローチである。
機械学習アルゴリズムとライブラリの最近の進歩と、慎重に調整されたロボットコントローラを組み合わせることで、現実世界では4分で学習できる。
論文 参考訳(メタデータ) (2022-08-16T17:37:36Z) - From Multi-agent to Multi-robot: A Scalable Training and Evaluation
Platform for Multi-robot Reinforcement Learning [12.74238738538799]
マルチエージェント強化学習(MARL)は、過去数十年間、学術や産業から広く注目を集めてきた。
これらの手法が実際のシナリオ、特にマルチロボットシステムでどのように機能するかは未だ分かっていない。
本稿では,マルチロボット強化学習(MRRL)のためのスケーラブルなエミュレーションプラットフォームSMARTを提案する。
論文 参考訳(メタデータ) (2022-06-20T06:36:45Z) - Continual Predictive Learning from Videos [100.27176974654559]
本稿では,ビデオ予測の文脈において,新たな連続学習問題について検討する。
本稿では,連続予測学習(Continuousal predictive Learning, CPL)アプローチを提案する。
我々はRoboNetとKTHに基づく2つの新しいベンチマークを構築し、異なるタスクが異なる物理ロボット環境や人間の行動に対応するようにした。
論文 参考訳(メタデータ) (2022-04-12T08:32:26Z) - From Simulation to Real World Maneuver Execution using Deep
Reinforcement Learning [69.23334811890919]
深層強化学習(Deep Reinforcement Learning)は、さまざまな分野における多くの制御タスクを解決できることが証明されている。
これは主に、シミュレーションデータと実世界のデータ間のドメイン適応の欠如と、トレインデータセットとテストデータセットの区別の欠如による。
本稿では,エージェントが同時に訓練される複数の環境に基づくシステムを提案する。
論文 参考訳(メタデータ) (2020-05-13T14:22:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。