論文の概要: A Survey on the Integration of Machine Learning with Sampling-based
Motion Planning
- arxiv url: http://arxiv.org/abs/2211.08368v1
- Date: Tue, 15 Nov 2022 18:13:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-16 14:10:02.608123
- Title: A Survey on the Integration of Machine Learning with Sampling-based
Motion Planning
- Title(参考訳): 機械学習とサンプリング型運動計画の統合に関する調査研究
- Authors: Troy McMahon, Aravind Sivaramakrishnan, Edgar Granados, Kostas E.
Bekris
- Abstract要約: 本調査は、サンプリングベースモーションプランナー(SBMP)の計算効率と適用性を改善するための機械学習の取り組みを概観する。
まず、ノードサンプリング、衝突検出、距離または最も近い隣人、ローカルプランニング、終了条件など、SBMPのキーコンポーネントの強化に学習がどのように使われているかについて論じる。
また、機械学習を用いてロボットのデータ駆動モデルを提供し、それをSBMPで使用する方法についても論じている。
- 参考スコア(独自算出の注目度): 9.264471872135623
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sampling-based methods are widely adopted solutions for robot motion
planning. The methods are straightforward to implement, effective in practice
for many robotic systems. It is often possible to prove that they have
desirable properties, such as probabilistic completeness and asymptotic
optimality. Nevertheless, they still face challenges as the complexity of the
underlying planning problem increases, especially under tight computation time
constraints, which impact the quality of returned solutions or given inaccurate
models. This has motivated machine learning to improve the computational
efficiency and applicability of Sampling-Based Motion Planners (SBMPs). This
survey reviews such integrative efforts and aims to provide a classification of
the alternative directions that have been explored in the literature. It first
discusses how learning has been used to enhance key components of SBMPs, such
as node sampling, collision detection, distance or nearest neighbor
computation, local planning, and termination conditions. Then, it highlights
planners that use learning to adaptively select between different
implementations of such primitives in response to the underlying problem's
features. It also covers emerging methods, which build complete machine
learning pipelines that reflect the traditional structure of SBMPs. It also
discusses how machine learning has been used to provide data-driven models of
robots, which can then be used by a SBMP. Finally, it provides a comparative
discussion of the advantages and disadvantages of the approaches covered, and
insights on possible future directions of research. An online version of this
survey can be found at: https://prx-kinodynamic.github.io/
- Abstract(参考訳): サンプリングに基づく手法はロボットの動作計画に広く採用されている。
これらの方法は実装が簡単で、多くのロボットシステムで実践的に有効である。
確率的完全性や漸近的最適性といった望ましい性質を持つことを証明できることが多い。
それでも、基礎となる計画問題の複雑さが増加し、特に厳密な計算時間制約の下では、返却されたソリューションの品質や不正確なモデルに影響を及ぼす。
これは、サンプリングベースモーションプランナー(SBMP)の計算効率と適用性を改善するために機械学習を動機付けている。
本調査は,これらの統合的な取り組みを概観し,文献で検討されている代替方向の分類を提供することを目的とする。
まず, ノードサンプリング, 衝突検出, 距離, 近接計算, 局所計画, 終了条件など, SBMP の重要なコンポーネントを学習によって強化する方法について論じる。
そして、基礎となる問題の特徴に応じて、これらのプリミティブの異なる実装を適応的に選択するために学習を使用するプランナーを強調する。
また、SBMPの伝統的な構造を反映した完全な機械学習パイプラインを構築する新しい手法についても取り上げている。
また、機械学習を使用して、sbmpで使用できるロボットのデータ駆動モデルを提供する方法についても論じている。
最後に、カバーされているアプローチの利点とデメリットの比較議論と、研究の今後の方向性に関する洞察を提供する。
この調査のオンライン版は、https://prx-kinodynamic.github.io/で見ることができる。
関連論文リスト
- Enhancing Multi-Step Reasoning Abilities of Language Models through Direct Q-Function Optimization [50.485788083202124]
強化学習(Reinforcement Learning, RL)は、大規模言語モデルを人間の好みと整合させ、複雑なタスクを遂行する能力を向上させる上で重要な役割を担っている。
反応生成過程をマルコフ決定プロセス(MDP)として定式化し,ソフトアクター・クリティック(SAC)フレームワークを用いて,言語モデルによって直接パラメータ化されたQ関数を最適化する,直接Q関数最適化(DQO)を提案する。
GSM8KとMATHという2つの数学問題解決データセットの実験結果から、DQOは従来の手法よりも優れており、言語モデルを整合させるための有望なオフライン強化学習手法として確立されている。
論文 参考訳(メタデータ) (2024-10-11T23:29:20Z) - Active learning for regression in engineering populations: A risk-informed approach [0.0]
回帰は、データ中心のエンジニアリングアプリケーションで一般的な基本的な予測タスクである。
アクティブラーニング(英: Active Learning)は、リソース効率のよい特徴ラベルペアを優先的に取得する手法である。
提案手法は, 予測性能を維持しつつ, 必要な検査回数を削減し, 予測コストの観点から優れた性能を有することを示す。
論文 参考訳(メタデータ) (2024-09-06T15:03:42Z) - A step towards the integration of machine learning and small area
estimation [0.0]
本稿では,機械学習アルゴリズムがサポートする予測器を提案する。
仮定モデルからわずかに逸脱しただけで、この場合も提案が良い代替手段であることを示す。
さらに,機械学習予測器の精度推定手法を提案し,従来の手法との比較を行った。
論文 参考訳(メタデータ) (2024-02-12T09:43:17Z) - Machine Learning Insides OptVerse AI Solver: Design Principles and
Applications [74.67495900436728]
本稿では,Huawei CloudのOpsVerse AIソルバに機械学習(ML)技術を統合するための総合的研究について述べる。
本稿では,実世界の多面構造を反映した生成モデルを用いて,複雑なSATインスタンスとMILPインスタンスを生成する手法を紹介する。
本稿では,解解器性能を著しく向上させる,最先端パラメータチューニングアルゴリズムの導入について詳述する。
論文 参考訳(メタデータ) (2024-01-11T15:02:15Z) - Provably Efficient Representation Learning with Tractable Planning in
Low-Rank POMDP [81.00800920928621]
部分的に観測可能なマルコフ決定過程(POMDP)における表現学習の研究
まず,不確実性(OFU)に直面した最大推定(MLE)と楽観性を組み合わせた復調性POMDPのアルゴリズムを提案する。
次に、このアルゴリズムをより広範な$gamma$-observable POMDPのクラスで機能させる方法を示す。
論文 参考訳(メタデータ) (2023-06-21T16:04:03Z) - Reconfigurable Intelligent Surface Assisted Mobile Edge Computing with
Heterogeneous Learning Tasks [53.1636151439562]
モバイルエッジコンピューティング(MEC)は、AIアプリケーションに自然なプラットフォームを提供します。
再構成可能なインテリジェントサーフェス(RIS)の助けを借りて、MECで機械学習タスクを実行するインフラストラクチャを提示します。
具体的には,モバイルユーザの送信パワー,基地局のビームフォーミングベクトル,risの位相シフト行列を共同で最適化することにより,参加ユーザの学習誤差を最小化する。
論文 参考訳(メタデータ) (2020-12-25T07:08:50Z) - A User's Guide to Calibrating Robotics Simulators [54.85241102329546]
本稿では,シミュレーションで学習したモデルやポリシーを現実世界に伝達することを目的とした,様々なアルゴリズムの研究のためのベンチマークとフレームワークを提案する。
我々は、様々なアルゴリズムの性能に関する洞察を特徴付け、提供するために、広く知られたシミュレーション環境の実験を行う。
我々の分析は、この分野の実践者にとって有用であり、sim-to-realアルゴリズムの動作と主特性について、より深い選択をすることができる。
論文 参考訳(メタデータ) (2020-11-17T22:24:26Z) - A Survey on Large-scale Machine Learning [67.6997613600942]
機械学習はデータに対する深い洞察を与え、マシンが高品質な予測を行うことを可能にする。
ほとんどの高度な機械学習アプローチは、大規模なデータを扱う場合の膨大な時間コストに悩まされる。
大規模機械学習は、ビッグデータからパターンを、同等のパフォーマンスで効率的に学習することを目的としている。
論文 参考訳(メタデータ) (2020-08-10T06:07:52Z) - Flexible and Efficient Long-Range Planning Through Curious Exploration [13.260508939271764]
The Curious Sample Planner can realize temporallyextended plan for a wide range of really 3D task。
対照的に、標準的な計画と学習の方法は、多くの場合、これらのタスクを全く解決しなかったり、膨大な数のトレーニングサンプルでのみ実行できなかったりします。
論文 参考訳(メタデータ) (2020-04-22T21:47:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。