論文の概要: Deep-Reinforcement-Learning-based Path Planning for Industrial Robots
using Distance Sensors as Observation
- arxiv url: http://arxiv.org/abs/2301.05980v1
- Date: Sat, 14 Jan 2023 21:42:17 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-18 17:56:56.420552
- Title: Deep-Reinforcement-Learning-based Path Planning for Industrial Robots
using Distance Sensors as Observation
- Title(参考訳): 遠距離センサを用いた産業用ロボットの深部強化学習経路計画
- Authors: Teham Bhuiyan, Linh K\"astner, Yifan Hu, Benno Kutschank and Jens
Lambrecht
- Abstract要約: 本稿では,ロボットマニピュレータのための深部強化学習型モーションプランナを提案する。
いくつかの実験で、最先端のサンプリングベースプランナに対して、我々のモデルを評価した。
- 参考スコア(独自算出の注目度): 7.656633127636852
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Industrial robots are widely used in various manufacturing environments due
to their efficiency in doing repetitive tasks such as assembly or welding. A
common problem for these applications is to reach a destination without
colliding with obstacles or other robot arms. Commonly used sampling-based path
planning approaches such as RRT require long computation times, especially in
complex environments. Furthermore, the environment in which they are employed
needs to be known beforehand. When utilizing the approaches in new
environments, a tedious engineering effort in setting hyperparameters needs to
be conducted, which is time- and cost-intensive. On the other hand, Deep
Reinforcement Learning has shown remarkable results in dealing with unknown
environments, generalizing new problem instances, and solving motion planning
problems efficiently. On that account, this paper proposes a
Deep-Reinforcement-Learning-based motion planner for robotic manipulators. We
evaluated our model against state-of-the-art sampling-based planners in several
experiments. The results show the superiority of our planner in terms of path
length and execution time.
- Abstract(参考訳): 産業用ロボットは組み立てや溶接などの反復作業の効率が良いため、様々な製造環境で広く使われている。
これらのアプリケーションで一般的な問題は、障害物や他のロボットアームと衝突することなく目的地に到達することだ。
RRTのようなサンプリングベースの経路計画手法は、特に複雑な環境で長い計算時間を必要とする。
さらに、彼らが雇用されている環境を事前に知る必要がある。
新しい環境におけるアプローチを利用するには、時間とコストのかかるハイパーパラメータの設定において、面倒なエンジニアリング作業を行う必要がある。
一方,Deep Reinforcement Learningは未知の環境に対処し,新たな問題インスタンスを一般化し,効率的な動作計画問題の解き方を示す。
そこで本研究では,ロボットマニピュレータのための深部強化学習型モーションプランナを提案する。
いくつかの実験において,最先端のサンプリングベースプランナーに対する評価を行った。
その結果,経路長と実行時間の観点から,プランナーの優位性を示した。
関連論文リスト
- A Meta-Engine Framework for Interleaved Task and Motion Planning using Topological Refinements [51.54559117314768]
タスク・アンド・モーション・プランニング(タスク・アンド・モーション・プランニング、TAMP)は、自動化された計画問題の解決策を見つけるための問題である。
本稿では,TAMP問題のモデル化とベンチマークを行うための,汎用的でオープンソースのフレームワークを提案する。
移動エージェントと複数のタスク状態依存障害を含むTAMP問題を解決する革新的なメタ技術を導入する。
論文 参考訳(メタデータ) (2024-08-11T14:57:57Z) - Aquatic Navigation: A Challenging Benchmark for Deep Reinforcement Learning [53.3760591018817]
ゲームエンジンとDeep Reinforcement Learningの統合の最近の進歩を利用して,水上ナビゲーションのための新しいベンチマーク環境を提案する。
具体的には、最も広く受け入れられているアルゴリズムの一つであるPPOに着目し、先進的なトレーニング手法を提案する。
実験により,これらの成分をうまく組み合わせることで,有望な結果が得られることが示された。
論文 参考訳(メタデータ) (2024-05-30T23:20:23Z) - SERL: A Software Suite for Sample-Efficient Robotic Reinforcement
Learning [85.21378553454672]
筆者らは,報酬の計算と環境のリセットを行う手法とともに,効率的なオフ・ポリティクス・ディープ・RL法を含むライブラリを開発した。
我々は,PCBボードアセンブリ,ケーブルルーティング,オブジェクトの移動に関するポリシを,非常に効率的な学習を実現することができることを発見した。
これらの政策は完全な成功率またはほぼ完全な成功率、摂動下でさえ極端な堅牢性を実現し、突発的な堅牢性回復と修正行動を示す。
論文 参考訳(メタデータ) (2024-01-29T10:01:10Z) - Interactive Planning Using Large Language Models for Partially
Observable Robotics Tasks [54.60571399091711]
大きな言語モデル(LLM)は、オープン語彙タスクを実行するロボットエージェントを作成することで、驚くべき成果を上げている。
LLMを用いた部分的に観測可能なタスクのための対話型計画手法を提案する。
論文 参考訳(メタデータ) (2023-12-11T22:54:44Z) - Mission-driven Exploration for Accelerated Deep Reinforcement Learning
with Temporal Logic Task Specifications [11.812602599752294]
未知の構造を持つ環境で動作している未知のダイナミクスを持つロボットについて考察する。
我々の目標は、オートマトン符号化されたタスクを満足する確率を最大化する制御ポリシーを合成することである。
そこで本研究では,制御ポリシーを類似手法と比較して顕著に高速に学習できるDRLアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-11-28T18:59:58Z) - AI planning in the imagination: High-level planning on learned abstract
search spaces [68.75684174531962]
我々は,エージェントが訓練中に学習する抽象的な検索空間において,エージェントが計画することを可能にする,PiZeroと呼ばれる新しい手法を提案する。
本研究では,旅行セールスマン問題,ソコバン問題,2048年,施設立地問題,パックマン問題など,複数の分野で評価を行った。
論文 参考訳(メタデータ) (2023-08-16T22:47:16Z) - Scalable Multi-robot Motion Planning for Congested Environments With
Topological Guidance [2.846144602096543]
マルチロボットモーションプランニング(MRMP)は、連続状態空間におけるロボットの衝突のない経路を見つける問題である。
我々は、トポロジカルガイダンスによって提供される改善された効率を活用するために、既存のシングルロボットモーションプランニング手法を拡張した。
提案手法は,多くの狭い経路を持つ複雑な環境における経路を効率的に計画する能力を示し,既存の方法の最大25倍の大きさのロボットチームに拡張する。
論文 参考訳(メタデータ) (2022-10-13T16:26:01Z) - Overcoming Exploration: Deep Reinforcement Learning in Complex
Environments from Temporal Logic Specifications [2.8904578737516764]
本稿では,大規模複雑な環境に展開する未知の連続時間ダイナミクスを有するタスク誘導型ロボットのためのDeep Reinforcement Learning (DRL)アルゴリズムを提案する。
本フレームワークは,大規模複雑な環境下での複雑なミッションをこなすロボットの性能(有効性,効率)を著しく向上させる。
論文 参考訳(メタデータ) (2022-01-28T16:39:08Z) - Simultaneous Navigation and Construction Benchmarking Environments [73.0706832393065]
モバイル構築のためのインテリジェントなロボット、環境をナビゲートし、幾何学的設計に従ってその構造を変更するプロセスが必要です。
このタスクでは、ロボットのビジョンと学習の大きな課題は、GPSなしでデザインを正確に達成する方法です。
我々は,手工芸政策の性能を,基礎的なローカライゼーションと計画,最先端の深層強化学習手法を用いて評価した。
論文 参考訳(メタデータ) (2021-03-31T00:05:54Z) - Predicting Sample Collision with Neural Networks [5.713670854553366]
本稿では,サンプリングベース動作計画における高価なプリミティブ操作のコストに対処する枠組みを提案する。
我々は,2次元および3次元の作業空間における多様なロボットによる複数計画問題の枠組みを評価する。
論文 参考訳(メタデータ) (2020-06-30T14:56:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。