論文の概要: Autonomous Obstacle Removal for Excavators through Policy Learning with Particle Simulation
- arxiv url: http://arxiv.org/abs/2606.09183v1
- Date: Mon, 08 Jun 2026 08:20:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.829779
- Title: Autonomous Obstacle Removal for Excavators through Policy Learning with Particle Simulation
- Title(参考訳): 粒子シミュレーションによる政策学習による掘削者の自律的障害物除去
- Authors: Yuki Kadokawa, Sandro M. Alcantara Tacora, Taro Abe, Daisuke Endo, Genki Yamauchi, Takeshi Hashimoto, Takamitsu Matsubara,
- Abstract要約: 提案カリキュラムは,3日以内に有効性能を達成し,実際の12トン掘削機への移動に成功した。
RGB-D測定から地形や障害物情報を観測する時間効率のシミュレート・トゥ・リアルな政策学習フレームワークを提案する。
- 参考スコア(独自算出の注目度): 2.683880108291779
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous obstacle removal from the ground is an important earthwork task, but this is difficult to automate because an excavator must adapt its excavation trajectories over repeated cycles as soil-obstacle conditions change. Learning such state-dependent behavior requires a training environment that reproduces accumulated soil-obstacle interactions, including contact states, terrain deformation, and obstacle visibility. Accordingly, particle-based simulation is suitable for the relevant policy learning. However, particle simulation is computationally expensive, and repeated excavation cycles further increase the learning cost. We observe that the burial condition of an obstacle governs both task difficulty and simulation cost: deeper burial makes obstacle removal harder while also requiring more particles for accurate simulation. This observation motivates a burial-conditioned curriculum learning strategy. We propose a time-efficient sim-to-real policy learning framework in which the policy observes terrain and obstacle information from RGB-D measurements and then outputs a parameterized excavation trajectory; in this process, the simulator reproduces in a real-world excavator the same observation-action interface it uses under controllable burial conditions. The curriculum begins with shallow burial conditions and progressively increases burial depth while adjusting particle count, thus simultaneously controlling task difficulty and simulation cost. Experiments show that the proposed framework successfully learns an effective obstacle-removal policy, whereas baseline methods fail even after a full week of training. The proposed curriculum achieves effective performance within three days and achieves successful transfer to a real 12-ton excavator operating on open ground with various steel obstacles, thus demonstrating robust obstacle removal.
- Abstract(参考訳): 地中からの自律的障害物除去は重要な土木作業であるが, 土質条件が変化するにつれて, 掘削機が繰り返し周期で掘削軌道に適応しなければならないため, 自動化は困難である。
このような状態に依存した振る舞いを学ぶには、接触状態、地形の変形、障害物の視認など、蓄積した土壌と障害物の相互作用を再現する訓練環境が必要である。
したがって、関連する政策学習には粒子シミュレーションが適している。
しかし, 粒子シミュレーションは計算コストが高く, 繰り返し掘削サイクルにより学習コストが増大する。
我々は,障害物の埋設条件がタスクの難易度とシミュレーションコストの両方を制御し,より深い埋設により障害物除去が困難になり,正確なシミュレーションのためにより多くの粒子を必要とすることを観察した。
この観察は、埋葬条件のカリキュラム学習戦略を動機付けている。
本稿では,RGB-D測定から地形や障害物情報を観測し,パラメータ化された掘削軌道を出力する時間効率のシミュレート・ツー・リアルな政策学習フレームワークを提案する。
このカリキュラムは浅い埋没条件から始まり、粒子数を調整しながら徐々に埋没深度を増大させ、タスクの難易度とシミュレーションコストを同時に制御する。
実験の結果,提案フレームワークは効果的な障害除去策を学習するのに対して,ベースライン手法は1週間のトレーニング後にも失敗することがわかった。
提案カリキュラムは, 3日以内に有効性能を達成し, 各種の鋼製障害物のあるオープングラウンドで稼働する実際の12トン掘削機への移動を成功させ, 堅牢な障害物除去を実証する。
関連論文リスト
- Uncertainty Estimation for Deep Reconstruction in Actuatic Disaster Scenarios with Autonomous Vehicles [68.82821445619759]
原理的不確実性定量化は 能動センシング戦略に不可欠です
Evidential Deep Learningは、すべてのセンサ構成で最高の再構築精度と不確実性校正を実現する。
これらの知見は、リアルタイムの自動運転車配備における不確実性認識フィールド再構築の方法として、エビデンシャル・ディープ・ラーニングを支持している。
論文 参考訳(メタデータ) (2026-04-07T19:17:44Z) - Scaling Rough Terrain Locomotion with Automatic Curriculum Reinforcement Learning [16.89722808439415]
学習進歩に基づく自動カリキュラム強化学習フレームワークを提案する。
エージェントの学習進捗をオンラインで推定し、タスクサンプリング分布を適応的に調整する。
タスク空間上の難易度分布を事前に知ることなく、自動カリキュラム生成を可能にする。
論文 参考訳(メタデータ) (2026-01-24T11:54:16Z) - Learning Terrain-Specialized Policies for Adaptive Locomotion in Challenging Environments [0.4588028371034407]
この研究は、地形に特化されたポリシーとカリキュラムの学習を活用して、複雑な環境での俊敏性を高め、パフォーマンスを追跡する階層的な強化学習フレームワークを導入する。
本研究では,本手法をシミュレーションで検証し,本手法は成功率を最大16%向上させ,速度目標の増大とともに追従誤差の低減を図る。
論文 参考訳(メタデータ) (2025-09-25T00:17:39Z) - A General Infrastructure and Workflow for Quadrotor Deep Reinforcement Learning and Reality Deployment [48.90852123901697]
本稿では, エンドツーエンドの深層強化学習(DRL)ポリシーを四元数へシームレスに移行できるプラットフォームを提案する。
本プラットフォームは, ホバリング, 動的障害物回避, 軌道追尾, 気球打上げ, 未知環境における計画など, 多様な環境を提供する。
論文 参考訳(メタデータ) (2025-04-21T14:25:23Z) - Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models [60.87795376541144]
World Model(ワールドモデル)は、エージェントの次の状態を予測できるニューラルネットワークである。
エンド・ツー・エンドのトレーニングでは、人間のデモで観察された状態と整合してエラーから回復する方法を学ぶ。
クローズドループ試験における先行技術に有意な改善がみられた定性的,定量的な結果を示す。
論文 参考訳(メタデータ) (2024-09-25T06:48:25Z) - You Only Crash Once: Improved Object Detection for Real-Time,
Sim-to-Real Hazardous Terrain Detection and Classification for Autonomous
Planetary Landings [7.201292864036088]
危険地を検出するための安価で効果的な方法は、視覚カメラを使用することである。
視覚的危険地形検出の伝統的な技術は、テンプレートマッチングと事前構築されたハザードマップへの登録に焦点を当てている。
深層学習に基づく視覚的危険地形検出と分類技術であるYou Only Crash Once (YOCO)を紹介した。
論文 参考訳(メタデータ) (2023-03-08T21:11:51Z) - Accelerated Policy Learning with Parallel Differentiable Simulation [59.665651562534755]
微分可能シミュレータと新しいポリシー学習アルゴリズム(SHAC)を提案する。
本アルゴリズムは,スムーズな批判機能により局所最小化の問題を軽減する。
現状のRLと微分可能なシミュレーションベースアルゴリズムと比較して,サンプル効率と壁面時間を大幅に改善した。
論文 参考訳(メタデータ) (2022-04-14T17:46:26Z) - Reactive Long Horizon Task Execution via Visual Skill and Precondition
Models [59.76233967614774]
シミュレーションで学習したモデルを用いて、単純なタスクプランナの構成要素をグラウンド化することで、見知らぬロボットタスクを達成できるシミュレート・トゥ・リアル・トレーニングのアプローチについて述べる。
シミュレーションでは91.6%から98%,実世界の成功率は10%から80%に増加した。
論文 参考訳(メタデータ) (2020-11-17T15:24:01Z) - Sim-to-Real Transfer with Incremental Environment Complexity for
Reinforcement Learning of Depth-Based Robot Navigation [1.290382979353427]
段階的環境複雑性を用いたソフト・アクター・クリティカル(SAC)トレーニング戦略を提案し,実世界における追加トレーニングの必要性を大幅に低減した。
アプリケーションは深度に基づくマップレスナビゲーションで、移動ロボットは、事前のマッピング情報なしで、散らかった環境で所定の経路点に到達すべきである。
論文 参考訳(メタデータ) (2020-04-30T10:47:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。