Fugu-MT 論文翻訳(概要): Towards Autonomous Pipeline Inspection with Hierarchical Reinforcement Learning

論文の概要: Towards Autonomous Pipeline Inspection with Hierarchical Reinforcement Learning

arxiv url: http://arxiv.org/abs/2107.03685v1
Date: Thu, 8 Jul 2021 08:58:59 GMT
ステータス: 翻訳完了
システム内更新日: 2021-07-09 13:29:24.676828
Title: Towards Autonomous Pipeline Inspection with Hierarchical Reinforcement Learning
Title（参考訳）: 階層型強化学習による自律パイプライン検査に向けて
Authors: Nicol\`o Botteghi, Luuk Grefte, Mannes Poel, Beril Sirmacek, Christoph Brune, Edwin Dertien, and Stefano Stramigioli
Abstract要約: 我々は、複雑なトポロジを持つパイプラインネットワークにおいて、パイプライン内のロボットの自律的なナビゲーションを実現するためにDeep Reinforcement Learningを使用する。この方針で導入された階層構造は、パイプによるナビゲーションタスクの解決に基本的であり、人間レベルの制御よりも優れたナビゲーションパフォーマンスを達成するために必要であることを示す。
参考スコア（独自算出の注目度）: 8.452871622869454
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Inspection and maintenance are two crucial aspects of industrial pipeline plants. While robotics has made tremendous progress in the mechanic design of in-pipe inspection robots, the autonomous control of such robots is still a big open challenge due to the high number of actuators and the complex manoeuvres required. To address this problem, we investigate the usage of Deep Reinforcement Learning for achieving autonomous navigation of in-pipe robots in pipeline networks with complex topologies. Moreover, we introduce a hierarchical policy decomposition based on Hierarchical Reinforcement Learning to learn robust high-level navigation skills. We show that the hierarchical structure introduced in the policy is fundamental for solving the navigation task through pipes and necessary for achieving navigation performances superior to human-level control.
Abstract（参考訳）: 検査と保守は産業用パイプライン工場の2つの重要な側面である。ロボット工学は、パイプ内検査ロボットの機械設計において大きな進歩を遂げているが、ロボットの自律的な制御は、多くのアクチュエータと複雑な操作を必要とするため、いまだに大きな課題である。この問題を解決するために,複雑なトポロジを持つパイプラインネットワークにおいて,パイプ内ロボットの自律ナビゲーションを実現するために,Deep Reinforcement Learningを用いた。さらに,階層的強化学習に基づく階層的ポリシー分解を導入し,堅牢な高レベルのナビゲーションスキルを学習する。提案手法で導入された階層構造は,パイプによるナビゲーション課題の解決に基礎的であり,人間レベルの制御よりも優れたナビゲーション性能を実現するために必要なものである。

関連論文リスト

Designing Control Barrier Function via Probabilistic Enumeration for Safe Reinforcement Learning Navigation [55.02966123945644]
本稿では,ニューラルネットワーク検証技術を利用して制御障壁関数(CBF)とポリシー修正機構の設計を行う階層型制御フレームワークを提案する。提案手法は,安全なCBFベースの制御層を構築するために使用される,安全でない操作領域を特定するための確率的列挙に依存する。これらの実験は、効率的なナビゲーション動作を維持しながら、安全でない動作を補正する提案手法の能力を実証するものである。
論文参考訳（メタデータ） (2025-04-30T13:47:25Z)
Extensive Exploration in Complex Traffic Scenarios using Hierarchical Reinforcement Learning [7.380119332658803]
我々の研究は、複雑な意思決定問題を管理可能なサブタスクに効率的に分解する先駆的な階層的枠組みを導入する。高レベルコントローラと低レベルコントローラを別々にトレーニングする2段階のトレーニングプロセスを採用しています。高レベルコントローラは、長期遅延報酬による探索可能性の向上を示し、低レベルコントローラは、短時間の報酬を使用して、縦方向および横方向の制御機能を提供する。
論文参考訳（メタデータ） (2025-01-25T00:00:11Z)
Commonsense Reasoning for Legged Robot Adaptation with Vision-Language Models [81.55156507635286]
脚のついたロボットは、様々な環境をナビゲートし、幅広い障害を克服することができる。現在の学習手法は、人間の監督を伴わずに、予期せぬ状況の長い尾への一般化に苦慮することが多い。本稿では,VLM-Predictive Control (VLM-PC) というシステムを提案する。
論文参考訳（メタデータ） (2024-07-02T21:00:30Z)
Aquatic Navigation: A Challenging Benchmark for Deep Reinforcement Learning [53.3760591018817]
ゲームエンジンとDeep Reinforcement Learningの統合の最近の進歩を利用して,水上ナビゲーションのための新しいベンチマーク環境を提案する。具体的には、最も広く受け入れられているアルゴリズムの一つであるPPOに着目し、先進的なトレーニング手法を提案する。実験により,これらの成分をうまく組み合わせることで,有望な結果が得られることが示された。
論文参考訳（メタデータ） (2024-05-30T23:20:23Z)
Deep Reinforcement Learning with Enhanced PPO for Safe Mobile Robot Navigation [0.6554326244334868]
本研究では,複雑な環境下での自律走行のための移動ロボットの訓練における深層強化学習の適用について検討する。このロボットは、LiDARセンサデータとディープニューラルネットワークを用いて、障害物を回避しつつ、特定の目標に向かって誘導する制御信号を生成する。
論文参考訳（メタデータ） (2024-05-25T15:08:36Z)
Self-Inspection Method of Unmanned Aerial Vehicles in Power Plants Using Deep Q-Network Reinforcement Learning [0.0]
本研究は,UAV自律ナビゲーションとDQN強化学習を取り入れた発電所検査システムを提案する。訓練されたモデルは、UAVが困難な環境で単独で移動できるようにすることで、検査戦略が実際に適用される可能性が高い。
論文参考訳（メタデータ） (2023-03-16T00:58:50Z)
Robot path planning using deep reinforcement learning [0.0]
強化学習法は、地図のないナビゲーションタスクに代わる手段を提供する。障害物回避と目標指向ナビゲーションタスクの両方に深部強化学習エージェントを実装した。報酬関数の変更によるエージェントの挙動と性能の変化を解析する。
論文参考訳（メタデータ） (2023-02-17T20:08:59Z)
Learning Deep Sensorimotor Policies for Vision-based Autonomous Drone Racing [52.50284630866713]
既存のシステムは、状態推定、計画、制御のために手作業によるコンポーネントを必要とすることが多い。本稿では、深層感触者ポリシーを学習することで、視覚に基づく自律ドローンレース問題に取り組む。
論文参考訳（メタデータ） (2022-10-26T19:03:17Z)
Hierarchical Skills for Efficient Exploration [70.62309286348057]
強化学習において、事前訓練された低レベルスキルは、探索を大幅に促進する可能性がある。下流タスクの以前の知識は、スキルデザインにおける一般性(きめ細かい制御)と特異性(より高速な学習)の適切なバランスをとるために必要である。教師なしの方法で様々な複雑さのスキルを習得する階層的スキル学習フレームワークを提案する。
論文参考訳（メタデータ） (2021-10-20T22:29:32Z)
Simultaneous Navigation and Construction Benchmarking Environments [73.0706832393065]
モバイル構築のためのインテリジェントなロボット、環境をナビゲートし、幾何学的設計に従ってその構造を変更するプロセスが必要です。このタスクでは、ロボットのビジョンと学習の大きな課題は、GPSなしでデザインを正確に達成する方法です。我々は,手工芸政策の性能を,基礎的なローカライゼーションと計画,最先端の深層強化学習手法を用いて評価した。
論文参考訳（メタデータ） (2021-03-31T00:05:54Z)
Learning of Long-Horizon Sparse-Reward Robotic Manipulator Tasks with Base Controllers [26.807673929816026]
本稿では,1つ以上の従来型ベースコントローラを用いた長軸スパース・リワードタスクの学習手法を提案する。提案アルゴリズムは,既存のベースコントローラを探索,価値学習,ポリシー更新の段階に組み込む。我々の方法は、既存の産業用ロボット操作システムを利用して、より柔軟でインテリジェントなコントローラを構築する可能性を秘めている。
論文参考訳（メタデータ） (2020-11-24T14:23:57Z)
Enhanced Adversarial Strategically-Timed Attacks against Deep Reinforcement Learning [91.13113161754022]
本稿では,DRLに基づくナビゲーションシステムに対して,選択した時間フレーム上の物理ノイズパターンを妨害することにより,タイミングに基づく逆方向戦略を導入する。実験結果から, 対向タイミング攻撃は性能低下を引き起こす可能性が示唆された。
論文参考訳（メタデータ） (2020-02-20T21:39:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。