論文の概要: Autonomous Control of a Particle Accelerator using Deep Reinforcement
Learning
- arxiv url: http://arxiv.org/abs/2010.08141v2
- Date: Sun, 20 Dec 2020 00:42:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-06 20:38:49.770695
- Title: Autonomous Control of a Particle Accelerator using Deep Reinforcement
Learning
- Title(参考訳): 深部強化学習を用いた粒子加速器の自律制御
- Authors: Xiaoying Pang, Sunil Thulasidasan, Larry Rybarcyk
- Abstract要約: 本稿では,大規模線形粒子加速器の最適制御ポリシーを学習するためのアプローチについて述べる。
このフレームワークは、状態とアクション空間の表現にディープニューラルネットワークを使用するAIコントローラで構成されている。
最初の結果から,粒子線電流と分布の点で,人間よりも優れたレベルの性能が得られることが示唆された。
- 参考スコア(独自算出の注目度): 2.062593640149623
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We describe an approach to learning optimal control policies for a large,
linear particle accelerator using deep reinforcement learning coupled with a
high-fidelity physics engine. The framework consists of an AI controller that
uses deep neural nets for state and action-space representation and learns
optimal policies using reward signals that are provided by the physics
simulator. For this work, we only focus on controlling a small section of the
entire accelerator. Nevertheless, initial results indicate that we can achieve
better-than-human level performance in terms of particle beam current and
distribution. The ultimate goal of this line of work is to substantially reduce
the tuning time for such facilities by orders of magnitude, and achieve
near-autonomous control.
- Abstract(参考訳): 高忠実度物理エンジンを併用した深部強化学習による大規模線形粒子加速器の最適制御則の学習手法について述べる。
このフレームワークは、状態と行動空間の表現にディープニューラルネットワークを使用し、物理学シミュレータが提供する報酬信号を使用して最適なポリシーを学ぶAIコントローラで構成されている。
この作業では、アクセラレータ全体の小さな部分のコントロールにのみ焦点を合わせます。
それにもかかわらず、初期の結果は粒子線電流と分布の観点から、人間よりも優れたレベルの性能を達成できることを示唆している。
この作業の最終的な目標は、そのような設備のチューニング時間を桁違いに削減し、ほぼ自律的な制御を実現することである。
関連論文リスト
- Partial End-to-end Reinforcement Learning for Robustness Against
Modelling Error in Autonomous Racing [0.0]
本稿では、自動運転車における強化学習(RL)ソリューションの性能向上の問題に対処する。
計画タスクと制御タスクを分離する部分的なエンドツーエンドアルゴリズムを提案する。
従来の制御器のロバスト性を活用することにより,本アルゴリズムは標準のエンドツーエンドアルゴリズムよりもモデルミスマッチに対するロバスト性を向上する。
論文 参考訳(メタデータ) (2023-12-11T14:27:10Z) - TLControl: Trajectory and Language Control for Human Motion Synthesis [72.1577841503518]
本稿では,人間のリアルな動き合成のための新しい手法であるTLControlを提案する。
まず、VQ-VAEをトレーニングし、ボディパーツによって構成されたコンパクトな潜伏運動空間を学習する。
そこで我々は,関節の完全な軌跡の粗い初期予測を行うMasked Trajectories Transformerを提案する。
論文 参考訳(メタデータ) (2023-11-28T18:54:16Z) - Reaching the Limit in Autonomous Racing: Optimal Control versus
Reinforcement Learning [66.10854214036605]
ロボット工学における中心的な問題は、アジャイルなモバイルロボットの制御システムをどうやって設計するかである。
本稿では、強化学習(RL)で訓練されたニューラルネットワークコントローラが最適制御(OC)法より優れていることを示す。
その結果、アジャイルドローンを最大性能に押し上げることができ、最大加速速度は重力加速度の12倍以上、ピーク速度は時速108kmに達しました。
論文 参考訳(メタデータ) (2023-10-17T02:40:27Z) - FastRLAP: A System for Learning High-Speed Driving via Deep RL and
Autonomous Practicing [71.76084256567599]
本稿では、自律型小型RCカーを強化学習(RL)を用いた視覚的観察から積極的に駆動するシステムを提案する。
我々のシステムであるFastRLAP (faster lap)は、人間の介入なしに、シミュレーションや専門家によるデモンストレーションを必要とせず、現実世界で自律的に訓練する。
結果として得られたポリシーは、タイミングブレーキや回転の加速度などの突発的な運転スキルを示し、ロボットの動きを妨げる領域を避け、トレーニングの途中で同様の1対1のインタフェースを使用して人間のドライバーのパフォーマンスにアプローチする。
論文 参考訳(メタデータ) (2023-04-19T17:33:47Z) - Physics-Inspired Temporal Learning of Quadrotor Dynamics for Accurate
Model Predictive Trajectory Tracking [76.27433308688592]
クオーロタのシステムダイナミクスを正確にモデル化することは、アジャイル、安全、安定したナビゲーションを保証する上で非常に重要です。
本稿では,ロボットの経験から,四重項系の力学を純粋に学習するための新しい物理インスパイアされた時間畳み込みネットワーク(PI-TCN)を提案する。
提案手法は,スパース時間的畳み込みと高密度フィードフォワード接続の表現力を組み合わせて,正確なシステム予測を行う。
論文 参考訳(メタデータ) (2022-06-07T13:51:35Z) - Complex Locomotion Skill Learning via Differentiable Physics [30.868690308658174]
微分物理学は、ニューラルネットワーク(NN)コントローラの効率的な最適化を可能にする。
本稿では,複雑度と多様性を著しく向上したタスクが可能な統一NNコントローラを出力する実践的学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-06T04:01:12Z) - DiffSkill: Skill Abstraction from Differentiable Physics for Deformable
Object Manipulations with Tools [96.38972082580294]
DiffSkillは、変形可能なオブジェクト操作タスクを解決するために、スキル抽象化に微分可能な物理シミュレータを使用する新しいフレームワークである。
特に、勾配に基づくシミュレーターから個々のツールを用いて、まず短距離のスキルを得る。
次に、RGBD画像を入力として取り込む実演軌跡から、ニューラルネットワークの抽象体を学習する。
論文 参考訳(メタデータ) (2022-03-31T17:59:38Z) - Using Simulation Optimization to Improve Zero-shot Policy Transfer of
Quadrotors [0.14999444543328289]
実世界データを用いて微調整を行うことなく,シミュレーションで完全に強化学習を施した低レベルの制御ポリシを訓練し,四足歩行ロボットに展開することが可能であることを示す。
私たちのニューラルネットワークベースのポリシーは、オンボードセンサーデータのみを使用し、組み込みドローンハードウェアで完全に動作します。
論文 参考訳(メタデータ) (2022-01-04T22:32:05Z) - Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。
軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。
NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文 参考訳(メタデータ) (2020-12-04T18:59:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。