Fugu-MT 論文翻訳(概要): Autonomous Control of a Particle Accelerator using Deep Reinforcement Learning

論文の概要: Autonomous Control of a Particle Accelerator using Deep Reinforcement Learning

arxiv url: http://arxiv.org/abs/2010.08141v2
Date: Sun, 20 Dec 2020 00:42:39 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-06 20:38:49.770695
Title: Autonomous Control of a Particle Accelerator using Deep Reinforcement Learning
Title（参考訳）: 深部強化学習を用いた粒子加速器の自律制御
Authors: Xiaoying Pang, Sunil Thulasidasan, Larry Rybarcyk
Abstract要約: 本稿では,大規模線形粒子加速器の最適制御ポリシーを学習するためのアプローチについて述べる。このフレームワークは、状態とアクション空間の表現にディープニューラルネットワークを使用するAIコントローラで構成されている。最初の結果から,粒子線電流と分布の点で,人間よりも優れたレベルの性能が得られることが示唆された。
参考スコア（独自算出の注目度）: 2.062593640149623
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We describe an approach to learning optimal control policies for a large, linear particle accelerator using deep reinforcement learning coupled with a high-fidelity physics engine. The framework consists of an AI controller that uses deep neural nets for state and action-space representation and learns optimal policies using reward signals that are provided by the physics simulator. For this work, we only focus on controlling a small section of the entire accelerator. Nevertheless, initial results indicate that we can achieve better-than-human level performance in terms of particle beam current and distribution. The ultimate goal of this line of work is to substantially reduce the tuning time for such facilities by orders of magnitude, and achieve near-autonomous control.
Abstract（参考訳）: 高忠実度物理エンジンを併用した深部強化学習による大規模線形粒子加速器の最適制御則の学習手法について述べる。このフレームワークは、状態と行動空間の表現にディープニューラルネットワークを使用し、物理学シミュレータが提供する報酬信号を使用して最適なポリシーを学ぶAIコントローラで構成されている。この作業では、アクセラレータ全体の小さな部分のコントロールにのみ焦点を合わせます。それにもかかわらず、初期の結果は粒子線電流と分布の観点から、人間よりも優れたレベルの性能を達成できることを示唆している。この作業の最終的な目標は、そのような設備のチューニング時間を桁違いに削減し、ほぼ自律的な制御を実現することである。

関連論文リスト

ULTRA: Unified Multimodal Control for Autonomous Humanoid Whole-Body Loco-Manipulation [55.467742403416175]
本稿では,大規模モーションキャプチャをヒューマノイドに変換する物理駆動型ニューラルネットワークを提案する。我々は高密度参照とスパースタスク仕様の両方をサポートする統合マルチモーダルコントローラを学習する。その結果,ULTRAは自我中心の知覚から,自律的,目標条件付き全体ロコ操作に一般化することが示された。
論文参考訳（メタデータ） (2026-03-03T18:59:29Z)
Reinforcement Learning for Accelerator Beamline Control: a simulation-based approach [0.764101887158157]
RLABCはPythonベースのライブラリで、強化学習(RL)問題としてビームライン最適化を再構成する。 RLABCは標準格子と要素入力ファイルからRL環境を自動生成し、磁石の逐次チューニングにより粒子損失を最小限に抑える。 RLABCが2本のビームラインに対して有効であることを示し,94%と91%の伝送速度を専門家の手動最適化と比較した。
論文参考訳（メタデータ） (2025-10-18T11:02:54Z)
Autonomous Vehicle Controllers From End-to-End Differentiable Simulation [60.05963742334746]
そこで我々は,AVコントローラのトレーニングにAPG(analytic Policy gradients)アプローチを適用可能なシミュレータを提案し,その設計を行う。提案するフレームワークは, エージェントがより根底的なポリシーを学ぶのを助けるために, 環境力学の勾配を役立てる, エンド・ツー・エンドの訓練ループに, 微分可能シミュレータを組み込む。ダイナミクスにおけるパフォーマンスとノイズに対する堅牢性の大幅な改善と、全体としてより直感的なヒューマンライクな処理が見られます。
論文参考訳（メタデータ） (2024-09-12T11:50:06Z)
Large Language Models for Human-Machine Collaborative Particle Accelerator Tuning through Natural Language [14.551969747057642]
本稿では,粒子加速器をチューニングするための大規模言語モデル (LLM) を提案する。演算子からの自然言語のみに基づいて,LLMが粒子加速器サブシステムを正常かつ自律的にチューニングできることを実証する。また,LLMが高非線形実世界の目的関数の数値最適化を行う方法を示す。
論文参考訳（メタデータ） (2024-05-14T18:05:44Z)
Partial End-to-end Reinforcement Learning for Robustness Against Modelling Error in Autonomous Racing [0.0]
本稿では、自動運転車における強化学習(RL)ソリューションの性能向上の問題に対処する。計画タスクと制御タスクを分離する部分的なエンドツーエンドアルゴリズムを提案する。従来の制御器のロバスト性を活用することにより,本アルゴリズムは標準のエンドツーエンドアルゴリズムよりもモデルミスマッチに対するロバスト性を向上する。
論文参考訳（メタデータ） (2023-12-11T14:27:10Z)
TLControl: Trajectory and Language Control for Human Motion Synthesis [68.09806223962323]
本稿では,人間のリアルな動き合成のための新しい手法であるTLControlを提案する。低レベルのTrajectoryと高レベルのLanguage semanticsコントロールが組み込まれている。インタラクティブで高品質なアニメーション生成には実用的である。
論文参考訳（メタデータ） (2023-11-28T18:54:16Z)
Reaching the Limit in Autonomous Racing: Optimal Control versus Reinforcement Learning [66.10854214036605]
ロボット工学における中心的な問題は、アジャイルなモバイルロボットの制御システムをどうやって設計するかである。本稿では、強化学習(RL)で訓練されたニューラルネットワークコントローラが最適制御(OC)法より優れていることを示す。その結果、アジャイルドローンを最大性能に押し上げることができ、最大加速速度は重力加速度の12倍以上、ピーク速度は時速108kmに達しました。
論文参考訳（メタデータ） (2023-10-17T02:40:27Z)
Reachable Polyhedral Marching (RPM): An Exact Analysis Tool for Deep-Learned Control Systems [11.93664682521114]
我々は、rerectified Unit (ReLU) アクティベーションを備えたフィードフォワードニューラルネットワークに注目した。本稿では,アフィン領域の増分および連結を利用したROA計算アルゴリズムを提案する。最後に,航空機の滑走路制御問題に対する画像ベース制御器によって安定化された状態の集合を見つけるために,本手法を適用した。
論文参考訳（メタデータ） (2022-10-15T17:15:53Z)
Physics-Inspired Temporal Learning of Quadrotor Dynamics for Accurate Model Predictive Trajectory Tracking [76.27433308688592]
クオーロタのシステムダイナミクスを正確にモデル化することは、アジャイル、安全、安定したナビゲーションを保証する上で非常に重要です。本稿では,ロボットの経験から,四重項系の力学を純粋に学習するための新しい物理インスパイアされた時間畳み込みネットワーク(PI-TCN)を提案する。提案手法は,スパース時間的畳み込みと高密度フィードフォワード接続の表現力を組み合わせて,正確なシステム予測を行う。
論文参考訳（メタデータ） (2022-06-07T13:51:35Z)
DiffSkill: Skill Abstraction from Differentiable Physics for Deformable Object Manipulations with Tools [96.38972082580294]
DiffSkillは、変形可能なオブジェクト操作タスクを解決するために、スキル抽象化に微分可能な物理シミュレータを使用する新しいフレームワークである。特に、勾配に基づくシミュレーターから個々のツールを用いて、まず短距離のスキルを得る。次に、RGBD画像を入力として取り込む実演軌跡から、ニューラルネットワークの抽象体を学習する。
論文参考訳（メタデータ） (2022-03-31T17:59:38Z)
Using Simulation Optimization to Improve Zero-shot Policy Transfer of Quadrotors [0.14999444543328289]
実世界データを用いて微調整を行うことなく,シミュレーションで完全に強化学習を施した低レベルの制御ポリシを訓練し,四足歩行ロボットに展開することが可能であることを示す。私たちのニューラルネットワークベースのポリシーは、オンボードセンサーデータのみを使用し、組み込みドローンハードウェアで完全に動作します。
論文参考訳（メタデータ） (2022-01-04T22:32:05Z)
Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。 NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文参考訳（メタデータ） (2020-12-04T18:59:32Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。