Fugu-MT 論文翻訳(概要): RL-ABC: Reinforcement Learning for Accelerator Beamline Control

論文の概要: RL-ABC: Reinforcement Learning for Accelerator Beamline Control

arxiv url: http://arxiv.org/abs/2604.19146v1
Date: Tue, 21 Apr 2026 06:52:36 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-22 22:41:49.658969
Title: RL-ABC: Reinforcement Learning for Accelerator Beamline Control
Title（参考訳）: RL-ABC:加速器ビームライン制御のための強化学習
Authors: Anwar Ibrahim, Fedor Ratnikov, Maxim Kaledin, Alexey Petrenko, Denis Derkach,
Abstract要約: RLABCはオープンソースのPythonフレームワークで、標準のエレガントビームライン構成を強化学習環境に変換する。 RLABCは、広く使われているエレガントビームシミュレーションコードとSDDSベースのインタフェースで統合する。このフレームワークは、Stable-Baselines3との互換性を通じて複数のRLアルゴリズムをサポートし、トレーニング効率を向上させるためのステージ学習戦略を実装している。
参考スコア（独自算出の注目度）: 0.8096544487333978
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Particle accelerator beamline optimization is a high-dimensional control problem traditionally requiring significant expert intervention. We present RLABC (Reinforcement Learning for Accelerator Beamline Control), an open-source Python framework that automatically transforms standard Elegant beamline configurations into reinforcement learning environments. RLABC integrates with the widely-used Elegant beam dynamics simulation code via SDDS-based interfaces, enabling researchers to apply modern RL algorithms to beamline optimization with minimal RL-specific development. The main contribution is a general methodology for formulating beamline tuning as a Markov decision process: RLABC automatically preprocesses lattice files to insert diagnostic watch points before each tunable element, constructs a 57-dimensional state representation from beam statistics, covariance information, and aperture constraints, and provides a configurable reward function for transmission optimization. The framework supports multiple RL algorithms through Stable-Baselines3 compatibility and implements stage learning strategies for improved training efficiency. Validation on a test beamline derived from the VEPP-5 injection complex (37 control parameters across 11 quadrupoles and 4 dipoles) demonstrates that the framework successfully enables RL-based optimization, with a Deep Deterministic Policy Gradient agent achieving 70.3\% particle transmission -- performance matching established methods such as differential evolution. The framework's stage learning capability allows decomposition of complex optimization problems into manageable subproblems, improving training efficiency. The complete framework, including configuration files and example notebooks, is available as open-source software to facilitate adoption and further research.
Abstract（参考訳）: 粒子加速器のビームライン最適化は、伝統的にかなりの専門的な介入を必要とする高次元制御問題である。 RLABC(Reinforcement Learning for Accelerator Beamline Control)は,標準エレガントビームライン構成を自動的に強化学習環境に変換するオープンソースのPythonフレームワークである。 RLABCはSDDSベースのインタフェースを介して広く使われているエレガントビームシミュレーションコードと統合されており、研究者はRL固有の最小限の開発でビームライン最適化にモダンなRLアルゴリズムを適用することができる。 RLABCは、各チューニング可能な要素の前に診断ウォッチポイントを挿入するために格子ファイルを自動的に前処理し、ビーム統計、共分散情報、開口制約から57次元の状態表現を構築し、送信最適化のための構成可能な報酬関数を提供する。このフレームワークは、Stable-Baselines3との互換性を通じて複数のRLアルゴリズムをサポートし、トレーニング効率を向上させるためのステージ学習戦略を実装している。 VEPP-5インジェクションコンプレックス(11の四重極と4の双極子にわたる37の制御パラメータ)から導かれる試験ビームラインの検証は、このフレームワークがRLベースの最適化を成功裏に実現することを示した。フレームワークのステージ学習能力は、複雑な最適化問題を管理可能なサブプロブレムに分解し、トレーニング効率を向上させる。設定ファイルやサンプルノートブックを含む完全なフレームワークは、採用とさらなる研究を容易にするオープンソースソフトウェアとして利用可能である。

関連論文リスト

Reinforcement Learning for Accelerator Beamline Control: a simulation-based approach [0.764101887158157]
RLABCはPythonベースのライブラリで、強化学習(RL)問題としてビームライン最適化を再構成する。 RLABCは標準格子と要素入力ファイルからRL環境を自動生成し、磁石の逐次チューニングにより粒子損失を最小限に抑える。 RLABCが2本のビームラインに対して有効であることを示し,94%と91%の伝送速度を専門家の手動最適化と比較した。
論文参考訳（メタデータ） (2025-10-18T11:02:54Z)
The Anatomy of Alignment: Decomposing Preference Optimization by Steering Sparse Features [1.7832672957068079]
このフレームワークは、解釈可能なスパース機能を調節することで、モデル動作を操る軽量なアダプタを訓練する。この機構は, 学習後プロセスの挙動変化を近似するのに十分な原理と表現性を有することを示す。全体として、FSRLは解釈可能な制御インターフェースを提供し、フィーチャレベルでの好み最適化の圧力がどのように現れるかを診断する実用的な方法を提供している。
論文参考訳（メタデータ） (2025-09-16T10:32:40Z)
Ring-lite: Scalable Reasoning via C3PO-Stabilized Reinforcement Learning for LLMs [51.21041884010009]
Ring-liteは、強化学習(RL)により最適化されたMixture-of-Experts(MoE)ベースの大規模言語モデルである我々のアプローチは、挑戦的なベンチマーク上でのSOTA(State-of-the-art)の小規模推論モデルの性能と一致する。
論文参考訳（メタデータ） (2025-06-17T17:12:34Z)
Enhancing Reinforcement Learning for the Floorplanning of Analog ICs with Beam Search [0.32985979395737786]
本稿では,強化学習(RL)とビーム(BS)戦略を組み合わせたハイブリッド手法を提案する。 BSアルゴリズムはエージェントの推論プロセスを強化し、フレキシブルなフロアプランを生成する。実験結果から, 標準RL法と比較すると, 面積, 死空間, 線長が約5～85%向上した。
論文参考訳（メタデータ） (2025-05-08T08:50:32Z)
Design Optimization of NOMA Aided Multi-STAR-RIS for Indoor Environments: A Convex Approximation Imitated Reinforcement Learning Approach [51.63921041249406]
非直交多重アクセス(Noma)により、複数のユーザが同じ周波数帯域を共有でき、同時に再構成可能なインテリジェントサーフェス(STAR-RIS)を送信および反射することができる。 STAR-RISを屋内に展開することは、干渉緩和、電力消費、リアルタイム設定における課題を提示する。複数のアクセスポイント(AP)、STAR-RIS、NOMAを利用した新しいネットワークアーキテクチャが屋内通信のために提案されている。
論文参考訳（メタデータ） (2024-06-19T07:17:04Z)
Optimal Parallelization Strategies for Active Flow Control in Deep Reinforcement Learning-Based Computational Fluid Dynamics [29.49913315698914]
Deep Reinforcement Learning (DRL) は、高ダイナミックかつ非線形なアクティブフロー制御(AFC)問題を扱うための有望なアプローチとして登場した。本研究では、DRLに基づくアルゴリズムを並列設定で最適化することに焦点を当てる。並列効率を約49%から約78%に向上させる。
論文参考訳（メタデータ） (2024-02-18T09:07:30Z)
End-To-End Optimization of LiDAR Beam Configuration for 3D Object Detection and Localization [87.56144220508587]
与えられたアプリケーションに対するLiDARビーム構成の最適化を学ぶために、新しい経路を取る。ビーム構成を自動的に最適化する強化学習に基づく学習最適化フレームワークを提案する。本手法は低解像度(低コスト)のLiDARが必要な場合に特に有用である。
論文参考訳（メタデータ） (2022-01-11T09:46:31Z)
Optimization-driven Deep Reinforcement Learning for Robust Beamforming in IRS-assisted Wireless Communications [54.610318402371185]
Intelligent Reflecting Surface (IRS)は、マルチアンテナアクセスポイント(AP)から受信機へのダウンリンク情報伝達を支援する有望な技術である。我々は、APのアクティブビームフォーミングとIRSのパッシブビームフォーミングを共同最適化することで、APの送信電力を最小化する。過去の経験からビームフォーミング戦略に適応できる深層強化学習(DRL)手法を提案する。
論文参考訳（メタデータ） (2020-05-25T01:42:55Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。