論文の概要: Reinforcement Learning of Display Transfer Robots in Glass Flow Control
Systems: A Physical Simulation-Based Approach
- arxiv url: http://arxiv.org/abs/2310.07981v1
- Date: Thu, 12 Oct 2023 02:10:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-15 11:17:57.330940
- Title: Reinforcement Learning of Display Transfer Robots in Glass Flow Control
Systems: A Physical Simulation-Based Approach
- Title(参考訳): ガラスフロー制御系における表示伝達ロボットの強化学習:物理シミュレーションに基づくアプローチ
- Authors: Hwajong Lee, Chan Kim, Seong-Woo Kim
- Abstract要約: フロー制御システムは製造システムの生産能力を高めるための重要な概念である。
フロー制御に関するスケジューリング最適化問題を解決するため、既存の手法はドメイン・ヒューマン・エキスパートによる設計に依存している。
本稿では,物理シミュレーション環境を実装し,ディスプレイ製造における移動ロボットを用いた現実的なフロー制御システムの設計を提案する。
- 参考スコア(独自算出の注目度): 6.229216953398305
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: A flow control system is a critical concept for increasing the production
capacity of manufacturing systems. To solve the scheduling optimization problem
related to the flow control with the aim of improving productivity, existing
methods depend on a heuristic design by domain human experts. Therefore, the
methods require correction, monitoring, and verification by using real
equipment. As system designs increase in complexity, the monitoring time
increases, which decreases the probability of arriving at the optimal design.
As an alternative approach to the heuristic design of flow control systems, the
use of deep reinforcement learning to solve the scheduling optimization problem
has been considered. Although the existing research on reinforcement learning
has yielded excellent performance in some areas, the applicability of the
results to actual FAB such as display and semiconductor manufacturing processes
is not evident so far. To this end, we propose a method to implement a physical
simulation environment and devise a feasible flow control system design using a
transfer robot in display manufacturing through reinforcement learning. We
present a model and parameter setting to build a virtual environment for
different display transfer robots, and training methods of reinforcement
learning on the environment to obtain an optimal scheduling of glass flow
control systems. Its feasibility was verified by using different types of
robots used in the actual process.
- Abstract(参考訳): フロー制御システムは製造システムの生産能力を高めるための重要な概念である。
生産性向上を目的としたフロー制御に関するスケジューリング最適化問題を解決するため、既存の手法は、ドメイン人間の専門家によるヒューリスティック設計に依存する。
そのため, 本手法では, 実際の機器による補正, 監視, 検証が必要である。
システム設計が複雑化するにつれて、監視時間が増加し、最適な設計に到達する確率が低下する。
フロー制御系のヒューリスティック設計に対する代替手法として,スケジューリング最適化問題の解法として深層強化学習法が検討されている。
これまでの強化学習の研究はいくつかの分野で優れた成果を上げているが、ディスプレイや半導体製造プロセスといった実際のFABへの適用性は明らかになっていない。
そこで本研究では,物理シミュレーション環境を実装し,強化学習によるディスプレイ製造におけるトランスファーロボットを用いたフロー制御システム設計を考案する手法を提案する。
本稿では,異なるディスプレイ転送ロボットのための仮想環境を構築するためのモデルとパラメータの設定と,ガラスフロー制御系の最適スケジューリングを得るための環境強化学習のトレーニング手法を提案する。
その実現性は、実際のプロセスで使用される異なるタイプのロボットを用いて検証された。
関連論文リスト
- Model-based deep reinforcement learning for accelerated learning from flow simulations [0.0]
フロー制御アプリケーションにおけるモデルベース強化学習の利点を実証する。
具体的には, 流れシミュレーションから採取した軌道と, 環境モデルのアンサンブルから採取した軌道とを交互に組み合わせることで, 政策を最適化する。
モデルベースの学習は、流動的なピンボールテストケースに対して、トレーニング全体の時間を最大85%削減する。
論文 参考訳(メタデータ) (2024-02-26T13:01:45Z) - TranDRL: A Transformer-Driven Deep Reinforcement Learning Enabled Prescriptive Maintenance Framework [58.474610046294856]
産業システムは、運用効率を高め、ダウンタイムを減らすための信頼性の高い予測保守戦略を要求する。
本稿では,Transformerモデルに基づくニューラルネットワークと深部強化学習(DRL)アルゴリズムの機能を活用し,システムの保守動作を最適化する統合フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-29T02:27:54Z) - MFRL-BI: Design of a Model-free Reinforcement Learning Process Control
Scheme by Using Bayesian Inference [5.375049126954924]
プロセス制御方式の設計は、製造システムのばらつきを低減するために品質保証に不可欠である。
本稿では,モデルフリー強化学習(MFRL)手法を提案する。
論文 参考訳(メタデータ) (2023-09-17T08:18:55Z) - Active Learning of Discrete-Time Dynamics for Uncertainty-Aware Model Predictive Control [46.81433026280051]
本稿では,非線形ロボットシステムの力学を積極的にモデル化する自己教師型学習手法を提案する。
我々のアプローチは、目に見えない飛行条件に一貫して適応することで、高いレジリエンスと一般化能力を示す。
論文 参考訳(メタデータ) (2022-10-23T00:45:05Z) - RLFlow: Optimising Neural Network Subgraph Transformation with World
Models [0.0]
本稿では,ニューラルネットワークのアーキテクチャを最適化するためのモデルベースエージェントを提案する。
提案手法は, 共通の畳み込みネットワーク上での最先端技術の性能に適合し, トランスフォーマースタイルのアーキテクチャでは最大5%性能が向上することを示す。
論文 参考訳(メタデータ) (2022-05-03T11:52:54Z) - Automated Evolutionary Approach for the Design of Composite Machine
Learning Pipelines [48.7576911714538]
提案手法は、複合機械学習パイプラインの設計を自動化することを目的としている。
パイプラインをカスタマイズ可能なグラフベースの構造で設計し、得られた結果を分析して再生する。
このアプローチのソフトウェア実装は、オープンソースフレームワークとして紹介されている。
論文 参考訳(メタデータ) (2021-06-26T23:19:06Z) - Machine Learning Framework for Quantum Sampling of Highly-Constrained,
Continuous Optimization Problems [101.18253437732933]
本研究では,連続空間の逆設計問題を,制約のないバイナリ最適化問題にマッピングする,汎用的な機械学習ベースのフレームワークを開発する。
本研究では, 熱発光トポロジを熱光応用に最適化し, (ii) 高効率ビームステアリングのための拡散メタグレーティングを行うことにより, 2つの逆設計問題に対するフレームワークの性能を示す。
論文 参考訳(メタデータ) (2021-05-06T02:22:23Z) - Anticipating the Long-Term Effect of Online Learning in Control [75.6527644813815]
AntLerは、学習を予想する学習ベースの制御法則の設計アルゴリズムである。
AntLer は確率 1 と任意に最適な解を近似することを示す。
論文 参考訳(メタデータ) (2020-07-24T07:00:14Z) - Reinforcement Learning Control of Robotic Knee with Human in the Loop by
Flexible Policy Iteration [17.365135977882215]
本研究は,ポリシーアルゴリズムに革新的な特徴を導入することで,重要な空白を埋める。
本稿では,近似値関数の収束,解の最適性,システムの安定性などのシステムレベルの性能を示す。
論文 参考訳(メタデータ) (2020-06-16T09:09:48Z) - Information Theoretic Model Predictive Q-Learning [64.74041985237105]
本稿では,情報理論的MPCとエントロピー正規化RLとの新たな理論的関連性を示す。
バイアスモデルを利用したQ-ラーニングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2019-12-31T00:29:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。