論文の概要: Introducing PetriRL: An Innovative Framework for JSSP Resolution
Integrating Petri nets and Event-based Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2402.00046v1
- Date: Tue, 23 Jan 2024 12:30:49 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-04 05:11:28.890868
- Title: Introducing PetriRL: An Innovative Framework for JSSP Resolution
Integrating Petri nets and Event-based Reinforcement Learning
- Title(参考訳): PetriRL: イベントベース強化学習とペトリネットの統合によるJSSP解決のための革新的フレームワーク
- Authors: Sofiene Lassoued, Andreas Schwung
- Abstract要約: ジョブショップスケジューリング問題を解決する革新的なフレームワーク(JSSP)について紹介する。
提案手法では,ペトリネットを利用して求人店をモデル化し,説明性の向上だけでなく,生データの直接的取り込みも実現している。
我々のアプローチは、様々なインスタンスサイズをまたいで一般化する堅牢な能力を示すだけでなく、ペトリネットのグラフの性質を活用してジョブ操作を動的に追加する。
- 参考スコア(独自算出の注目度): 4.5778421917309915
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Quality scheduling in industrial job shops is crucial. Although neural
networks excel in solving these problems, their limited explainability hinders
their widespread industrial adoption. In this research, we introduce an
innovative framework for solving job shop scheduling problems (JSSP). Our
methodology leverages Petri nets to model the job shop, not only improving
explainability but also enabling direct incorporation of raw data without the
need to preprocess JSSP instances into disjunctive graphs. The Petri net, with
its controlling capacities, also governs the automated components of the
process, allowing the agent to focus on critical decision-making, particularly
resource allocation. The integration of event-based control and action masking
in our approach yields competitive performance on public test benchmarks.
Comparative analyses across a wide spectrum of optimization solutions,
including heuristics, metaheuristics, and learning-based algorithms, highlight
the competitiveness of our approach in large instances and its superiority over
all competitors in small to medium-sized scenarios. Ultimately, our approach
not only demonstrates a robust ability to generalize across various instance
sizes but also leverages the Petri net's graph nature to dynamically add job
operations during the inference phase without the need for agent retraining,
thereby enhancing flexibility.
- Abstract(参考訳): 産業用ジョブショップにおける品質スケジューリングは不可欠である。
ニューラルネットワークはこれらの問題を解決するのに優れているが、その限定された説明性は、その産業的普及を妨げる。
本研究では,ジョブショップスケジューリング問題(JSSP)を解くための革新的なフレームワークを提案する。
提案手法では,ペトリネットを用いてジョブショップをモデル化し,説明性の向上だけでなく,JSSPインスタンスを解離グラフにプリプロセスすることなく,生データの直接的取り込みを可能にする。
petri netは、その制御能力と共に、プロセスの自動化コンポーネントを制御し、エージェントが重要な意思決定、特にリソース割り当てに集中できるようにします。
当社のアプローチにおけるイベントベースの制御とアクションマスキングの統合は、公開テストベンチマークにおける競合パフォーマンスをもたらす。
ヒューリスティックス、メタヒューリスティックス、学習に基づくアルゴリズムを含む、幅広い最適化ソリューションの比較分析は、大規模インスタンスにおける我々のアプローチの競争力と、中小規模シナリオにおける全ての競合に対する優位性を強調している。
最終的に、我々のアプローチは様々なインスタンスサイズにまたがる堅牢な一般化能力を示すだけでなく、ペトリネットのグラフ特性を活用し、エージェントの再トレーニングを必要とせずに推論フェーズ中に動的にジョブ操作を追加し、柔軟性を向上させる。
関連論文リスト
- Logic Synthesis Optimization with Predictive Self-Supervision via Causal Transformers [19.13500546022262]
LSOformerは、自動回帰トランスフォーマーモデルと予測SSLを利用して、結果の質の軌道(QoR)を予測する新しいアプローチである。
LSOformerは、クロスアテンションモジュールを統合して、回路グラフと最適化シーケンスからの洞察をマージし、QoRメトリクスの予測精度を向上させる。
論文 参考訳(メタデータ) (2024-09-16T18:45:07Z) - REBEL: Reinforcement Learning via Regressing Relative Rewards [59.68420022466047]
生成モデルの時代における最小限のRLアルゴリズムであるREBELを提案する。
理論的には、自然ポリシーグラディエントのような基本的なRLアルゴリズムはREBELの変種と見なすことができる。
我々はREBELが言語モデリングと画像生成に一貫したアプローチを提供し、PPOやDPOとより強くあるいは類似した性能を実現することを発見した。
論文 参考訳(メタデータ) (2024-04-25T17:20:45Z) - Learning-enabled Flexible Job-shop Scheduling for Scalable Smart
Manufacturing [11.509669981978874]
スマートマニュファクチャリングシステムでは、生産性を最大化するためのソリューションを最適化するために、輸送制約付きフレキシブルなジョブショップスケジューリングが不可欠である。
近年, 深部強化学習(DRL)に基づくFJSPT法の開発が, 大規模一般化の課題に直面している。
Heterogeneous Graph Scheduler (HGS) と呼ばれる新しいグラフベースのDRL法を導入する。
論文 参考訳(メタデータ) (2024-02-14T06:49:23Z) - Accelerate Presolve in Large-Scale Linear Programming via Reinforcement
Learning [92.31528918811007]
本稿では,P1)-(P3) を同時に扱うための簡易かつ効率的な強化学習フレームワーク,すなわち,事前解決のための強化学習(RL4Presolve)を提案する。
2つの解法と8つのベンチマーク(実世界と合成)の実験により、RL4Presolveは大規模LPの解法効率を大幅に改善することを示した。
論文 参考訳(メタデータ) (2023-10-18T09:51:59Z) - Flexible Job Shop Scheduling via Dual Attention Network Based
Reinforcement Learning [73.19312285906891]
フレキシブルなジョブショップスケジューリング問題(FJSP)では、複数のマシンで操作を処理でき、操作とマシンの間の複雑な関係が生じる。
近年, 深層強化学習(DRL)を用いて, FJSP解決のための優先派遣規則(PDR)を学習している。
本稿では,Deep機能抽出のための自己注意モデルと,スケーラブルな意思決定のためのDRLの利点を生かした,エンドツーエンド学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-09T01:35:48Z) - MARLIN: Soft Actor-Critic based Reinforcement Learning for Congestion
Control in Real Networks [63.24965775030673]
そこで本研究では,汎用的な渋滞制御(CC)アルゴリズムを設計するための新しい強化学習(RL)手法を提案する。
我々の解であるMARLINは、Soft Actor-Criticアルゴリズムを用いてエントロピーとリターンの両方を最大化する。
我々は,MARLINを実ネットワーク上で訓練し,実ミスマッチを克服した。
論文 参考訳(メタデータ) (2023-02-02T18:27:20Z) - Unifying Synergies between Self-supervised Learning and Dynamic
Computation [53.66628188936682]
SSLとDCのパラダイム間の相互作用に関する新しい視点を提示する。
SSL設定において、スクラッチから高密度かつゲートされたサブネットワークを同時に学習することは可能であることを示す。
密集エンコーダとゲートエンコーダの事前学習における共進化は、良好な精度と効率のトレードオフをもたらす。
論文 参考訳(メタデータ) (2023-01-22T17:12:58Z) - A Memetic Algorithm with Reinforcement Learning for Sociotechnical
Production Scheduling [0.0]
本稿では、フレキシブルジョブショップスケジューリング問題(DRC-FJSSP)に深層強化学習(DRL)を適用したメメティックアルゴリズムを提案する。
産業における研究プロジェクトから、フレキシブルマシン、フレキシブルなヒューマンワーカー、作業能力、セットアップと処理操作、材料到着時間、材料製造の請求書の並列タスク、シーケンス依存のセットアップ時間、人間と機械のコラボレーションにおける(一部)自動化タスクを検討する必要性を認識します。
論文 参考訳(メタデータ) (2022-12-21T11:24:32Z) - Automated Evolutionary Approach for the Design of Composite Machine
Learning Pipelines [48.7576911714538]
提案手法は、複合機械学習パイプラインの設計を自動化することを目的としている。
パイプラインをカスタマイズ可能なグラフベースの構造で設計し、得られた結果を分析して再生する。
このアプローチのソフトウェア実装は、オープンソースフレームワークとして紹介されている。
論文 参考訳(メタデータ) (2021-06-26T23:19:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。