Fugu-MT 論文翻訳(概要): Introducing PetriRL: An Innovative Framework for JSSP Resolution Integrating Petri nets and Event-based Reinforcement Learning

論文の概要: Introducing PetriRL: An Innovative Framework for JSSP Resolution Integrating Petri nets and Event-based Reinforcement Learning

arxiv url: http://arxiv.org/abs/2402.00046v2
Date: Wed, 8 May 2024 10:47:57 GMT
ステータス: 翻訳完了
システム内更新日: 2024-05-09 18:31:11.797992
Title: Introducing PetriRL: An Innovative Framework for JSSP Resolution Integrating Petri nets and Event-based Reinforcement Learning
Title（参考訳）: PetriRLの導入: イベントベース強化学習とペトリネットの統合によるJSSP解決のための革新的フレームワーク
Authors: Sofiene Lassoued, Andreas Schwung,
Abstract要約: PetriRLは、ペトリネットと深層強化学習を統合する新しいフレームワークである。ペトリRLは、離散事象系をモデル化する際のペトリネット固有の強みを生かしている。
参考スコア（独自算出の注目度）: 3.8750364147156247
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Resource utilization and production process optimization are crucial for companies in today's competitive industrial landscape. Addressing the complexities of job shop scheduling problems (JSSP) is essential to improving productivity, reducing costs, and ensuring timely delivery. We propose PetriRL, a novel framework integrating Petri nets and deep reinforcement learning (DRL) for JSSP optimization. PetriRL capitalizes on the inherent strengths of Petri nets in modelling discrete event systems while leveraging the advantages of a graph structure. The Petri net governs automated components of the process, ensuring adherence to JSSP constraints. This allows for synergistic collaboration with optimization algorithms such as DRL, particularly in critical decision-making. Unlike traditional methods, PetriRL eliminates the need to preprocess JSSP instances into disjunctive graphs and enhances the explainability of process status through its graphical structure based on places and transitions. Additionally, the inherent graph structure of Petri nets enables the dynamic additions of job operations during the inference phase without requiring agent retraining, thus enhancing flexibility. Experimental results demonstrate PetriRL's robust generalization across various instance sizes and its competitive performance on public test benchmarks and randomly generated instances. Results are compared to a wide range of optimization solutions such as heuristics, metaheuristics, and learning-based algorithms. Finally, the added values of the framework's key elements, such as event-based control and action masking, are studied in the ablation study.
Abstract（参考訳）: 資源利用と生産プロセスの最適化は、今日の競争力のある工業分野の企業にとって不可欠である。ジョブショップスケジューリング問題(JSSP)の複雑さに対処することは、生産性の向上、コスト削減、タイムリーなデリバリの確保に不可欠である。 JSSP最適化のためのペトリネットと深部強化学習(DRL)を統合した新しいフレームワークであるPetriRLを提案する。ペトリRLは、グラフ構造の利点を生かしながら離散イベントシステムのモデル化において、ペトリネットの固有の強みを生かしている。 Petrinetはプロセスの自動化コンポーネントを管理し、JSSP制約の遵守を保証する。これにより、DRLのような最適化アルゴリズム、特に重要な意思決定において、シナジスティックな協調が可能になる。 PetriRLは従来の方法とは異なり、JSSPインスタンスを解離グラフにプリプロセスする必要をなくし、場所と遷移に基づいたグラフィカルな構造を通じてプロセス状態の説明可能性を高める。さらに、ペトリネット固有のグラフ構造により、エージェントの再トレーニングを必要とせず、推論フェーズにおけるジョブ操作の動的追加が可能となり、柔軟性が向上する。実験により、ペトリRLの様々なインスタンスサイズに対する堅牢な一般化と、公開テストベンチマークやランダムに生成されたインスタンス上での競合性能が示された。結果は、ヒューリスティックス、メタヒューリスティックス、学習に基づくアルゴリズムなど、幅広い最適化ソリューションと比較される。最後に,イベントベース制御やアクションマスキングなどのフレームワークのキー要素の追加値について,アブレーション研究で検討した。

関連論文リスト

Learning Memory-Enhanced Improvement Heuristics for Flexible Job Shop Scheduling [39.98859285173431]
フレキシブルなジョブショップスケジューリング問題(FJSP)は、現実の運用シナリオと複雑で強い整合性のため、大きな注目を集めている。現在の深部強化学習(DRL)に基づくFJSPのアプローチは主に建設的手法を採用している。本稿では,異種グラフ表現を用いたメモリ拡張改善検索フレームワーク-MIStarを提案する。
論文参考訳（メタデータ） (2026-03-03T10:43:01Z)
ProRAG: Process-Supervised Reinforcement Learning for Retrieval-Augmented Generation [54.071574153853994]
ProRAGは、学習段階の監視をオンライン最適化ループに統合するために設計されたプロセス教師付き強化学習フレームワークである。本フレームワークは,(1)構造化推論形式でモデルを初期化するための監視されたポリシーワームアップ,(2)中間推論品質を定量化するためのMCTSベースのプロセスリワードモデル(PRM)の構築,(3)細粒度プロセスの好みに合わせてポリシーを調整するためのPRM誘導推論リファインメント,(4)プロセススーパービジョン強化学習と2つのグラニュラリティー・アドバンテージ・メカニズムの4段階から構成される。
論文参考訳（メタデータ） (2026-01-29T16:04:59Z)
Flexible Manufacturing Systems Intralogistics: Dynamic Optimization of AGVs and Tool Sharing Using Coloured-Timed Petri Nets and Actor-Critic RL with Actions Masking [0.0]
本稿では,自動誘導車両(AGV)とツール共有システムの同時統合により,新たな複雑さを取り入れた従来型のジョブショップスケジューリング問題を推し進める。色付き時間ペトリネット(CTPN)とアクター批判モデルに基づく強化学習(MBRL)を組み合わせた新しいアプローチを提案する。提案手法は,小規模の公開ベンチマークと,Tallardベンチマークにインスパイアされた大規模ベンチマークを用いて評価した。
論文参考訳（メタデータ） (2026-01-08T12:37:02Z)
Let It Flow: Agentic Crafting on Rock and Roll, Building the ROME Model within an Open Agentic Learning Ecosystem [90.17610617854247]
本稿では,エージェントモデルの生産パイプラインを最適化する基盤インフラであるエージェント学習エコシステム(ALE)を紹介する。 ALEは、重量最適化のためのトレーニング後のフレームワークであるROLL、軌道生成のためのサンドボックス環境マネージャであるROCK、効率的なコンテキストエンジニアリングのためのエージェントフレームワークであるiFlow CLIの3つのコンポーネントで構成されている。 ROMEはALEが基盤として100万件以上のトラジェクトリをトレーニングしたオープンソースエージェントです。
論文参考訳（メタデータ） (2025-12-31T14:03:39Z)
Optimizing the Network Topology of a Linear Reservoir Computer [0.0]
貯留層コンピューティング(Reservoir computing)は、予測および観測タスクのための時間データを処理する機械学習ツールである。伝統的に、貯水池コンピュータ(RC)の接続はランダムに発生し、基本設計を欠いている。本稿では,線形RCのトポロジを最適化し,その性能と解釈性を改善することに焦点を当てる。
論文参考訳（メタデータ） (2025-09-27T16:24:53Z)
Simulation-Driven Reinforcement Learning in Queuing Network Routing Optimization [0.0]
本研究では、複雑な待ち行列ネットワークシステムにおけるルーティング決定を最適化するためのシミュレーション駆動強化学習(RL)フレームワークの開発に焦点をあてる。我々は、Dyna-DDPG(Dyna-DDPG)とDyna-DDPG(Dyna-DDPG)を組み合わせた、Deep Deterministic Policy Gradient(DDPG)を利用したロバストなRLアプローチを提案する。包括的な実験と厳密な評価は、効果的なルーティングポリシーを迅速に学習するフレームワークの能力を示している。
論文参考訳（メタデータ） (2025-07-24T20:32:47Z)
RLHGNN: Reinforcement Learning-driven Heterogeneous Graph Neural Network for Next Activity Prediction in Business Processes [14.031370458128068]
次のアクティビティ予測は、サービス指向アーキテクチャでビジネスプロセスを最適化する上での課題である。イベントログを異種プロセスグラフに変換する新しいフレームワークであるRLHGNNを紹介する。 RLHGNNは、最先端のアプローチよりも一貫して優れていることを示す。
論文参考訳（メタデータ） (2025-07-03T15:01:08Z)
LAPSO: A Unified Optimization View for Learning-Augmented Power System Operations [3.754570687412345]
本稿では,LAPSO(Learning-Augmented Power System Operations)の総合的枠組みを提案する。 LAPSOは運用段階を中心におり、時間的にサイロ化された電力系統のタスクの境界線を断ち切ることを目的としている。学習可能なコンポーネントで既存のパワーシステム最適化モデルを自動的に拡張するために、専用のPythonパッケージ-lapsoが導入された。
論文参考訳（メタデータ） (2025-05-08T13:00:24Z)
Logic Synthesis Optimization with Predictive Self-Supervision via Causal Transformers [19.13500546022262]
LSOformerは、自動回帰トランスフォーマーモデルと予測SSLを利用して、結果の質の軌道(QoR)を予測する新しいアプローチである。 LSOformerは、クロスアテンションモジュールを統合して、回路グラフと最適化シーケンスからの洞察をマージし、QoRメトリクスの予測精度を向上させる。
論文参考訳（メタデータ） (2024-09-16T18:45:07Z)
REBEL: Reinforcement Learning via Regressing Relative Rewards [59.68420022466047]
生成モデルの時代における最小限のRLアルゴリズムであるREBELを提案する。理論的には、自然ポリシーグラディエントのような基本的なRLアルゴリズムはREBELの変種と見なすことができる。我々はREBELが言語モデリングと画像生成に一貫したアプローチを提供し、PPOやDPOとより強くあるいは類似した性能を実現することを発見した。
論文参考訳（メタデータ） (2024-04-25T17:20:45Z)
Learning-enabled Flexible Job-shop Scheduling for Scalable Smart Manufacturing [11.509669981978874]
スマートマニュファクチャリングシステムでは、生産性を最大化するためのソリューションを最適化するために、輸送制約付きフレキシブルなジョブショップスケジューリングが不可欠である。近年, 深部強化学習(DRL)に基づくFJSPT法の開発が, 大規模一般化の課題に直面している。 Heterogeneous Graph Scheduler (HGS) と呼ばれる新しいグラフベースのDRL法を導入する。
論文参考訳（メタデータ） (2024-02-14T06:49:23Z)
Accelerate Presolve in Large-Scale Linear Programming via Reinforcement Learning [92.31528918811007]
本稿では,P1)-(P3) を同時に扱うための簡易かつ効率的な強化学習フレームワーク,すなわち,事前解決のための強化学習(RL4Presolve)を提案する。 2つの解法と8つのベンチマーク(実世界と合成)の実験により、RL4Presolveは大規模LPの解法効率を大幅に改善することを示した。
論文参考訳（メタデータ） (2023-10-18T09:51:59Z)
Flexible Job Shop Scheduling via Dual Attention Network Based Reinforcement Learning [73.19312285906891]
フレキシブルなジョブショップスケジューリング問題(FJSP)では、複数のマシンで操作を処理でき、操作とマシンの間の複雑な関係が生じる。近年, 深層強化学習(DRL)を用いて, FJSP解決のための優先派遣規則(PDR)を学習している。本稿では,Deep機能抽出のための自己注意モデルと,スケーラブルな意思決定のためのDRLの利点を生かした,エンドツーエンド学習フレームワークを提案する。
論文参考訳（メタデータ） (2023-05-09T01:35:48Z)
MARLIN: Soft Actor-Critic based Reinforcement Learning for Congestion Control in Real Networks [63.24965775030673]
そこで本研究では,汎用的な渋滞制御(CC)アルゴリズムを設計するための新しい強化学習(RL)手法を提案する。我々の解であるMARLINは、Soft Actor-Criticアルゴリズムを用いてエントロピーとリターンの両方を最大化する。我々は,MARLINを実ネットワーク上で訓練し,実ミスマッチを克服した。
論文参考訳（メタデータ） (2023-02-02T18:27:20Z)
Unifying Synergies between Self-supervised Learning and Dynamic Computation [53.66628188936682]
SSLとDCのパラダイム間の相互作用に関する新しい視点を提示する。 SSL設定において、スクラッチから高密度かつゲートされたサブネットワークを同時に学習することは可能であることを示す。密集エンコーダとゲートエンコーダの事前学習における共進化は、良好な精度と効率のトレードオフをもたらす。
論文参考訳（メタデータ） (2023-01-22T17:12:58Z)
A Memetic Algorithm with Reinforcement Learning for Sociotechnical Production Scheduling [0.0]
本稿では、フレキシブルジョブショップスケジューリング問題(DRC-FJSSP)に深層強化学習(DRL)を適用したメメティックアルゴリズムを提案する。産業における研究プロジェクトから、フレキシブルマシン、フレキシブルなヒューマンワーカー、作業能力、セットアップと処理操作、材料到着時間、材料製造の請求書の並列タスク、シーケンス依存のセットアップ時間、人間と機械のコラボレーションにおける(一部)自動化タスクを検討する必要性を認識します。
論文参考訳（メタデータ） (2022-12-21T11:24:32Z)
Automated Evolutionary Approach for the Design of Composite Machine Learning Pipelines [48.7576911714538]
提案手法は、複合機械学習パイプラインの設計を自動化することを目的としている。パイプラインをカスタマイズ可能なグラフベースの構造で設計し、得られた結果を分析して再生する。このアプローチのソフトウェア実装は、オープンソースフレームワークとして紹介されている。
論文参考訳（メタデータ） (2021-06-26T23:19:06Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。