論文の概要: Deep Reinforcement Learning for Flexible Job Shop Scheduling with Random Job Arrivals
- arxiv url: http://arxiv.org/abs/2605.22773v1
- Date: Thu, 21 May 2026 17:33:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 20:14:18.611667
- Title: Deep Reinforcement Learning for Flexible Job Shop Scheduling with Random Job Arrivals
- Title(参考訳): ランダムジョブ条件付きフレキシブルジョブショップスケジューリングのための深層強化学習
- Authors: Yu Tang, Muhammad Zakwan, Efe Balta, John Lygeros, Alisa Rupenyan,
- Abstract要約: 本稿では、フレキシブルジョブショップスケジューリング問題を解決するために、イベントベースのglsDRLアプローチを提案する。
具体的には、近似ポリシー最適化アルゴリズムを用い、軽量多層パーセプトロンを用いてglsDRLエージェントを訓練する。
提案手法は,データセットが不均一である場合,特に良好な性能が得られることを示す。
- 参考スコア(独自算出の注目度): 7.619760492481146
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Flexible Job Shop Scheduling Problem (FJSP) is the optimal allocation of a set of jobs to machines. Two primary challenges persist in FJSP: the unpredictable arrival of future jobs and the combinatorial complexity of the problem, rendering it intractable for conventional mixed-integer linear programming solvers. This paper proposes an event-based \gls{DRL} approach to solve FJSP with random job arrivals. Specifically, we employ the Proximal Policy Optimization algorithm and use lightweight Multi-Layer Perceptrons to train the \gls{DRL} agent for minimizing the total completion time of all jobs. We design the state representation to be directly accessible from the environment, and limit the learning agent to selecting from among a set of well-established dispatching rules. Simulations show that our \gls{DRL} approach outperforms any of the individual dispatching rules on datasets with varying heterogeneity and job arrival rates. We benchmark our \gls{DRL} against an arrival-triggered mixed-integer linear programming solution and show that our method achieves good performance especially when the datasets are heterogeneous.
- Abstract(参考訳): フレキシブルジョブショップスケジューリング問題(Flexible Job Shop Scheduling Problem、FJSP)は、ジョブの集合をマシンに最適に割り当てる問題である。
FJSPの主な課題は、予測不可能な将来のジョブの到着と、問題の組合せの複雑さである。
本稿では、ランダムなジョブ到着でFJSPを解決するイベントベース \gls{DRL} アプローチを提案する。
具体的には、ポリシ最適化アルゴリズムを採用し、軽量なマルチ層パーセプトロンを用いて、すべてのジョブの完了時間を最小化するために \gls{DRL} エージェントを訓練する。
我々は、環境から直接アクセス可能な状態表現を設計し、学習エージェントが確立されたディスパッチルールのセットの中から選択することを制限する。
シミュレーションにより、我々の \gls{DRL} アプローチは、異質性やジョブの到着率の異なるデータセット上の個々のディスパッチルールよりも優れていることが示された。
我々は,<gls{DRL} を到着トリガー混合整数線形計画法と比較し,特にデータセットが不均一である場合に,本手法が優れた性能を発揮することを示す。
関連論文リスト
- Adaptive Bias Generalized Rollout Policy Adaptation on the Flexible Job-Shop Scheduling Problem [3.6266514127975906]
フレキシブルジョブショップスケジューリング問題(FJSSP)はNPハード最適化問題である。
一般化Nested Rollout Policy Adaptationから派生した新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-05-13T11:27:18Z) - Hierarchical Balance Packing: Towards Efficient Supervised Fine-tuning for Long-Context LLM [49.2709992932292]
長期コンテキスト大規模言語モデル(LLM)のトレーニングは、長期コンテキストと短コンテキストデータによるハイブリッドトレーニングが、ワークロードの不均衡につながることが多いため、難しい。
既存の作業では、主にデータパッキングを使用してこの問題を軽減するが、不均衡な注意計算や通信オーバーヘッドの無駄を考慮できない。
本稿では,これらの非効率性に対処する新しいバッチ構築法とトレーニングレシピを設計する階層的バランスパッキング(HBP)を提案する。
論文 参考訳(メタデータ) (2025-03-10T10:52:50Z) - A Benchmarking Environment for Worker Flexibility in Flexible Job Shop Scheduling Problems [0.0]
生産スケジューリングにおいて、フレキシブルジョブショップスケジューリング問題(FJSSP)は、一連の操作を最適化し、それぞれの処理時間を異なるマシンに割り当てることを目的としている。
結果として生じる問題はFlexible Job Shop Scheduling Problem with Worker Flexibility (FJSSP-W)と呼ばれる。
本稿では、一般に受け入れられているFJSSPインスタンス402のコレクションを示し、労働者の柔軟性で拡張するアプローチを提案する。
論文 参考訳(メタデータ) (2025-01-27T15:56:12Z) - Online Intrinsic Rewards for Decision Making Agents from Large Language Model Feedback [52.763620660061115]
ONIは、RLポリシーと本質的な報酬関数を同時に学習する分散アーキテクチャである。
我々は、様々な複雑さを持つ報酬モデリングのためのアルゴリズムの選択範囲を探索する。
提案手法は,NetHack Learning Environment の様々な課題にまたがって,最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2024-10-30T13:52:43Z) - Offline Reinforcement Learning for Learning to Dispatch for Job Shop Scheduling [0.9831489366502301]
ジョブショップスケジューリング問題(JSSP)は複雑な最適化問題である。
オンライン強化学習(RL)は、JSSPの許容可能なソリューションを素早く見つけることで、有望であることを示している。
JSSPのオフライン強化学習手法であるOffline Learned Dispatching (Offline-LD)を紹介する。
論文 参考訳(メタデータ) (2024-09-16T15:18:10Z) - AgentOhana: Design Unified Data and Training Pipeline for Effective Agent Learning [98.26836657967162]
textbfAgentOhanaは、さまざまなシナリオにまたがって、異なる環境からエージェントのトラジェクトリを集約する。
AIエージェント用に調整された大規模なアクションモデルである textbfxLAM-v0.1 は、さまざまなベンチマークで例外的なパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-02-23T18:56:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。