論文の概要: Mamba Meets Scheduling: Learning to Solve Flexible Job Shop Scheduling with Efficient Sequence Modeling
- arxiv url: http://arxiv.org/abs/2602.21546v1
- Date: Wed, 25 Feb 2026 04:04:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-26 18:19:16.69595
- Title: Mamba Meets Scheduling: Learning to Solve Flexible Job Shop Scheduling with Efficient Sequence Modeling
- Title(参考訳): Mamba氏がスケジューリングについて語る - 効率的なシーケンスモデリングによるフレキシブルなジョブショップスケジューリングの学習
- Authors: Zhi Cao, Cong Zhang, Yaoxin Wu, Yaqing Hou, Hongwei Ge,
- Abstract要約: 本稿では、線形計算複雑性を持つ状態空間モデルであるMambaを利用して、フレキシブルジョブショップ問題(FJSP)に適したシーケンスモデリングを容易にする革新的なアーキテクチャを提案する。
実験の結果,本手法は高速な解法を実現するとともに,FJSPの最先端学習手法の性能を様々なベンチマークで上回っていることがわかった。
- 参考スコア(独自算出の注目度): 31.01398494542866
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Flexible Job Shop Problem (FJSP) is a well-studied combinatorial optimization problem with extensive applications for manufacturing and production scheduling. It involves assigning jobs to various machines to optimize criteria, such as minimizing total completion time. Current learning-based methods in this domain often rely on localized feature extraction models, limiting their capacity to capture overarching dependencies spanning operations and machines. This paper introduces an innovative architecture that harnesses Mamba, a state-space model with linear computational complexity, to facilitate comprehensive sequence modeling tailored for FJSP. In contrast to prevalent graph-attention-based frameworks that are computationally intensive for FJSP, we show our model is more efficient. Specifically, the proposed model possesses an encoder and a decoder. The encoder incorporates a dual Mamba block to extract operation and machine features separately. Additionally, we introduce an efficient cross-attention decoder to learn interactive embeddings of operations and machines. Our experimental results demonstrate that our method achieves faster solving speed and surpasses the performance of state-of-the-art learning-based methods for FJSP across various benchmarks.
- Abstract(参考訳): フレキシブルジョブショップ問題(英語: Flexible Job Shop Problem, FJSP)は、製造と生産のスケジューリングに広く応用された、よく研究された組合せ最適化問題である。
ジョブをさまざまなマシンに割り当てて、総完了時間の最小化など、基準を最適化する。
この領域の現在の学習ベースのメソッドは、しばしば局所的な特徴抽出モデルに依存し、オペレーションやマシンにまたがる包括的な依存関係をキャプチャする能力を制限する。
本稿では,FJSPに適した包括的シーケンスモデリングを容易にするために,線形計算複雑性を持つ状態空間モデルMambaを利用する革新的なアーキテクチャを提案する。
FJSPに対して計算集約的なグラフアテンションベースのフレームワークとは対照的に、我々のモデルはより効率的であることを示す。
具体的には、提案モデルにはエンコーダとデコーダがある。
エンコーダにはデュアルマンバブロックが組み込まれており、操作と機械の特徴を別々に抽出する。
さらに,操作や機械のインタラクティブな埋め込みを学習するための効率的なクロスアテンションデコーダも導入する。
実験の結果,本手法は高速な解法を実現するとともに,FJSPの最先端学習手法の性能を様々なベンチマークで上回っていることがわかった。
関連論文リスト
- Flexible Manufacturing Systems Intralogistics: Dynamic Optimization of AGVs and Tool Sharing Using Coloured-Timed Petri Nets and Actor-Critic RL with Actions Masking [0.0]
本稿では,自動誘導車両(AGV)とツール共有システムの同時統合により,新たな複雑さを取り入れた従来型のジョブショップスケジューリング問題を推し進める。
色付き時間ペトリネット(CTPN)とアクター批判モデルに基づく強化学習(MBRL)を組み合わせた新しいアプローチを提案する。
提案手法は,小規模の公開ベンチマークと,Tallardベンチマークにインスパイアされた大規模ベンチマークを用いて評価した。
論文 参考訳(メタデータ) (2026-01-08T12:37:02Z) - Efficient LLM Collaboration via Planning [56.081879390960204]
小規模で大規模なモデルでは、プランナーと実行担当者として交代で行動し、タスクを協調的に解決するために、多段階のカスケードでプランを交換する。
私たちはCOPEが大規模プロプライエタリモデルに匹敵するパフォーマンスを実現し,推論APIのコストを大幅に削減できることを実証した。
論文 参考訳(メタデータ) (2025-06-13T08:35:50Z) - Investigating the Monte-Carlo Tree Search Approach for the Job Shop Scheduling Problem [1.9171404264679484]
ジョブショップスケジューリング問題(JSSP、Job Shop Scheduling Problem)は製造業における最適化問題であり、目的は、与えられた目的を最小化するために、異なるマシンにわたるジョブの最適なシーケンスを決定することである。
重み付き強化学習技術であるモンテカルロ木探索 (MCTS) の大規模JSSP, 特に循環障害の解決の可能性について検討する。
MCTSアルゴリズムのJSSPをモデル化するためのマルコフ決定過程 (MDP) の定式化を提案する。
さらに我々は,大規模で非矩形なインスタンスの複雑さをしばしばキャプチャする,実生産データから得られた新しい合成ベンチマークを導入する。
論文 参考訳(メタデータ) (2025-01-29T20:55:53Z) - Flexible Job Shop Scheduling via Dual Attention Network Based
Reinforcement Learning [73.19312285906891]
フレキシブルなジョブショップスケジューリング問題(FJSP)では、複数のマシンで操作を処理でき、操作とマシンの間の複雑な関係が生じる。
近年, 深層強化学習(DRL)を用いて, FJSP解決のための優先派遣規則(PDR)を学習している。
本稿では,Deep機能抽出のための自己注意モデルと,スケーラブルな意思決定のためのDRLの利点を生かした,エンドツーエンド学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-09T01:35:48Z) - Partitioning Distributed Compute Jobs with Reinforcement Learning and
Graph Neural Networks [58.720142291102135]
大規模な機械学習モデルは、幅広い分野に進歩をもたらしている。
これらのモデルの多くは、単一のマシンでトレーニングするには大きすぎるため、複数のデバイスに分散する必要がある。
スループットやブロッキングレートといったユーザクリティカルな指標に対して,並列化の最大化が準最適であることを示す。
論文 参考訳(メタデータ) (2023-01-31T17:41:07Z) - Unifying Synergies between Self-supervised Learning and Dynamic
Computation [53.66628188936682]
SSLとDCのパラダイム間の相互作用に関する新しい視点を提示する。
SSL設定において、スクラッチから高密度かつゲートされたサブネットワークを同時に学習することは可能であることを示す。
密集エンコーダとゲートエンコーダの事前学習における共進化は、良好な精度と効率のトレードオフをもたらす。
論文 参考訳(メタデータ) (2023-01-22T17:12:58Z) - A Learned Performance Model for Tensor Processing Units [5.733911161090224]
本稿では,処理ユニット(TPU)インスタンス用のグラフプログラムのコーパスから,パフォーマンスモデルを学習する方法を示す。
学習したモデルでは,2つのタスクにおいて,高度に最適化された分析性能モデルよりも優れていることを示す。
オートチューニングは、TPUへのアクセスが制限されたり、高価な設定で、より高速なプログラムを見つけるのに役立つ。
論文 参考訳(メタデータ) (2020-08-03T17:24:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。