Fugu-MT 論文翻訳(概要): Mamba Meets Scheduling: Learning to Solve Flexible Job Shop Scheduling with Efficient Sequence Modeling

論文の概要: Mamba Meets Scheduling: Learning to Solve Flexible Job Shop Scheduling with Efficient Sequence Modeling

arxiv url: http://arxiv.org/abs/2602.21546v1
Date: Wed, 25 Feb 2026 04:04:25 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-26 18:19:16.69595
Title: Mamba Meets Scheduling: Learning to Solve Flexible Job Shop Scheduling with Efficient Sequence Modeling
Title（参考訳）: Mamba氏がスケジューリングについて語る - 効率的なシーケンスモデリングによるフレキシブルなジョブショップスケジューリングの学習
Authors: Zhi Cao, Cong Zhang, Yaoxin Wu, Yaqing Hou, Hongwei Ge,
Abstract要約: 本稿では、線形計算複雑性を持つ状態空間モデルであるMambaを利用して、フレキシブルジョブショップ問題(FJSP)に適したシーケンスモデリングを容易にする革新的なアーキテクチャを提案する。実験の結果,本手法は高速な解法を実現するとともに,FJSPの最先端学習手法の性能を様々なベンチマークで上回っていることがわかった。
参考スコア（独自算出の注目度）: 31.01398494542866
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The Flexible Job Shop Problem (FJSP) is a well-studied combinatorial optimization problem with extensive applications for manufacturing and production scheduling. It involves assigning jobs to various machines to optimize criteria, such as minimizing total completion time. Current learning-based methods in this domain often rely on localized feature extraction models, limiting their capacity to capture overarching dependencies spanning operations and machines. This paper introduces an innovative architecture that harnesses Mamba, a state-space model with linear computational complexity, to facilitate comprehensive sequence modeling tailored for FJSP. In contrast to prevalent graph-attention-based frameworks that are computationally intensive for FJSP, we show our model is more efficient. Specifically, the proposed model possesses an encoder and a decoder. The encoder incorporates a dual Mamba block to extract operation and machine features separately. Additionally, we introduce an efficient cross-attention decoder to learn interactive embeddings of operations and machines. Our experimental results demonstrate that our method achieves faster solving speed and surpasses the performance of state-of-the-art learning-based methods for FJSP across various benchmarks.
Abstract（参考訳）: フレキシブルジョブショップ問題(英語: Flexible Job Shop Problem, FJSP)は、製造と生産のスケジューリングに広く応用された、よく研究された組合せ最適化問題である。ジョブをさまざまなマシンに割り当てて、総完了時間の最小化など、基準を最適化する。この領域の現在の学習ベースのメソッドは、しばしば局所的な特徴抽出モデルに依存し、オペレーションやマシンにまたがる包括的な依存関係をキャプチャする能力を制限する。本稿では,FJSPに適した包括的シーケンスモデリングを容易にするために,線形計算複雑性を持つ状態空間モデルMambaを利用する革新的なアーキテクチャを提案する。 FJSPに対して計算集約的なグラフアテンションベースのフレームワークとは対照的に、我々のモデルはより効率的であることを示す。具体的には、提案モデルにはエンコーダとデコーダがある。エンコーダにはデュアルマンバブロックが組み込まれており、操作と機械の特徴を別々に抽出する。さらに,操作や機械のインタラクティブな埋め込みを学習するための効率的なクロスアテンションデコーダも導入する。実験の結果,本手法は高速な解法を実現するとともに,FJSPの最先端学習手法の性能を様々なベンチマークで上回っていることがわかった。

関連論文リスト

Flexible Manufacturing Systems Intralogistics: Dynamic Optimization of AGVs and Tool Sharing Using Coloured-Timed Petri Nets and Actor-Critic RL with Actions Masking [0.0]
本稿では,自動誘導車両(AGV)とツール共有システムの同時統合により,新たな複雑さを取り入れた従来型のジョブショップスケジューリング問題を推し進める。色付き時間ペトリネット(CTPN)とアクター批判モデルに基づく強化学習(MBRL)を組み合わせた新しいアプローチを提案する。提案手法は,小規模の公開ベンチマークと,Tallardベンチマークにインスパイアされた大規模ベンチマークを用いて評価した。
論文参考訳（メタデータ） (2026-01-08T12:37:02Z)
Efficient LLM Collaboration via Planning [56.081879390960204]
小規模で大規模なモデルでは、プランナーと実行担当者として交代で行動し、タスクを協調的に解決するために、多段階のカスケードでプランを交換する。私たちはCOPEが大規模プロプライエタリモデルに匹敵するパフォーマンスを実現し,推論APIのコストを大幅に削減できることを実証した。
論文参考訳（メタデータ） (2025-06-13T08:35:50Z)
Scaling Laws for Native Multimodal Models [53.490942903659565]
我々は、ネイティブマルチモーダルモデルのアーキテクチャ設計を再考し、広範なスケーリング法の研究を行う。我々の調査では、早期核融合アーキテクチャよりも後期核融合アーキテクチャに固有の利点は示されていない。モデルにMixture of Experts(MoEs)を組み込むことで、モデルがモダリティ固有の重みを学習し、性能を著しく向上できることを示す。
論文参考訳（メタデータ） (2025-04-10T17:57:28Z)
Investigating the Monte-Carlo Tree Search Approach for the Job Shop Scheduling Problem [1.9171404264679484]
ジョブショップスケジューリング問題(JSSP、Job Shop Scheduling Problem)は製造業における最適化問題であり、目的は、与えられた目的を最小化するために、異なるマシンにわたるジョブの最適なシーケンスを決定することである。重み付き強化学習技術であるモンテカルロ木探索 (MCTS) の大規模JSSP, 特に循環障害の解決の可能性について検討する。 MCTSアルゴリズムのJSSPをモデル化するためのマルコフ決定過程 (MDP) の定式化を提案する。さらに我々は,大規模で非矩形なインスタンスの複雑さをしばしばキャプチャする,実生産データから得られた新しい合成ベンチマークを導入する。
論文参考訳（メタデータ） (2025-01-29T20:55:53Z)
Efficient Multi-agent Reinforcement Learning by Planning [33.51282615335009]
マルチエージェント強化学習(MARL)アルゴリズムは、大規模意思決定タスクの解決において、目覚ましいブレークスルーを達成している。既存のMARLアルゴリズムの多くはモデルフリーであり、サンプル効率を制限し、より困難なシナリオでの適用を妨げている。政策探索のための集中型モデルとモンテカルロ木探索(MCTS)を組み合わせたMAZeroアルゴリズムを提案する。
論文参考訳（メタデータ） (2024-05-20T04:36:02Z)
Flexible Job Shop Scheduling via Dual Attention Network Based Reinforcement Learning [73.19312285906891]
フレキシブルなジョブショップスケジューリング問題(FJSP)では、複数のマシンで操作を処理でき、操作とマシンの間の複雑な関係が生じる。近年, 深層強化学習(DRL)を用いて, FJSP解決のための優先派遣規則(PDR)を学習している。本稿では,Deep機能抽出のための自己注意モデルと,スケーラブルな意思決定のためのDRLの利点を生かした,エンドツーエンド学習フレームワークを提案する。
論文参考訳（メタデータ） (2023-05-09T01:35:48Z)
Partitioning Distributed Compute Jobs with Reinforcement Learning and Graph Neural Networks [58.720142291102135]
大規模な機械学習モデルは、幅広い分野に進歩をもたらしている。これらのモデルの多くは、単一のマシンでトレーニングするには大きすぎるため、複数のデバイスに分散する必要がある。スループットやブロッキングレートといったユーザクリティカルな指標に対して,並列化の最大化が準最適であることを示す。
論文参考訳（メタデータ） (2023-01-31T17:41:07Z)
Unifying Synergies between Self-supervised Learning and Dynamic Computation [53.66628188936682]
SSLとDCのパラダイム間の相互作用に関する新しい視点を提示する。 SSL設定において、スクラッチから高密度かつゲートされたサブネットワークを同時に学習することは可能であることを示す。密集エンコーダとゲートエンコーダの事前学習における共進化は、良好な精度と効率のトレードオフをもたらす。
論文参考訳（メタデータ） (2023-01-22T17:12:58Z)
Learning Discrete Energy-based Models via Auxiliary-variable Local Exploration [130.89746032163106]
離散構造データに対する条件付きおよび非条件付きEMMを学習するための新しいアルゴリズムであるALOEを提案する。エネルギー関数とサンプリング器は、新しい変分型電力繰り返しにより効率よく訓練できることを示す。本稿では、ソフトウェアテストのためのエネルギーモデルガイド付ファジィザについて、libfuzzerのようなよく設計されたファジィエンジンに匹敵する性能を実現する。
論文参考訳（メタデータ） (2020-11-10T19:31:29Z)
A Learned Performance Model for Tensor Processing Units [5.733911161090224]
本稿では,処理ユニット(TPU)インスタンス用のグラフプログラムのコーパスから,パフォーマンスモデルを学習する方法を示す。学習したモデルでは,2つのタスクにおいて,高度に最適化された分析性能モデルよりも優れていることを示す。オートチューニングは、TPUへのアクセスが制限されたり、高価な設定で、より高速なプログラムを見つけるのに役立つ。
論文参考訳（メタデータ） (2020-08-03T17:24:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。