論文の概要: Neural Combinatorial Optimization for Stochastic Flexible Job Shop Scheduling Problems
- arxiv url: http://arxiv.org/abs/2412.14052v1
- Date: Wed, 18 Dec 2024 17:05:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-19 16:48:32.354141
- Title: Neural Combinatorial Optimization for Stochastic Flexible Job Shop Scheduling Problems
- Title(参考訳): 確率的フレキシブルジョブショップスケジューリング問題のニューラルネットワークによる最適化
- Authors: Igor G. Smit, Yaoxin Wu, Pavel Troubil, Yingqian Zhang, Wim P. M. Nuijten,
- Abstract要約: シナリオ解決のための NCO メソッドを拡張するための,新しいアテンションベースシナリオ処理モジュール (SPM) を提案する。
提案手法では,サンプルシナリオの埋め込みをキャプチャするアテンション機構により,近似情報を明示的に組み込む。
提案手法は, フレキシブルな問題に対して, 既存の学習方法や非学習手法よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 5.10888539576355
- License:
- Abstract: Neural combinatorial optimization (NCO) has gained significant attention due to the potential of deep learning to efficiently solve combinatorial optimization problems. NCO has been widely applied to job shop scheduling problems (JSPs) with the current focus predominantly on deterministic problems. In this paper, we propose a novel attention-based scenario processing module (SPM) to extend NCO methods for solving stochastic JSPs. Our approach explicitly incorporates stochastic information by an attention mechanism that captures the embedding of sampled scenarios (i.e., an approximation of stochasticity). Fed with the embedding, the base neural network is intervened by the attended scenarios, which accordingly learns an effective policy under stochasticity. We also propose a training paradigm that works harmoniously with either the expected makespan or Value-at-Risk objective. Results demonstrate that our approach outperforms existing learning and non-learning methods for the flexible JSP problem with stochastic processing times on a variety of instances. In addition, our approach holds significant generalizability to varied numbers of scenarios and disparate distributions.
- Abstract(参考訳): ニューラル組合せ最適化(NCO)は、組合せ最適化問題を効率的に解く深層学習の可能性から注目されている。
NCOは、主に決定論的問題に焦点を当てたジョブショップスケジューリング問題(JSP)に広く適用されてきた。
本稿では,確率的JSPを解くための NCO 手法を拡張するための,新しいアテンションベースシナリオ処理モジュール (SPM) を提案する。
提案手法は, サンプルシナリオの埋め込み(すなわち確率性近似)をキャプチャするアテンション機構によって, 確率情報を明示的に組み込む。
埋め込みによって、ベースニューラルネットワークは参加するシナリオによって介入され、それに従って確率性の下で効果的なポリシーを学ぶ。
また、期待されるメイスパンやバリュー・アット・リスクの目標と調和して機能するトレーニングパラダイムを提案する。
提案手法は,様々なインスタンスにおける確率的処理時間による柔軟なJSP問題に対して,既存の学習法や非学習法よりも優れていることを示す。
さらに,本手法は,様々なシナリオと異なる分布に対して有意な一般化性を有する。
関連論文リスト
- An Expectation-Maximization Algorithm-based Autoregressive Model for the Fuzzy Job Shop Scheduling Problem [12.862865254507177]
ファジィジョブショップスケジューリング問題(FJSSP)は、ジョブショップスケジューリング問題(JSSP)の革新的な拡張として現れる。
本稿では,FJSSPの分解能に対してファジィ情報を同化処理するニューラルネットワークの実現可能性について検討する。
論文 参考訳(メタデータ) (2025-01-11T10:20:16Z) - Optimization by Parallel Quasi-Quantum Annealing with Gradient-Based Sampling [0.0]
本研究では、連続緩和による勾配に基づく更新と準量子アナリング(QQA)を組み合わせた別のアプローチを提案する。
数値実験により,本手法はiSCOと学習型解法に匹敵する性能を有する汎用解法であることが示された。
論文 参考訳(メタデータ) (2024-09-02T12:55:27Z) - Stochastic Q-learning for Large Discrete Action Spaces [79.1700188160944]
離散的な行動空間を持つ複雑な環境では、強化学習(RL)において効果的な意思決定が重要である
我々は、$n$アクションの集合全体を最適化するのとは対照的に、おそらく$mathcalO(log(n)$)$のような変数の集合のみを考える。
提示された値ベースのRL手法には、Q-learning、StochDQN、StochDDQNなどが含まれる。
論文 参考訳(メタデータ) (2024-05-16T17:58:44Z) - Pointer Networks with Q-Learning for Combinatorial Optimization [55.2480439325792]
我々は、モデルフリーQ値ポリシー近似をPointer Networks(Ptr-Nets)と統合したハイブリッドニューラルネットワークであるPointer Q-Network(PQN)を紹介する。
実験により,本手法の有効性を実証し,不安定な環境でモデルをテストする。
論文 参考訳(メタデータ) (2023-11-05T12:03:58Z) - Stochastic Unrolled Federated Learning [85.6993263983062]
本稿では,UnRolled Federated Learning (SURF)を導入する。
提案手法は,この拡張における2つの課題,すなわち,非学習者へのデータセット全体の供給の必要性と,フェデレート学習の分散的性質に対処する。
論文 参考訳(メタデータ) (2023-05-24T17:26:22Z) - Fast Approximations for Job Shop Scheduling: A Lagrangian Dual Deep
Learning Method [44.4747903763245]
ジョブショップスケジューリング問題(Jobs shop Scheduling Problem、JSP)は、様々な産業目的のために日常的に解決される標準最適化問題である。
問題はNPハードであり、中規模のインスタンスでも計算が困難である。
本稿では,問題に対する効率的かつ正確な近似を提供するためのディープラーニングアプローチについて検討する。
論文 参考訳(メタデータ) (2021-10-12T21:15:19Z) - Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。
我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。
コア最適化問題の実用的なパラメトリゼーションを提供する。
論文 参考訳(メタデータ) (2021-07-08T18:01:02Z) - Decentralized Personalized Federated Learning for Min-Max Problems [79.61785798152529]
本稿では,より広い範囲の最適化問題を含むサドル点問題に対して,PFLを初めて検討した。
この問題に対処するための新しいアルゴリズムを提案し、滑らかな(強く)凸-(強く)凹点問題を理論的に解析する。
両線形問題に対する数値実験と, 対向雑音を有するニューラルネットワークは, 提案手法の有効性を実証する。
論文 参考訳(メタデータ) (2021-06-14T10:36:25Z) - Constrained Combinatorial Optimization with Reinforcement Learning [0.30938904602244344]
本稿では,RL(Deep Reinforcement Learning)を用いた制約付き最適化問題に対処する枠組みを提案する。
我々は、その定式化における制約に対処するために、Neural Combinatorial Optimization(NCO)理論を拡張した。
その文脈では、ソリューションは環境との相互作用に基づいて反復的に構築されます。
論文 参考訳(メタデータ) (2020-06-22T03:13:07Z) - Decentralized MCTS via Learned Teammate Models [89.24858306636816]
本稿では,モンテカルロ木探索に基づくトレーニング可能なオンライン分散計画アルゴリズムを提案する。
深層学習と畳み込みニューラルネットワークを用いて正確なポリシー近似を作成可能であることを示す。
論文 参考訳(メタデータ) (2020-03-19T13:10:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。