Fugu-MT 論文翻訳(概要): A Memetic Algorithm with Reinforcement Learning for Sociotechnical Production Scheduling

論文の概要: A Memetic Algorithm with Reinforcement Learning for Sociotechnical Production Scheduling

arxiv url: http://arxiv.org/abs/2212.10936v1
Date: Wed, 21 Dec 2022 11:24:32 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-22 14:00:28.521101
Title: A Memetic Algorithm with Reinforcement Learning for Sociotechnical Production Scheduling
Title（参考訳）: 社会工学的生産スケジューリングのための強化学習を用いたメメティックアルゴリズム
Authors: Felix Grumbach, Nour Eldin Alaa Badr, Pascal Reusch and Sebastian Trojahn
Abstract要約: 本稿では,現実指向型2資源制約型フレキシブルジョブショップスケジューリング問題(DRC-FJSSP)の解法として,深層強化学習(DRL)を適用したメメティックアルゴリズムを提案する。まず,先述の実用要件によって誘導される拡張DRC-FJSSPを定式化する。次に,並列計算によるマルチクリータ最適化のためのハイブリッドフレームワークを提案する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The following article presents a memetic algorithm with applying deep reinforcement learning (DRL) for solving practically oriented dual resource constrained flexible job shop scheduling problems (DRC-FJSSP). In recent years, there has been extensive research on DRL techniques, but without considering realistic, flexible and human-centered shopfloors. A research gap can be identified in the context of make-to-order oriented discontinuous manufacturing as it is often represented in medium-size companies with high service levels. From practical industry projects in this domain, we recognize requirements to depict flexible machines, human workers and capabilities, setup and processing operations, material arrival times, complex job paths with parallel tasks for bill of material (BOM) manufacturing, sequence-depended setup times and (partially) automated tasks. On the other hand, intensive research has been done on metaheuristics in the context of DRC-FJSSP. However, there is a lack of suitable and generic scheduling methods that can be holistically applied in sociotechnical production and assembly processes. In this paper, we first formulate an extended DRC-FJSSP induced by the practical requirements mentioned. Then we present our proposed hybrid framework with parallel computing for multicriteria optimization. Through numerical experiments with real-world data, we confirm that the framework generates feasible schedules efficiently and reliably. Utilizing DRL instead of random operations leads to better results and outperforms traditional approaches.
Abstract（参考訳）: 本稿では,drc-fjssp (drc-fjssp) を用いた二元資源制約型フレキシブルジョブショップスケジューリング問題を解くための深層強化学習(drl)手法を提案する。近年、DRL技術の研究が盛んに行われているが、現実的で柔軟で人間中心のショップフロアは検討されていない。サービス水準の高い中規模企業でよく見られるように、製造・発注指向の不連続製造の文脈で研究ギャップが特定できる。この領域の実践的な産業プロジェクトから、フレキシブルマシン、ヒューマンワーカーと能力、セットアップと処理、材料到着時間、材料請求書製造(BOM)の並列タスク、シーケンス依存のセットアップ時間および(一部)自動化タスクの複雑なジョブパスを記述するための要件を認識します。一方、DRC-FJSSPの文脈におけるメタヒューリスティックスの研究は集中的に行われている。しかし、社会工学的な生産プロセスや組み立てプロセスに適用可能な、適度で汎用的なスケジューリング方法が欠如している。本稿では,先述の実用要件によって誘導される拡張DRC-FJSSPを最初に定式化する。次に,並列計算によるマルチクリータ最適化のためのハイブリッドフレームワークを提案する。実世界のデータを用いた数値実験により,本フレームワークが効率的にかつ確実なスケジュールを生成することを確認した。ランダムな操作の代わりにDRLを使用すると、より良い結果が得られ、従来のアプローチより優れている。

関連論文リスト

Discovering Heuristics with Large Language Models (LLMs) for Mixed-Integer Programs: Single-Machine Scheduling [15.936380178807712]
EDD Challenger (EDDC) と MDD Challenger (MDDC) という2つの新しい LLM-covered を開発した。我々は,プリエンプションや処理時間,期限を指定せずにnジョブを単一プロセッサにシークエンシングすることで,トータルタドルネスを最小化することを目的とした,シングルマシントータルタドルネス(SMTT)問題に着目する。
論文参考訳（メタデータ） (2025-10-28T02:43:04Z)
Optimizing Fairness in Production Planning: A Human-Centric Approach to Machine and Workforce Allocation [55.71151342699622]
提案システムは,自動車業界のドメインエキスパートによる16のテストセッションを通じて検証される。その結果,CPをベースとしたスケジューリング手法は,信頼性の低いコンパクトで実現可能な生産計画を生成することが示唆された。
論文参考訳（メタデータ） (2025-10-01T16:41:18Z)
Novel Multi-Agent Action Masked Deep Reinforcement Learning for General Industrial Assembly Lines Balancing Problems [1.8434042562191815]
本稿では,マルコフ決定過程 (MDP) として定式化された汎用産業組立ラインの数学的モデルを提案する。提案モデルは,タスクとリソーススケジューリングを最適化するために,深層強化学習(DRL)エージェントを訓練するための仮想環境を構築するために使用される。
論文参考訳（メタデータ） (2025-07-22T14:34:36Z)
A Production Scheduling Framework for Reinforcement Learning Under Real-World Constraints [0.0]
実世界の運用環境は、従来のスケジューリングアプローチの効率を低下させる追加の複雑さを導入します。強化学習(RL)は、エージェントが適応的なスケジューリング戦略を学習できるようにするため、これらの課題に対処する可能性を秘めている。本稿では,従来のJSSPの定式化を,主要な実世界の制約を組み込むことで拡張するモジュラーフレームワークを提案する。 JobShopLabは、研究開発と産業アプリケーションの両方のためのオープンソースのツールだ。
論文参考訳（メタデータ） (2025-06-16T14:50:26Z)
Decentralized Distributed Proximal Policy Optimization (DD-PPO) for High Performance Computing Scheduling on Multi-User Systems [45.62643537023675]
本研究では,分散型分散プロキシポリシー最適化(DD-PPO)アルゴリズムを用いた新しいRLベースのスケジューラを提案する。 DD-PPOアルゴリズムは、各ステップでパラメータ同期を必要とせずに、複数のワーカーにまたがる大規模な分散トレーニングをサポートする。検証データセットは、1150万以上の実際のHPCジョブトレースを利用して、DD-PPOのパフォーマンスを従来のスケジューリング手法と高度なスケジューリング手法と比較した。
論文参考訳（メタデータ） (2025-05-06T19:50:37Z)
Collab: Controlled Decoding using Mixture of Agents for LLM Alignment [90.6117569025754]
人間のフィードバックからの強化学習は、大規模言語モデルを整合させる効果的な手法として現れてきた。制御された復号化は、再訓練せずに推論時にモデルを整列するメカニズムを提供する。本稿では,既存の既成のLCMポリシを活用するエージェントベースのデコーディング戦略の混合を提案する。
論文参考訳（メタデータ） (2025-03-27T17:34:25Z)
Prediction-Assisted Online Distributed Deep Learning Workload Scheduling in GPU Clusters [24.845122459974466]
本稿では,A-SRPT(Adaptive Shortest-Remaining-Time-first)スケジューリングアルゴリズムを提案する。ヘテロジニアスディープニューラルネットワーク(DNN)モデルに対応するグラフとして各ジョブをモデル化することにより、A-SRPTはジョブを利用可能なGPUに戦略的に割り当てる。 A-SRPTは複雑なスケジューリング問題を単一マシンのインスタンスにマッピングし、プリエンプティブな "shortest-remaining-processing-time-first" 戦略によって最適に対処する。
論文参考訳（メタデータ） (2025-01-09T20:19:01Z)
Learning-enabled Flexible Job-shop Scheduling for Scalable Smart Manufacturing [11.509669981978874]
スマートマニュファクチャリングシステムでは、生産性を最大化するためのソリューションを最適化するために、輸送制約付きフレキシブルなジョブショップスケジューリングが不可欠である。近年, 深部強化学習(DRL)に基づくFJSPT法の開発が, 大規模一般化の課題に直面している。 Heterogeneous Graph Scheduler (HGS) と呼ばれる新しいグラフベースのDRL法を導入する。
論文参考訳（メタデータ） (2024-02-14T06:49:23Z)
Deep reinforcement learning for machine scheduling: Methodology, the state-of-the-art, and future directions [2.4541568670428915]
マシンスケジューリングは、製造ルールとジョブ仕様に準拠しながら、マシンへのジョブ割り当てを最適化することを目的としている。人工知能の重要な構成要素であるDeep Reinforcement Learning (DRL)は、ゲームやロボティクスなど、さまざまな分野において有望であることを示している。本稿では、DRLに基づくアプローチの総合的なレビューと比較を行い、その方法論、応用、利点、限界を明らかにする。
論文参考訳（メタデータ） (2023-10-04T22:45:09Z)
Accelerating Exact Combinatorial Optimization via RL-based Initialization -- A Case Study in Scheduling [1.3053649021965603]
本研究の目的は、最適化問題に対処する機械学習(ML)を用いた革新的なアプローチを開発することである。 1) 粗粒スケジューラとしての解法, 2) 解緩和, 3) ILPによる正確な解法の3つのステップを含む新しい2段階のRL-to-ILPスケジューリングフレームワークを導入する。提案フレームワークは, 正確なスケジューリング手法と比較して, 最大128ドルの高速化を実現しつつ, 同一のスケジューリング性能を示す。
論文参考訳（メタデータ） (2023-08-19T15:52:43Z)
Maximize to Explore: One Objective Function Fusing Estimation, Planning, and Exploration [87.53543137162488]
我々はtextttMEX というオンライン強化学習(オンラインRL)フレームワークを提案する。 textttMEXは、自動的に探索エクスプロイトのバランスをとりながら、見積もりと計画コンポーネントを統合する。様々な MuJoCo 環境では,ベースラインを安定的なマージンで上回り,十分な報酬を得られる。
論文参考訳（メタデータ） (2023-05-29T17:25:26Z)
Flexible Job Shop Scheduling via Dual Attention Network Based Reinforcement Learning [73.19312285906891]
フレキシブルなジョブショップスケジューリング問題(FJSP)では、複数のマシンで操作を処理でき、操作とマシンの間の複雑な関係が生じる。近年, 深層強化学習(DRL)を用いて, FJSP解決のための優先派遣規則(PDR)を学習している。本稿では,Deep機能抽出のための自己注意モデルと,スケーラブルな意思決定のためのDRLの利点を生かした,エンドツーエンド学習フレームワークを提案する。
論文参考訳（メタデータ） (2023-05-09T01:35:48Z)
MARLIN: Soft Actor-Critic based Reinforcement Learning for Congestion Control in Real Networks [63.24965775030673]
そこで本研究では,汎用的な渋滞制御(CC)アルゴリズムを設計するための新しい強化学習(RL)手法を提案する。我々の解であるMARLINは、Soft Actor-Criticアルゴリズムを用いてエントロピーとリターンの両方を最大化する。我々は,MARLINを実ネットワーク上で訓練し,実ミスマッチを克服した。
論文参考訳（メタデータ） (2023-02-02T18:27:20Z)
Partitioning Distributed Compute Jobs with Reinforcement Learning and Graph Neural Networks [58.720142291102135]
大規模な機械学習モデルは、幅広い分野に進歩をもたらしている。これらのモデルの多くは、単一のマシンでトレーニングするには大きすぎるため、複数のデバイスに分散する必要がある。スループットやブロッキングレートといったユーザクリティカルな指標に対して,並列化の最大化が準最適であることを示す。
論文参考訳（メタデータ） (2023-01-31T17:41:07Z)
Towards Standardizing Reinforcement Learning Approaches for Stochastic Production Scheduling [77.34726150561087]
強化学習はスケジューリングの問題を解決するのに使える。既存の研究は、コードが利用できない複雑なシミュレーションに依存している。から選ぶべきRLの設計の広大な配列があります。モデル記述の標準化 - 生産セットアップとRL設計の両方 - と検証スキームは前提条件です。
論文参考訳（メタデータ） (2021-04-16T16:07:10Z)
A Reinforcement Learning Environment For Job-Shop Scheduling [2.036811219647753]
本稿では,ジョブショップスケジューリングのための高効率深層強化学習環境を提案する。我々は、有意義でコンパクトな状態表現と、新しい単純な密集した報酬関数を設計する。本手法が従来のベンチマークインスタンスにおける既存のDRLメソッドを大幅に上回ることを実証した。
論文参考訳（メタデータ） (2021-04-08T13:26:30Z)
A Two-stage Framework and Reinforcement Learning-based Optimization Algorithms for Complex Scheduling Problems [54.61091936472494]
本稿では、強化学習(RL)と従来の運用研究(OR)アルゴリズムを組み合わせた2段階のフレームワークを開発する。スケジューリング問題は,有限マルコフ決定過程 (MDP) と混合整数計画過程 (mixed-integer programming process) の2段階で解決される。その結果,本アルゴリズムは,アジャイルな地球観測衛星スケジューリング問題に対して,安定かつ効率的に十分なスケジューリング計画を得ることができた。
論文参考訳（メタデータ） (2021-03-10T03:16:12Z)
Geometric Deep Reinforcement Learning for Dynamic DAG Scheduling [8.14784681248878]
本稿では,現実的なスケジューリング問題を解決するための強化学習手法を提案する。高性能コンピューティングコミュニティにおいて一般的に実行されるアルゴリズムであるColesky Factorizationに適用する。我々のアルゴリズムは,アクター・クリティカル・アルゴリズム (A2C) と組み合わせてグラフニューラルネットワークを用いて,問題の適応表現をオンザフライで構築する。
論文参考訳（メタデータ） (2020-11-09T10:57:21Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。