論文の概要: An Analysis of the Coordination Gap between Joint and Modular Learning for Job Shop Scheduling with Transportation Resources
- arxiv url: http://arxiv.org/abs/2604.24117v1
- Date: Mon, 27 Apr 2026 07:12:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.783449
- Title: An Analysis of the Coordination Gap between Joint and Modular Learning for Job Shop Scheduling with Transportation Resources
- Title(参考訳): 交通資源を考慮したジョブショップスケジューリングにおける共同学習とモジュール学習の協調ギャップの分析
- Authors: Moritz Link, Jonathan Hoss, Noah Klarmann,
- Abstract要約: 輸送資源による効率的なジョブショップスケジューリングは、高性能製造に不可欠である。
共同訓練は、仕事と自動誘導車両スケジューリングエージェントの同時訓練を意味する。
モジュールトレーニングは、個別に各エージェントをトレーニングし、その後にポストホック統合を行う。
- 参考スコア(独自算出の注目度): 0.1274452325287335
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Efficient job-shop scheduling with transportation resources is critical for high-performance manufacturing. With the rise of "decentralized factories", multi-agent reinforcement learning has emerged as a promising approach for the combined scheduling of production and transportation tasks. Prior work has largely focused on developing novel cooperative architectures while overlooking the question of when joint training is necessary. Joint training denotes the simultaneous training of job and automatic guided vehicle scheduling agents, whereas modular training involves independently training each agent followed by post-hoc integration. In this study, we systematically investigate the conditions under which joint training is essential for optimal performance in the job-shop scheduling problem with transportation resources. Through a rigorous sensitivity analysis of resource scarcity and temporal dominance, we quantify the coordination gap -- the performance difference between these two training modalities. In our evaluation, the joint training can produce superior performance compared to the best-performing combinations of dispatching rules and modular training. However, the coordination gap advantage diminishes in bottleneck environments, particularly under severe transport and processing constraints. These findings indicate that modular training represents a viable alternative in environments where a single scheduling task dominates. Overall, our work provides practical guidance for selecting between training modalities based on environmental conditions, enabling decision-makers to optimize reinforcement learning-based scheduling performance.
- Abstract(参考訳): 輸送資源による効率的なジョブショップスケジューリングは、高性能製造に不可欠である。
分散化工場」の興隆に伴い、多エージェント強化学習が生産と輸送の複合的なスケジューリングのための有望なアプローチとして浮上してきた。
以前の研究は、共同トレーニングがいつ必要かという疑問を乗り越えながら、新しい協調型アーキテクチャの開発に重点を置いてきた。
共同訓練は仕事と自動誘導車両スケジューリングエージェントの同時訓練を表すが、モジュールトレーニングは各エージェントを独立して訓練し、その後にポストホック統合を行う。
本研究では,交通資源を用いたジョブショップスケジューリング問題において,共同訓練が最適性能に欠かせない条件を体系的に検討する。
資源不足と時間的優位性の厳密な感度分析を通じて、これらの2つのトレーニングモダリティのパフォーマンス差である調整ギャップを定量化する。
本評価では, 連立学習は, ディスパッチルールとモジュールトレーニングの最良の組み合わせに比べ, 優れた性能が得られる。
しかし、コーディネーションギャップの優位性は、特に厳しい輸送と処理の制約の下で、ボトルネック環境において低下する。
これらの結果から,1つのスケジューリングタスクが支配的な環境では,モジュラトレーニングが有効な代替手段であることが示唆された。
本研究は,環境条件に基づく学習モダリティの選択のための実践的ガイダンスを提供し,意思決定者が強化学習に基づくスケジューリング性能を最適化することを可能にする。
関連論文リスト
- Reinforcement Learning-Augmented LLM Agents for Collaborative Decision Making and Performance Optimization [4.657699842837075]
大きな言語モデル(LLM)は言語タスクではうまく機能するが、協調的な認識やマルチエージェント環境でのグローバルパフォーマンスの最適化に苦慮することが多い。
本稿では、分散化された部分観測可能なマルコフ決定プロセス(Dec-POMDP)として協調を定式化し、分散実行による集中的トレーニング(CTDE)を採用する強化学習強化LDMエージェントフレームワークを提案する。
協調的な書き込みとコーディングのベンチマークでは、我々のフレームワークはシングルエージェントベースラインよりも3倍のタスク処理速度、98.7%の構造/スタイルの一貫性、コーディングにおける74.6%のテストパス率を実現している。
論文 参考訳(メタデータ) (2025-12-31T03:59:18Z) - Optimizing Fairness in Production Planning: A Human-Centric Approach to Machine and Workforce Allocation [55.71151342699622]
提案システムは,自動車業界のドメインエキスパートによる16のテストセッションを通じて検証される。
その結果,CPをベースとしたスケジューリング手法は,信頼性の低いコンパクトで実現可能な生産計画を生成することが示唆された。
論文 参考訳(メタデータ) (2025-10-01T16:41:18Z) - Deciphering Cross-Modal Alignment in Large Vision-Language Models with Modality Integration Rate [118.37653302885607]
本稿では,LVLM(Large Vision Language Models)のマルチモーダル事前学習品質を示すために,MIR(Modality Integration Rate)を提案する。
MIRは、トレーニングデータ選択、トレーニング戦略スケジュール、モデルアーキテクチャ設計に重点を置いて、トレーニング前の結果を改善する。
論文 参考訳(メタデータ) (2024-10-09T17:59:04Z) - Importance Sampling-Guided Meta-Training for Intelligent Agents in Highly Interactive Environments [43.144056801987595]
本研究では,ガイド付きメタRLと重要サンプリング(IS)を統合し,トレーニング分布を最適化する新たなトレーニングフレームワークを提案する。
現実世界のデータセットから自然な分布を推定することにより、このフレームワークは、共通および極端な駆動シナリオ間のバランスのとれたフォーカスを保証する。
論文 参考訳(メタデータ) (2024-07-22T17:57:12Z) - Decentralized and Lifelong-Adaptive Multi-Agent Collaborative Learning [57.652899266553035]
分散型および生涯適応型多エージェント協調学習は、中央サーバを使わずに複数のエージェント間のコラボレーションを強化することを目的としている。
動的協調グラフを用いた分散マルチエージェント生涯協調学習アルゴリズムであるDeLAMAを提案する。
論文 参考訳(メタデータ) (2024-03-11T09:21:11Z) - CoMIX: A Multi-agent Reinforcement Learning Training Architecture for Efficient Decentralized Coordination and Independent Decision-Making [2.4555276449137042]
ロバストコーディネートスキルにより、エージェントは共有環境で、共通の目標に向けて、そして理想的には、お互いの進歩を妨げることなく、結合的に操作することができる。
本稿では,分散エージェントのための新しいトレーニングフレームワークであるCoordinated QMIXについて述べる。
論文 参考訳(メタデータ) (2023-08-21T13:45:44Z) - Optimization-Derived Learning with Essential Convergence Analysis of
Training and Hyper-training [52.39882976848064]
固定点反復に基づく一般化クラスノセルスキーマンスキースキーム(GKM)を基本ODLモジュールとして設計する。
GKMスキームでは、最適トレーニングとハイパートレーニング変数を同時に解くために、バイレベルメタ最適化(BMO)アルゴリズムフレームワークを構築している。
論文 参考訳(メタデータ) (2022-06-16T01:50:25Z) - Scalable Multi-Agent Model-Based Reinforcement Learning [1.95804735329484]
我々は,モデルベース強化学習(MBRL)を用いて協調環境における集中型トレーニングをさらに活用するMAMBAという新しい手法を提案する。
エージェント間のコミュニケーションは、実行期間中に各エージェントのワールドモデルを維持するのに十分であり、一方、仮想ロールアウトはトレーニングに使用でき、環境と対話する必要がなくなる。
論文 参考訳(メタデータ) (2022-05-25T08:35:00Z) - Reinforcement Learning for Location-Aware Scheduling [1.0660480034605238]
倉庫環境の様々な側面がパフォーマンスや実行の優先順位にどのように影響するかを示す。
位置認識型マルチエージェントシステムのための状態空間と動作空間のコンパクト表現を提案する。
また、特定の環境で訓練されたエージェントが、完全に見えない環境でパフォーマンスを維持する方法を示す。
論文 参考訳(メタデータ) (2022-03-07T15:51:00Z) - Bottom-up mechanism and improved contract net protocol for the dynamic
task planning of heterogeneous Earth observation resources [61.75759893720484]
地球観測資源は、災害救助、被害評価、関連する領域においてますます不可欠になりつつある。
観測要求の変更や悪天候の発生、資源の失敗など、予測できない多くの要因は、スケジュールされた観測計画が実行不可能になる可能性がある。
不均質な地球観測資源の動的タスク計画を容易にするため、ボトムアップ分散協調フレームワークと改良された契約網を提案する。
論文 参考訳(メタデータ) (2020-07-13T03:51:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。