論文の概要: Solving the Paint Shop Problem with Flexible Management of Multi-Lane Buffers Using Reinforcement Learning and Action Masking
- arxiv url: http://arxiv.org/abs/2504.02644v1
- Date: Thu, 03 Apr 2025 14:37:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-04 12:53:14.933998
- Title: Solving the Paint Shop Problem with Flexible Management of Multi-Lane Buffers Using Reinforcement Learning and Action Masking
- Title(参考訳): 強化学習とアクション・マスキングを用いた多層バッファのフレキシブル・マネージメントによるペイントショップ問題の解法
- Authors: Mirko Stappert, Bernhard Lutz, Janis Brammer, Dirk Neumann,
- Abstract要約: ペイントショップ問題では、異なる色に割り当てられた車両の無秩序な受信シーケンスを再シャッフルする必要がある。
フレキシブルな問題変種に対する色変化を最小限に抑えるための強化学習手法を提案する。
提案手法は,既存の手法と比較して,問題の大きさによって色の変化をかなり低減することを示す。
- 参考スコア(独自算出の注目度): 3.0436372885836995
- License:
- Abstract: In the paint shop problem, an unordered incoming sequence of cars assigned to different colors has to be reshuffled with the objective of minimizing the number of color changes. To reshuffle the incoming sequence, manufacturers can employ a first-in-first-out multi-lane buffer system allowing store and retrieve operations. So far, prior studies primarily focused on simple decision heuristics like greedy or simplified problem variants that do not allow full flexibility when performing store and retrieve operations. In this study, we propose a reinforcement learning approach to minimize color changes for the flexible problem variant, where store and retrieve operations can be performed in an arbitrary order. After proving that greedy retrieval is optimal, we incorporate this finding into the model using action masking. Our evaluation, based on 170 problem instances with 2-8 buffer lanes and 5-15 colors, shows that our approach reduces color changes compared to existing methods by considerable margins depending on the problem size. Furthermore, we demonstrate the robustness of our approach towards different buffer sizes and imbalanced color distributions.
- Abstract(参考訳): ペイントショップ問題では、色数の変化を最小限に抑える目的で、異なる色に割り当てられた車両の順序のない入場順序を調整する必要がある。
受信シーケンスを再シャッフルするために、メーカは、ストアと検索操作を可能にする、ファーストインアウトのマルチレーンバッファシステムを使用することができる。
これまでの研究は主に、ストアとリトリート操作の実行時に完全な柔軟性を許さない、欲求や単純化された問題変種のような単純な意思決定ヒューリスティックに重点を置いていた。
本研究では,フレキシブルな問題変種に対する色変化を最小限に抑えるための強化学習手法を提案する。
欲求検索が最適であることを証明した後、この発見をアクションマスキングを用いてモデルに組み込む。
2~8本のバッファレーンと5~15色の170個の問題インスタンスをベースとして,本手法は既存の手法と比較して色変化を問題サイズによってかなり低減することを示す。
さらに,異なるバッファサイズと不均衡な色分布に対するアプローチの堅牢性を示す。
関連論文リスト
- Localizing Task Information for Improved Model Merging and Compression [61.16012721460561]
我々は,各タスクの重み付けが重なり合わないことが多いため,各タスクがマージされた後も,各タスクの解決に必要な情報が保存されていることを示す。
本稿では,そのような重みを排除し,既存のモデルマージ手法の一般的な性能を改善するアルゴリズムであるConsensus Mergingを提案する。
論文 参考訳(メタデータ) (2024-05-13T14:54:37Z) - Magic Tokens: Select Diverse Tokens for Multi-modal Object Re-Identification [64.36210786350568]
マルチモーダルオブジェクトReIDのための視覚変換器から多様なトークンを選択するための,textbfEDITORという新しい学習フレームワークを提案する。
我々のフレームワークはマルチモーダルオブジェクトReIDに対してより差別的な機能を生成することができる。
論文 参考訳(メタデータ) (2024-03-15T12:44:35Z) - Control Color: Multimodal Diffusion-based Interactive Image Colorization [81.68817300796644]
Control Color (Ctrl Color) は、事前訓練された安定拡散(SD)モデルを利用する多モードカラー化手法である。
ユーザのストロークをエンコードして、局所的な色操作を正確に行うための効果的な方法を提案する。
また、カラーオーバーフローと不正確な色付けの長年の問題に対処するために、自己注意に基づく新しいモジュールとコンテンツ誘導型変形可能なオートエンコーダを導入する。
論文 参考訳(メタデータ) (2024-02-16T17:51:13Z) - UniGS: Unified Representation for Image Generation and Segmentation [105.08152635402858]
カラーマップを使用してエンティティレベルのマスクを表現し、さまざまなエンティティ番号の課題に対処します。
マスク表現を支援するために、位置認識カラーパレットとプログレッシブ二分法モジュールを含む2つの新しいモジュールが提案されている。
論文 参考訳(メタデータ) (2023-12-04T15:59:27Z) - Primal Dual Continual Learning: Balancing Stability and Plasticity through Adaptive Memory Allocation [86.8475564814154]
制約付き最適化問題を直接実行することは可能かつ有益であることを示す。
メモリベースのメソッドでは、以前のタスクからのサンプルの小さなサブセットをリプレイバッファに格納できる。
両変数は,制約摂動に対する連続学習問題の最適値の感度を示す。
論文 参考訳(メタデータ) (2023-09-29T21:23:27Z) - Recon: Reducing Conflicting Gradients from the Root for Multi-Task
Learning [31.139346853434308]
マルチタスク学習の基本的な課題は、異なるタスクが共同で解決されたときに互いに衝突する可能性があることである。
最近の研究は、いくつかの基準に基づいて勾配を直接変更することで、矛盾する勾配の影響を緩和しようとするものである。
本稿では,根から対立する勾配を減らすために,異なるアプローチをとる。
論文 参考訳(メタデータ) (2023-02-22T11:14:16Z) - Multi-car paint shop optimization with quantum annealing [0.0]
本稿では,自動車産業アプリケーション,マルチカーペンキショップ (MCPS) 問題に取り組むために,バイナリペイントショップ問題 (BPSP) の一般化を提案する。
この最適化の目的は、製造中のペイントショップキュー内の車両間のカラースイッチ数を最小化することであり、既知のNPハード問題である。
我々はペイントショップ問題のサブクラスを区別し,基本MCPS問題をIsingモデルとして定式化する方法を示す。
論文 参考訳(メタデータ) (2021-09-16T11:14:45Z) - Fast Soft Color Segmentation [10.154836127889487]
我々は、与えられた画像を複数のRGBA層に分解することを定義したソフトカラーセグメンテーションの問題に対処する。
本稿では,与えられた画像を複数の層に分割して1つのフォワードパスに分割するニューラルネットワークに基づく手法を提案する。
提案手法は,既存の反復的アプローチの推論速度の問題なく,有望な品質を実現する。
論文 参考訳(メタデータ) (2020-04-17T07:43:33Z) - GACEM: Generalized Autoregressive Cross Entropy Method for Multi-Modal
Black Box Constraint Satisfaction [69.94831587339539]
本稿では,マスク付き自己回帰ニューラルネットワークを用いて解空間上の均一分布をモデル化するクロスエントロピー法(CEM)を提案する。
我々のアルゴリズムは複雑な解空間を表現でき、様々な異なる解領域を追跡できる。
論文 参考訳(メタデータ) (2020-02-17T20:21:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。