論文の概要: A Constraint Programming Model For Serial Batch Scheduling With Minimum Batch Size
- arxiv url: http://arxiv.org/abs/2504.08793v1
- Date: Mon, 07 Apr 2025 17:14:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-20 05:05:30.437921
- Title: A Constraint Programming Model For Serial Batch Scheduling With Minimum Batch Size
- Title(参考訳): 最小バッチサイズ付きシリアルバッチスケジューリングのための制約プログラミングモデル
- Authors: Jorge A. Huertas, Pascal Van Hentenryck,
- Abstract要約: シリアルバッチ(sバッチ)スケジューリングでは、ジョブはバッチにグループ化され、バッチ内で順次処理される。
本稿では、複数の並列マシン、非同一のジョブウェイトとリリース時間、および異なるファミリーのバッチ間のシーケンス依存セットアップ時間について考察する。
- 参考スコア(独自算出の注目度): 17.283429743575194
- License:
- Abstract: In serial batch (s-batch) scheduling, jobs are grouped in batches and processed sequentially within their batch. This paper considers multiple parallel machines, nonidentical job weights and release times, and sequence-dependent setup times between batches of different families. Although s-batch has been widely studied in the literature, very few papers have taken into account a minimum batch size, typical in practical settings such as semiconductor manufacturing and the metal industry. The problem with this minimum batch size requirement has been mostly tackled with dynamic programming and meta-heuristics, and no article has ever used constraint programming (CP) to do so. This paper fills this gap by proposing, for the first time, a CP model for s-batching with minimum batch size. The computational experiments on standard cases compare the CP model with two existing mixed-integer programming (MIP) models from the literature. The results demonstrate the versatility of the proposed CP model to handle multiple variations of s-batching; and its ability to produce, in large instances, better solutions than the MIP models faster.
- Abstract(参考訳): シリアルバッチ(sバッチ)スケジューリングでは、ジョブはバッチにグループ化され、バッチ内で順次処理される。
本稿では、複数の並列マシン、非同一のジョブウェイトとリリース時間、および異なるファミリーのバッチ間のシーケンス依存セットアップ時間について考察する。
sバッチは文献で広く研究されているが、半導体製造や金属産業のような実践的な環境において、最小限のバッチサイズを考慮する論文はほとんどない。
この最小限のバッチサイズ要件の問題は、動的プログラミングとメタヒューリスティックスに主に取り組まれている。
本稿では,最小バッチサイズでSバッチを行うCPモデルを提案することで,このギャップを埋める。
標準の場合の計算実験は、CPモデルと既存の2つの混合整数プログラミング(MIP)モデルを比較した。
その結果、提案したCPモデルが複数種類のsバッチ処理を処理可能であること、また、大規模な場合において、MIPモデルよりも高速に解を生成できることが示されている。
関連論文リスト
- ParallelSpec: Parallel Drafter for Efficient Speculative Decoding [62.68430939686566]
提案するParallelSpecは,最先端の投機的復号化手法における自己回帰的起草戦略の代替となる。
投機段階における自己回帰的起草とは対照的に,効率的な投機モデルとして機能する並列投機を訓練する。
論文 参考訳(メタデータ) (2024-10-08T01:05:08Z) - S2D: Sorted Speculative Decoding For More Efficient Deployment of Nested Large Language Models [32.68002253527712]
より高速な推論のためのドラフトモデルをデプロイするための、新しいマルチターゲットシナリオを紹介します。
マルチターゲット設定における正規ベースラインよりも優れた、より効率的なソートされた投機的復号化機構を提案する。
論文 参考訳(メタデータ) (2024-07-02T05:14:15Z) - MAP: Low-compute Model Merging with Amortized Pareto Fronts via Quadratic Approximation [80.47072100963017]
Amortized Pareto Front (MAP) を用いた新しい低演算アルゴリズム Model Merging を導入する。
MAPは、複数のモデルをマージするためのスケーリング係数のセットを効率的に識別し、関連するトレードオフを反映する。
また,タスク数が比較的少ないシナリオではベイジアンMAP,タスク数の多い状況ではNested MAPを導入し,計算コストを削減した。
論文 参考訳(メタデータ) (2024-06-11T17:55:25Z) - Multi-Candidate Speculative Decoding [82.05519287513444]
大規模な言語モデルは、様々なNLPタスクで印象的な機能を示してきたが、その生成は自動回帰的に時間を要する。
これは高速なドラフトモデルから候補セグメントを生成し、ターゲットモデルによって並列に検証する。
本稿では,複数の候補をドラフトモデルから抽出し,検証のためにバッチにまとめる手法を提案する。
対象モデルの分布を維持しつつ,効率的な多候補検証のためのアルゴリズムを設計する。
論文 参考訳(メタデータ) (2024-01-12T17:15:23Z) - AlpaServe: Statistical Multiplexing with Model Parallelism for Deep
Learning Serving [53.01646445659089]
モデル並列性は、複数のモデルを提供する場合、複数のデバイスの統計多重化に利用できることを示す。
本稿では,大規模ディープラーニングモデルのコレクションを配置・並列化するための効率的な戦略を決定する新しいサービスシステムAlpaServeを提案する。
論文 参考訳(メタデータ) (2023-02-22T21:41:34Z) - Answer-Set Programming for Lexicographical Makespan Optimisation in
Parallel Machine Scheduling [18.286430978487388]
我々は、シーケンス依存のセットアップ時間とリリース日を持つ並列マシン上で、困難なスケジューリング問題に対処する。
個々のマシンを非到達順に配置し、結果として生じるロバスト性を語彙的に最小化する。
実験の結果,ASPは実際にこの問題に対して有望なKRRパラダイムであり,最先端のCPおよびMIPソルバと競合していることがわかった。
論文 参考訳(メタデータ) (2022-12-18T12:43:24Z) - Exact methods and lower bounds for the Oven Scheduling Problem [5.7485371212305685]
Oven Scheduling Problem (OSP) は、電子部品製造の領域で発生する新しい並列バッチスケジューリング問題である。
オーブンの実行はエネルギー集約性の高いため、時間内にジョブを終了する以外に、すべてのオーブンの累積バッチ処理時間を最小化することが主な目的である。
本稿では、制約計画法(CP)と整数線形計画法(ILP)とそれに対応するモデルを用いて、このNPハードスケジューリング問題を解決することを提案する。
論文 参考訳(メタデータ) (2022-03-23T16:28:05Z) - Automatic Mixed-Precision Quantization Search of BERT [62.65905462141319]
BERTのような事前訓練された言語モデルは、様々な自然言語処理タスクにおいて顕著な効果を示している。
これらのモデルは通常、数百万のパラメータを含んでおり、リソースに制約のあるデバイスへの実践的なデプロイを妨げている。
本稿では,サブグループレベルでの量子化とプルーニングを同時に行うことができるBERT用に設計された混合精密量子化フレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-30T06:32:47Z) - Towards Efficient Post-training Quantization of Pre-trained Language
Models [85.68317334241287]
PLMのポストトレーニング量子化(PTQ)について検討し,モジュール単位の量子化誤差最小化(MREM)を提案する。
GLUEとSQuADベンチマークの実験により、提案したPTQソリューションはQATに近く動作するだけでなく、トレーニング時間、メモリオーバーヘッド、データ消費を大幅に削減できることがわかった。
論文 参考訳(メタデータ) (2021-09-30T12:50:06Z) - Filtering Rules for Flow Time Minimization in a Parallel Machine
Scheduling Problem [0.0]
本稿では,資格制約のある並列マシン上での異なる家族のジョブのスケジューリングについて検討する。
目標は、フロー時間と不平等の数の両方を最小化することです。
本稿では,不等式が考慮されない単一機械緩和における流速を最小化する時間アルゴリズムを用いる。
論文 参考訳(メタデータ) (2020-11-20T10:00:14Z) - DynE: Dynamic Ensemble Decoding for Multi-Document Summarization [5.197307534263253]
異なる入力に対して同一モデルの複数のインスタンスの出力をアンサンブルする単純な復号法を提案する。
我々は,複数の文書要約データセットの最先端結果を得る。
論文 参考訳(メタデータ) (2020-06-15T20:40:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。