Fugu-MT 論文翻訳(概要): A Constraint Programming Model For Serial Batch Scheduling With Minimum Batch Size

論文の概要: A Constraint Programming Model For Serial Batch Scheduling With Minimum Batch Size

arxiv url: http://arxiv.org/abs/2504.08793v1
Date: Mon, 07 Apr 2025 17:14:19 GMT
ステータス: 翻訳完了
システム内更新日: 2025-04-25 05:52:13.451149
Title: A Constraint Programming Model For Serial Batch Scheduling With Minimum Batch Size
Title（参考訳）: 最小バッチサイズ付きシリアルバッチスケジューリングのための制約プログラミングモデル
Authors: Jorge A. Huertas, Pascal Van Hentenryck,
Abstract要約: シリアルバッチ(sバッチ)スケジューリングでは、ジョブはバッチにグループ化され、バッチ内で順次処理される。本稿では、複数の並列マシン、非同一のジョブウェイトとリリース時間、および異なるファミリーのバッチ間のシーケンス依存セットアップ時間について考察する。
参考スコア（独自算出の注目度）: 17.283429743575194
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In serial batch (s-batch) scheduling, jobs are grouped in batches and processed sequentially within their batch. This paper considers multiple parallel machines, nonidentical job weights and release times, and sequence-dependent setup times between batches of different families. Although s-batch has been widely studied in the literature, very few papers have taken into account a minimum batch size, typical in practical settings such as semiconductor manufacturing and the metal industry. The problem with this minimum batch size requirement has been mostly tackled with dynamic programming and meta-heuristics, and no article has ever used constraint programming (CP) to do so. This paper fills this gap by proposing, for the first time, a CP model for s-batching with minimum batch size. The computational experiments on standard cases compare the CP model with two existing mixed-integer programming (MIP) models from the literature. The results demonstrate the versatility of the proposed CP model to handle multiple variations of s-batching; and its ability to produce, in large instances, better solutions than the MIP models faster.
Abstract（参考訳）: シリアルバッチ(sバッチ)スケジューリングでは、ジョブはバッチにグループ化され、バッチ内で順次処理される。本稿では、複数の並列マシン、非同一のジョブウェイトとリリース時間、および異なるファミリーのバッチ間のシーケンス依存セットアップ時間について考察する。 sバッチは文献で広く研究されているが、半導体製造や金属産業のような実践的な環境において、最小限のバッチサイズを考慮する論文はほとんどない。この最小限のバッチサイズ要件の問題は、動的プログラミングとメタヒューリスティックスに主に取り組まれている。本稿では,最小バッチサイズでSバッチを行うCPモデルを提案することで,このギャップを埋める。標準の場合の計算実験は、CPモデルと既存の2つの混合整数プログラミング(MIP)モデルを比較した。その結果、提案したCPモデルが複数種類のsバッチ処理を処理可能であること、また、大規模な場合において、MIPモデルよりも高速に解を生成できることが示されている。

関連論文リスト

Small Batch Size Training for Language Models: When Vanilla SGD Works, and Why Gradient Accumulation Is Wasteful [71.96579951744897]
従来の知恵では、小さなバッチサイズは言語モデルを事前訓練し、微調整を不安定にし、モチベーションを増進させる。本研究では,バッチサイズからバッチサイズまで,小さなバッチサイズを再検討し,Adamハイパーパラメータを小さなバッチサイズにスケールするためのルールを提案する。
論文参考訳（メタデータ） (2025-07-09T17:57:36Z)
Collaborative LLM Inference via Planning for Efficient Reasoning [50.04696654679751]
本稿では,プランナーモデルがまず,その問題の蒸留および高レベルの抽象化として定義されたプランを生成するテストタイム協調フレームワークを提案する。小型と大型のモデルは、プランナーと理性士として交代で働き、複雑なタスクを協調的に解決するために、多ラウンドのカスケードでプランを交換する。提案手法は,強力なプロプライエタリモデルに匹敵する精度を実現し,有償推論への依存を著しく低減する。
論文参考訳（メタデータ） (2025-06-13T08:35:50Z)
CP-Bench: Evaluating Large Language Models for Constraint Modelling [6.273426548149088]
制約プログラミング(CP)は、よく適合した問題解決パラダイムであるが、その中核となるプロセス、すなわち制約モデリングは、広く採用されるボトルネックである。近年,Large Language Models (LLM) をモデリングアシスタントとして使用し,問題記述を実行可能な制約モデルに変換する研究が行われている。 CP-Benchは、様々な既知の問題クラスを含む新しいベンチマークデータセットである。
論文参考訳（メタデータ） (2025-06-06T12:56:02Z)
Adaptive Batch Size Schedules for Distributed Training of Language Models with Data and Model Parallelism [17.006352664497122]
PyTorch Fully Shard Data Parallel を用いた実用的な実装を開発した。提案手法が一定のバッチサイズより優れていることを示す。また、このような適応型バッチサイズスケジュールについても理論的に保証する。
論文参考訳（メタデータ） (2024-12-30T17:55:28Z)
ParallelSpec: Parallel Drafter for Efficient Speculative Decoding [62.68430939686566]
提案するParallelSpecは,最先端の投機的復号化手法における自己回帰的起草戦略の代替となる。投機段階における自己回帰的起草とは対照的に,効率的な投機モデルとして機能する並列投機を訓練する。
論文参考訳（メタデータ） (2024-10-08T01:05:08Z)
S2D: Sorted Speculative Decoding For More Efficient Deployment of Nested Large Language Models [32.68002253527712]
より高速な推論のためのドラフトモデルをデプロイするための、新しいマルチターゲットシナリオを紹介します。マルチターゲット設定における正規ベースラインよりも優れた、より効率的なソートされた投機的復号化機構を提案する。
論文参考訳（メタデータ） (2024-07-02T05:14:15Z)
MAP: Low-compute Model Merging with Amortized Pareto Fronts via Quadratic Approximation [80.47072100963017]
Amortized Pareto Front (MAP) を用いた新しい低演算アルゴリズム Model Merging を導入する。 MAPは、複数のモデルをマージするためのスケーリング係数のセットを効率的に識別し、関連するトレードオフを反映する。また,タスク数が比較的少ないシナリオではベイジアンMAP,タスク数の多い状況ではNested MAPを導入し,計算コストを削減した。
論文参考訳（メタデータ） (2024-06-11T17:55:25Z)
Consecutive Batch Model Editing with HooK Layers [59.673084839708224]
CoachHooKは、シーケンシャルおよびバッチ編集を同時にサポートするモデル編集方法である。メモリフレンドリで、時間とともにサイズが変化しないいくつかのフック層を格納するために、少量しか必要としない。
論文参考訳（メタデータ） (2024-03-08T14:07:44Z)
Multi-Candidate Speculative Decoding [82.05519287513444]
大規模な言語モデルは、様々なNLPタスクで印象的な機能を示してきたが、その生成は自動回帰的に時間を要する。これは高速なドラフトモデルから候補セグメントを生成し、ターゲットモデルによって並列に検証する。本稿では,複数の候補をドラフトモデルから抽出し,検証のためにバッチにまとめる手法を提案する。対象モデルの分布を維持しつつ,効率的な多候補検証のためのアルゴリズムを設計する。
論文参考訳（メタデータ） (2024-01-12T17:15:23Z)
SqueezeLLM: Dense-and-Sparse Quantization [80.32162537942138]
LLMにおける生成推論の主なボトルネックは、単一のバッチ推論のための計算ではなく、メモリ帯域幅である。学習後量子化フレームワークであるSqueezeLLMを導入し、最大3ビットの超低精度でのロスレス圧縮を実現する。本フレームワークは,2次情報に基づく最適ビット精度割当を探索する感度ベース非一様量子化法と,2次情報に基づくDense-and-Sparse分解法と,2次情報量割当値と感度重み値を効率的にスパース形式で格納するDense-and-Sparse分解法である。
論文参考訳（メタデータ） (2023-06-13T08:57:54Z)
AlpaServe: Statistical Multiplexing with Model Parallelism for Deep Learning Serving [53.01646445659089]
モデル並列性は、複数のモデルを提供する場合、複数のデバイスの統計多重化に利用できることを示す。本稿では,大規模ディープラーニングモデルのコレクションを配置・並列化するための効率的な戦略を決定する新しいサービスシステムAlpaServeを提案する。
論文参考訳（メタデータ） (2023-02-22T21:41:34Z)
Answer-Set Programming for Lexicographical Makespan Optimisation in Parallel Machine Scheduling [18.286430978487388]
我々は、シーケンス依存のセットアップ時間とリリース日を持つ並列マシン上で、困難なスケジューリング問題に対処する。個々のマシンを非到達順に配置し、結果として生じるロバスト性を語彙的に最小化する。実験の結果,ASPは実際にこの問題に対して有望なKRRパラダイムであり,最先端のCPおよびMIPソルバと競合していることがわかった。
論文参考訳（メタデータ） (2022-12-18T12:43:24Z)
Exact methods and lower bounds for the Oven Scheduling Problem [5.7485371212305685]
Oven Scheduling Problem (OSP) は、電子部品製造の領域で発生する新しい並列バッチスケジューリング問題である。オーブンの実行はエネルギー集約性の高いため、時間内にジョブを終了する以外に、すべてのオーブンの累積バッチ処理時間を最小化することが主な目的である。本稿では、制約計画法(CP)と整数線形計画法(ILP)とそれに対応するモデルを用いて、このNPハードスケジューリング問題を解決することを提案する。
論文参考訳（メタデータ） (2022-03-23T16:28:05Z)
Automatic Mixed-Precision Quantization Search of BERT [62.65905462141319]
BERTのような事前訓練された言語モデルは、様々な自然言語処理タスクにおいて顕著な効果を示している。これらのモデルは通常、数百万のパラメータを含んでおり、リソースに制約のあるデバイスへの実践的なデプロイを妨げている。本稿では,サブグループレベルでの量子化とプルーニングを同時に行うことができるBERT用に設計された混合精密量子化フレームワークを提案する。
論文参考訳（メタデータ） (2021-12-30T06:32:47Z)
Towards Efficient Post-training Quantization of Pre-trained Language Models [85.68317334241287]
PLMのポストトレーニング量子化(PTQ)について検討し,モジュール単位の量子化誤差最小化(MREM)を提案する。 GLUEとSQuADベンチマークの実験により、提案したPTQソリューションはQATに近く動作するだけでなく、トレーニング時間、メモリオーバーヘッド、データ消費を大幅に削減できることがわかった。
論文参考訳（メタデータ） (2021-09-30T12:50:06Z)
Filtering Rules for Flow Time Minimization in a Parallel Machine Scheduling Problem [0.0]
本稿では,資格制約のある並列マシン上での異なる家族のジョブのスケジューリングについて検討する。目標は、フロー時間と不平等の数の両方を最小化することです。本稿では,不等式が考慮されない単一機械緩和における流速を最小化する時間アルゴリズムを用いる。
論文参考訳（メタデータ） (2020-11-20T10:00:14Z)
DynE: Dynamic Ensemble Decoding for Multi-Document Summarization [5.197307534263253]
異なる入力に対して同一モデルの複数のインスタンスの出力をアンサンブルする単純な復号法を提案する。我々は,複数の文書要約データセットの最先端結果を得る。
論文参考訳（メタデータ） (2020-06-15T20:40:06Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。