論文の概要: Low-Cost Labels, Reliable Choices: Rollout-Calibrated Hyper-Heuristics for Job Shop Scheduling
- arxiv url: http://arxiv.org/abs/2605.23957v1
- Date: Mon, 11 May 2026 18:50:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-01 02:55:42.976677
- Title: Low-Cost Labels, Reliable Choices: Rollout-Calibrated Hyper-Heuristics for Job Shop Scheduling
- Title(参考訳): 低コストラベルで信頼性の高い選択:ジョブショップスケジューリングのためのロールアウト校正ハイパーヒューリスティック
- Authors: Junhao Wei, Yanxiao Li, Yifu Zhao, Zhenhong Peng, Baili Lu, Dexing Yao, Haochen Li, Qinbin He, Sio-Kei Im, Yapeng Wang, Xu Yang,
- Abstract要約: 構築型ジョブショップスケジューリング問題(JSSP)の実現可能性と解釈性を維持しながら、学習支援型ハイパーヒューリスティックスはディスパッチルールの中から選択できる
本稿では,このラベルコスト問題と信頼性問題について検討する。
提案するセレクタは,不確定なロールアウトラベル,文脈的KNNの不確実性推定,および予測された改善が不確実性調整されたマージンを超える場合にのみ作用するゲートを使用する。
合成JSSPインスタンス上では、セレクタは学習したセレクタの中で最低平均PDを達成し、最高の固定ディスパッチルールに近づき、Random-HH平均RDDを1桁以上削減する。
- 参考スコア(独自算出の注目度): 8.319263972836813
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning-assisted hyper-heuristics can select among dispatching rules while preserving the feasibility and interpretability of constructive Job Shop Scheduling Problem (JSSP) heuristics. Their main computational cost lies in label generation rather than model fitting, since each supervised label usually requires rolling out candidate rules from a partial schedule. We study this label-cost problem together with a reliability problem: a learned selector should not switch away from a strong default rule unless the predicted gain is credible. The proposed selector uses regret-normalized rollout labels, a contextual KNN uncertainty estimate, and a gate that acts only when the predicted improvement exceeds an uncertainty-adjusted margin. We also vary rollout depth and breadth to measure the cost-quality trade-off. On synthetic JSSP instances, the gated selector achieves the lowest mean RPD among learned selectors, remains close to the best fixed dispatching rule, and reduces Random-HH mean RPD by more than an order of magnitude.
- Abstract(参考訳): 学習支援型ハイパーヒューリスティックは、構築型ジョブショップスケジューリング問題(JSSP)ヒューリスティックスの有効性と解釈性を保ちながら、ディスパッチルールの中から選択することができる。
それらの主な計算コストは、モデルフィッティングではなくラベル生成である。
学習したセレクタは、予測されるゲインが信頼できない限り、強いデフォルトルールから切り離してはならない。
提案するセレクタは,不確定なロールアウトラベル,文脈的KNNの不確実性推定,および予測された改善が不確実性調整されたマージンを超える場合にのみ作用するゲートを用いる。
また、コスト品質のトレードオフを測定するために、ロールアウトの深さや幅も様々です。
合成JSSPインスタンスでは、ゲートセレクタは学習したセレクタの中で最低平均RDDを達成し、最高の固定ディスパッチルールに近づき、Random-HH平均RDDを1桁以上削減する。
関連論文リスト
- Optimal Budgeted Adaptation of Large Language Models [8.207283283207138]
ラベル付きデータの可用性と下流の精度のトレードオフは、大きな言語モデルにおいて依然として中心的な課題である。
そこで本稿では,LLM をコンテキスト型 Stackelberg ゲームとしてキャストすることで,Emphbudget-aware による微調整を指導するフレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-01T01:08:15Z) - LEC: Linear Expectation Constraints for False-Discovery Control in Selective Prediction and Routing Systems [95.35293543918762]
大規模言語モデル(LLM)はしばしば信頼できない答えを生成するが、不確実性のある手法は誤った予測と完全に区別することができない。
我々は、この問題を、偽発見率(FDR)制御のレンズを通して解決し、全ての許容された予測のうち、エラーの割合が目標のリスクレベルを超えないことを保証する。
本稿では,線形期待制約を強制することで,選択予測を制約付き決定問題として再解釈するLECを提案する。
論文 参考訳(メタデータ) (2025-12-01T11:27:09Z) - Mitigating Label Length Bias in Large Language Models [16.378998802160375]
正規化文脈キャリブレーション(NCC)は、全ラベルレベルでの予測を正規化し、校正する有効な方法である。
NCCは、複数のデータセットやモデルにまたがる以前のアプローチよりも統計的に重要な改善を実現している。
分析の結果、文脈内学習と組み合わせると、NCCは少数ショットのサンプル選択に敏感でなく、競合性能のサンプルが少ないこと、信頼性の高い信頼度を推定できることがわかった。
論文 参考訳(メタデータ) (2025-11-18T11:45:24Z) - Quantifying and Mitigating Selection Bias in LLMs: A Transferable LoRA Fine-Tuning and Efficient Majority Voting Approach [13.829059542429876]
大規模言語モデル(LLM)の性能評価手法として,MCQ (Multiple Choice Questioning) が広く用いられている。
LLMはMCQタスクにおいて選択バイアスを示し、その選択は内容よりも答えの位置やオプション記号などの要因に影響される。
論文 参考訳(メタデータ) (2025-11-17T21:31:37Z) - COIN: Uncertainty-Guarding Selective Question Answering for Foundation Models with Provable Risk Guarantees [51.5976496056012]
COINは、統計的に有効な閾値を校正し、質問毎に1つの生成された回答をフィルタリングする不確実性保護選択フレームワークである。
COINはキャリブレーションセット上で経験的誤差率を推定し、信頼区間法を適用して真誤差率に高い確率上界を確立する。
リスク管理におけるCOINの堅牢性,許容回答を維持するための強いテストタイムパワー,キャリブレーションデータによる予測効率を実証する。
論文 参考訳(メタデータ) (2025-06-25T07:04:49Z) - Optimal Unbiased Randomizers for Regression with Label Differential
Privacy [61.63619647307816]
ラベル差分プライバシ(DP)の制約の下で回帰モデルをトレーニングするためのラベルランダム化器の新たなファミリーを提案する。
これらのランダム化器は、いくつかのデータセット上で最先端のプライバシユーティリティトレードオフを実現することを実証する。
論文 参考訳(メタデータ) (2023-12-09T19:58:34Z) - Generating Unbiased Pseudo-labels via a Theoretically Guaranteed
Chebyshev Constraint to Unify Semi-supervised Classification and Regression [57.17120203327993]
分類におけるしきい値と擬似ラベルプロセス(T2L)は、ラベルの品質を決定するために信頼性を使用する。
本質的には、レグレッションは高品質なラベルを生成するためにバイアスのない方法も必要である。
チェビシェフの不等式に基づく不偏ラベルを生成するための理論的に保証された制約を提案する。
論文 参考訳(メタデータ) (2023-11-03T08:39:35Z) - When Does Confidence-Based Cascade Deferral Suffice? [69.28314307469381]
カスケードは、推論コストをサンプル毎に適応的に変化させる古典的な戦略である。
deferralルールは、シーケンス内の次の分類子を呼び出すか、または予測を終了するかを決定する。
カスケードの構造に執着しているにもかかわらず、信頼に基づく推論は実際は極めてうまく機能することが多い。
論文 参考訳(メタデータ) (2023-07-06T04:13:57Z) - How to Allocate your Label Budget? Choosing between Active Learning and
Learning to Reject in Anomaly Detection [15.224212372777002]
異常検出は、期待された振る舞いから逸脱する例を見つけようとする。
ラベルの欠如により、一部の地域では異常検知器は高い不確実性を持つ。
複数のラウンドでALラベルを収集するか、ラベルをリジェクトするかを判断する混合戦略を提案する。
論文 参考訳(メタデータ) (2023-01-07T18:02:43Z) - Gradient Descent in RKHS with Importance Labeling [58.79085525115987]
我々は重要ラベル付け問題について研究し、ラベルなしデータが多く与えられている。
ラベルなしデータの情報サブセットを効果的に選択できる新しい重要ラベル方式を提案する。
論文 参考訳(メタデータ) (2020-06-19T01:55:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。