論文の概要: Feasible-First Exploration for Constrained ML Deployment Optimization in Crash-Prone Hierarchical Search Spaces
- arxiv url: http://arxiv.org/abs/2604.25073v1
- Date: Mon, 27 Apr 2026 23:58:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-29 16:49:17.639175
- Title: Feasible-First Exploration for Constrained ML Deployment Optimization in Crash-Prone Hierarchical Search Spaces
- Title(参考訳): Crash-Prone 階層型検索空間における制約付きML配置最適化のためのFasible First Exploration
- Authors: Christian Lysenstøen,
- Abstract要約: 本稿では, 探索段階において, モデル誘導によるエクスプロイトに最適化が適用されるべきかどうかについて検討する。
本研究では,有効かつ有効な地域を地図化するための,実行可能な第1探索法である熱予算アニール法(TBA)を提案する。
また、階層構造、隠れたクラッシュゾーン、厳しい制約、不平等な評価コストを備えたデプロイメント最適化のためのベンチマークスイートであるDeployBenchも導入しました。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deploying machine learning models under production constraints requires joint optimization over model family, quantization scheme, runtime backend, and serving configuration. This induces a hierarchical mixed-variable search space in which many configurations are invalid: evaluations may crash, exceed memory limits, or violate latency constraints. Standard black-box optimizers such as Tree-structured Parzen Estimators (TPE) and constrained Bayesian optimization are effective when valid configurations are common, but they can spend a large fraction of a small evaluation budget on invalid or uninformative trials in hostile deployment spaces. This paper studies that regime and asks whether optimization should be decomposed into an explicit exploration stage followed by model-guided exploitation. We propose Thermal Budget Annealing (TBA), a feasible-first exploration procedure that maps valid and feasible regions before warm-starting TPE. The method includes two robustness mechanisms for hostile hardware: trial timeouts that abort clearly infeasible evaluations early, and subspace blacklisting that temporarily suppresses categorical subspaces after repeated failures. We also introduce DeployBench, a benchmark suite for deployment optimization with hierarchical structure, hidden crash zones, hard constraints, and unequal evaluation costs. On synthetic benchmarks and real GPU deployment with five pre-trained vision models across five GPU targets (NVIDIA H100, A100, RTX 5080, L4, and T4), the proposed hybrid improves model-family discovery under tight constraints while reducing wasted budget relative to cold-start TPE.
- Abstract(参考訳): プロダクション制約下で機械学習モデルをデプロイするには、モデルファミリー、量子化スキーム、ランタイムバックエンド、サービス構成を共同で最適化する必要がある。
これは階層的な混合変数検索空間を誘導し、多くの構成が無効になる。
木構造型Parzen Estimator (TPE) や制約付きベイズ最適化のような標準的なブラックボックスオプティマイザは、有効な構成が一般的である場合に有効であるが、敵の配置空間における無効または不正な試行に少数の評価予算を費やすことができる。
本稿では,最適化を明示的な探索段階に分解し,モデル誘導によるエクスプロイトを実施すべきかどうかを考察する。
本研究では,温暖化開始前に有効かつ実行可能な地域を地図化するための,実行可能な第1探索法である熱予算アニール法(TBA)を提案する。
この手法は、2つの強靭なハードウェアのメカニズムを含む: 早期に明確に実現不可能な評価を中止する試行タイムアウトと、繰り返し失敗した後にカテゴリー的なサブスペースを一時的に抑制するサブスペースブラックリストである。
また、階層構造、隠れたクラッシュゾーン、厳しい制約、不平等な評価コストを備えたデプロイメント最適化のためのベンチマークスイートであるDeployBenchも導入しました。
合成ベンチマークと5つのGPUターゲット(NVIDIA H100、A100、RTX 5080、L4、T4)にわたる5つの事前トレーニングされたビジョンモデルによる実際のGPUデプロイメントでは、提案されたハイブリッドは、コールドスタートTPEに対する無駄な予算を削減しつつ、厳密な制約の下でモデルストアの検出を改善する。
関連論文リスト
- A Comparative Study of CNN Optimization Methods for Edge AI: Exploring the Role of Early Exits [0.08209843760716957]
本稿では,静的圧縮と動的早期退避機構の統一的な展開指向比較について述べる。
以上の結果から,静的および動的手法によって,エッジデプロイメントのトレードオフが根本的に異なることが明らかとなった。
それらの組み合わせは非常に効果的で、推論遅延とメモリ使用量を最小限の精度で削減できる。
論文 参考訳(メタデータ) (2026-04-16T08:50:49Z) - Generative Control as Optimization: Time Unconditional Flow Matching for Adaptive and Robust Robotic Control [33.03635235189535]
動作合成を反復的最適化に変換する時間非条件フレームワークGeCOについて紹介する。
テスト時間推論は、単純な状態に対して収束開始早期に基づいて計算を割り当てる適応的なプロセスとなり、難しい状態に対してはより長く精製する。
我々は,GeCOを標準シミュレーションベンチマークで検証し,pi0シリーズのVision-Language-Action(VLA)モデルにシームレスなスケーリングを示す。
論文 参考訳(メタデータ) (2026-03-18T15:27:17Z) - DRAFTO: Decoupled Reduced-space and Adaptive Feasibility-repair Trajectory Optimization for Robotic Manipulators [4.0407133618465005]
本稿では、トラジェクトリ最適化のための新しいアルゴリズム、Decoupled Reduced-spaceとAdaptive Feasibility-Repair Trajectory Optimization (DRAFTO)を提案する。
連立限界実現性を扱いながら繰り返し制約された最適化の回数を減らすため、最適化を低空間ガウスニュートン(Gass-Newton, GN)降下に分離する。
CHOMP, TrajOpt, GPMP2, FACTOなどの最適化型プランナに対するベンチマークテストの結果, 様々なシナリオやタスクにおいて高い効率性と信頼性が検証された。
論文 参考訳(メタデータ) (2026-03-10T20:24:42Z) - Neural Nonmyopic Bayesian Optimization in Dynamic Cost Settings [73.44599934855067]
LookaHESは、動的で履歴に依存したコスト環境のために設計された非心筋BOフレームワークである。
LookaHESは、$H$-Entropy Searchのマルチステップ版と、パスワイズサンプリングとニューラルポリシー最適化を組み合わせたものだ。
私たちの革新は、構造化されたドメイン固有のアクションスペースを効果的にナビゲートするために、大きな言語モデルを含むニューラルポリシーの統合です。
論文 参考訳(メタデータ) (2026-01-10T09:49:45Z) - PT$^2$-LLM: Post-Training Ternarization for Large Language Models [52.4629647715623]
大きな言語モデル(LLM)は、様々なタスクにまたがる印象的な機能を示しているが、その大きなメモリと計算能力は、デプロイメントを妨げている。
PT$2$-LLMを提案する。
その中核は2段精製パイプラインを備えた非対称3次量子化器である。
論文 参考訳(メタデータ) (2025-09-27T03:01:48Z) - Steerable Adversarial Scenario Generation through Test-Time Preference Alignment [58.37104890690234]
対立シナリオ生成は、自律運転システムの安全性評価のためのコスト効率の良いアプローチである。
textbfSteerable textbfAdversarial scenario textbfGEnerator (SAGE) という新しいフレームワークを導入する。
SAGEは、逆境とリアリズムの間のトレードオフを、再トレーニングなしできめ細かいテストタイムコントロールを可能にします。
論文 参考訳(メタデータ) (2025-09-24T13:27:35Z) - Learning Regions of Interest for Bayesian Optimization with Adaptive
Level-Set Estimation [84.0621253654014]
本稿では,高信頼領域を適応的にフィルタするBALLETというフレームワークを提案する。
理論的には、BALLETは探索空間を効率的に縮小することができ、標準BOよりも厳密な後悔を示すことができる。
論文 参考訳(メタデータ) (2023-07-25T09:45:47Z) - ACE: Adaptive Constraint-aware Early Stopping in Hyperparameter
Optimization [18.81207777891714]
適応制約対応早期停止法(ACE)を提案し,HPO中の試行錯誤に制約評価を組み込む。
全体の最適化コストを最小限に抑えるため、ACEは期待される評価コストの理論的解析に基づいて、コスト効果のある制約評価間隔を推定する。
論文 参考訳(メタデータ) (2022-08-04T22:56:16Z) - Efficient Micro-Structured Weight Unification and Pruning for Neural
Network Compression [56.83861738731913]
ディープニューラルネットワーク(DNN)モデルは、特にリソース制限されたデバイスにおいて、実用的なアプリケーションに不可欠である。
既往の非構造的あるいは構造化された重量刈り法は、推論を真に加速することはほとんど不可能である。
ハードウェア互換のマイクロ構造レベルでの一般化された重み統一フレームワークを提案し,高い圧縮と加速度を実現する。
論文 参考訳(メタデータ) (2021-06-15T17:22:59Z) - You Only Compress Once: Towards Effective and Elastic BERT Compression
via Exploit-Explore Stochastic Nature Gradient [88.58536093633167]
既存のモデル圧縮アプローチでは、さまざまなハードウェアデプロイメントに対応するために、さまざまな制約にまたがる再圧縮や微調整が必要となる。
圧縮を一度行い、至るところに展開するための新しいアプローチであるYOCO-BERTを提案する。
最先端のアルゴリズムと比較すると、YOCO-BERTはよりコンパクトなモデルを提供するが、GLUEベンチマークの平均精度は2.1%-4.5%向上している。
論文 参考訳(メタデータ) (2021-06-04T12:17:44Z) - Parallel Predictive Entropy Search for Multi-objective Bayesian
Optimization with Constraints [0.0]
実世界の問題は、しばしば複数の制約の下で複数の目的を最適化する。
本稿では,ブラックボックス関数の同時最適化のための情報ベースバッチ手法であるPESMOCを紹介する。
繰り返して、PESMOCはブラックボックスを評価するための入力場所のバッチを選択する。
論文 参考訳(メタデータ) (2020-04-01T17:37:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。