論文の概要: TIMEGATE: Sustainable Time-Boxed Promotion Gates for Continual ML Adaptation Under Resource Constraints
- arxiv url: http://arxiv.org/abs/2605.29183v2
- Date: Sun, 31 May 2026 20:02:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 18:24:16.723476
- Title: TIMEGATE: Sustainable Time-Boxed Promotion Gates for Continual ML Adaptation Under Resource Constraints
- Title(参考訳): TIMEGATE: リソース制約下での継続的ML適応のための持続的タイムボックスプロモーションゲート
- Authors: Abhijit Chakraborty, Suddhasvatta Das, Yash Shah, Vivek Gupta, Kevin A. Gary,
- Abstract要約: 予算時間、ラベル付け、トレーニング、評価による適応を管理する政策層であるTIMEGATEを紹介する。
i)アダルト表の2.3倍のラベル付け,(ii)SST-2のLLaMA-3.1-8B + QLoRAへの変換,(iii)Mは情報であり,28細胞感度はMが狭い閾値で0.81に低下することを示す。
- 参考スコア(独自算出の注目度): 7.277181020364616
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As machine learning(ML) systems evolve to continual adaptation, each re-training cycle uses compute, annotation, and energy. We introduce TIMEGATE, a policy layer managing adaptation by budgeting time, labeling, training, and evaluation. TIMEGATE emits a metric-availability signal M for partial vs. full-evaluation decisions. We validate: (i) labeling outperforms training by 2.3x on Adult tabular; (ii) it transfers to LLaMA-3.1-8B + QLoRA on SST-2 (accuracy 0.80 to 0.96; M =1 in 35/36 runs); (iii) M is informative, 28-cell sensitivity shows M drops to 0.81 at tight thresholds; (iv) 100-cycle simulation achieves 66% evaluation-compute savings with no silent mis-promotions; (v) 10%-slice evaluation on LLaMA uses 89% less wall-clock and energy on a single H200 (ratios agree to 0.2%).
- Abstract(参考訳): 機械学習(ML)システムが継続的適応へと進化するにつれて、各再学習サイクルは計算、アノテーション、エネルギーを使用する。
予算時間、ラベル付け、トレーニング、評価による適応を管理する政策層であるTIMEGATEを紹介する。
TIMEGATEは、部分的対完全評価判定のためのメートル法可用性信号Mを出力する。
検証します。
(i)大人用表紙の2.3倍の訓練成績
(ii)SST-2上でLLaMA-3.1-8B + QLoRAに転送する(精度0.80から0.96、35/36ランでM =1)。
三)Mは情報であり、28セル感度は、Mが狭い閾値で0.81に低下することを示す。
(四)100サイクルシミュレーションは、無言の誤動作を伴わず、66%の評価計算貯蓄を達成する。
(v)LLaMAの10%スライス評価では、1つのH200では89%のウォールクロックとエネルギーを使用する(比は0.2%)。
関連論文リスト
- Learning-Zone Energy: Online Data Selection for Efficient RL Post-Training [28.00739954235118]
そこで本研究では,モデルにおけるアクティブな学習フロンティアに焦点をあてた,理論的基盤を持つ完全オンラインデータ選択フレームワークを提案する。
リプレイ付きフォワードプルーナーは、永続的に解決されたプロンプトのロールアウト生成をスキップすることで、ウォールクロック時間コストをさらに低減する。
我々の方法は1ステップあたりのトレーニングデータの40%しか保持しないが、完全なデータベースラインにマッチまたは超えている。
論文 参考訳(メタデータ) (2026-05-16T14:01:12Z) - TEMPO: Scaling Test-time Training for Large Reasoning Models [87.61789183311856]
テストタイムトレーニング(TTT)は、推論時間中にラベルのないテストインスタンスにモデルパラメータを適用する。
TTTフレームワークであるTEMPOを提案する。これは、ラベル付きデータセット上で定期的な批評家の再検討を行い、ラベル付き質問に対するポリシー修正をインターリーブする。
論文 参考訳(メタデータ) (2026-04-21T10:01:04Z) - When Adaptive Rewards Hurt: Causal Probing and the Switching-Stability Dilemma in LLM-Guided LEO Satellite Scheduling [1.0152838128195467]
衛星スケジューリングにおける深い強化学習のための適応的な報酬設計は、レギュラーアウェアの報酬重みが静的なよりも優れているという直感によって動機付けられている。
PPOは値関数収束のために定常的な報酬信号を必要とするため、ほぼ安定な報酬重み(342.1 Mbps)は慎重に調整された動的重み(103.396.8 Mbps)より優れていることを示す。
論文 参考訳(メタデータ) (2026-04-04T03:04:53Z) - Bayesian Uncertainty Quantification with Anchored Ensembles for Robust EV Power Consumption Prediction [0.8602553195689513]
EVパワー推定は、レンジ予測とエネルギー管理の基盤となっているが、実践者はポイント精度と信頼できる不確実性の両方を必要としている。
本稿では,不確かさを両立させるアンロックアンサンブル長短記憶(LSTM)を提案する。
RMSE 3.36 +/- 1.10, MAE 2.21 +/- 0.89, R-squared = 0.93 +/- 0.02, 共分散 0.93 +/- 0.02 を解析し, ほぼノルミナルカバレッジを持つよく校正された不確かさ帯域を提供する。
論文 参考訳(メタデータ) (2025-11-09T20:49:42Z) - Generalizable Diabetes Risk Stratification via Hybrid Machine Learning Models [0.0]
糖尿病は世界中で5億3700万人を超え、2045年までに7億8300万人に達すると予測されている。
2つのハイブリッド分類器を比較し、外部コホート上での一般化性を評価する。
論文 参考訳(メタデータ) (2025-09-24T21:18:52Z) - Squeeze the Soaked Sponge: Efficient Off-policy Reinforcement Finetuning for Large Language Model [56.92219181993453]
本稿では,PPOやGRPOなどのオンラインRFT手法をオフ・ポリティクスデータに活用するために,Reincarnating Mix-policy Proximal Policy Gradient (ReMix)を提案する。
ReMix は,(1) 効率的なトレーニングのための更新データ(UTD)比が増大した混成政策勾配,(2) 安定性と柔軟性のトレードオフのバランスをとるためのKL-Convex 政策制約,(3) 効率的な早期学習から安定した改善へのシームレスな移行を実現するための政策再編成の3つの主要な構成要素から構成される。
論文 参考訳(メタデータ) (2025-07-09T14:29:45Z) - EfficientLLM: Efficiency in Large Language Models [64.3537131208038]
大規模言語モデル(LLM)は大きな進歩を導いてきたが、その増加とコンテキストウィンドウは計算、エネルギー、金銭的コストを禁止している。
本稿では,新しいベンチマークであるEfficientLLMを紹介する。
論文 参考訳(メタデータ) (2025-05-20T02:27:08Z) - Comment on Stochastic Polyak Step-Size: Performance of ALI-G [104.83776736573009]
ALI-GとSPSはどちらも、機械学習モデルを最適化するためにPolyakのステップサイズを適応したものである。
CIFAR-10 と CIFAR-100 で ResNet-34 のトレーニングを行う場合,ALI-G は 93.5% (+6%) と 76% (+8%) と非常に少ないチューニングでそれぞれ到達可能であることを示す。
論文 参考訳(メタデータ) (2021-05-20T19:57:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。