論文の概要: SemaTune: Semantic-Aware Online OS Tuning with Large Language Models
- arxiv url: http://arxiv.org/abs/2605.15026v1
- Date: Thu, 14 May 2026 16:25:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-16 00:43:04.135082
- Title: SemaTune: Semantic-Aware Online OS Tuning with Large Language Models
- Title(参考訳): SemaTune: 大規模な言語モデルを備えたセマンティックなオンラインOSチューニング
- Authors: Georgios Liargkovas, Mihir Nitin Joshi, Hubertus Franke, Kostis Kaffes,
- Abstract要約: SemaTuneは、言語モデルガイダンスによる定常OSチューニングのためのホストサイドフレームワークである。
高速ループは低レイテンシ更新を提案し、遅いループは定期的に探索戦略を修正し、提案された変更は型付きバリデーションを通過する。
最大41のLinuxパラメータをチューニングしながら、5つのベンチマークスイートから13のライブワークロード上でSemaTuneを評価する。
- 参考スコア(独自算出の注目度): 1.3799488979862027
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Online OS tuning can improve long-running services, but existing controllers are poorly matched to live hosts. They treat scheduler, power, memory, and I/O controls as black-box variables and optimize a scalar reward. This view ignores cross-knob policy structure, breaks down when application metrics are unavailable, and can send a running service into degraded regions that persist after the bad setting is removed. We present SemaTune, a host-side framework for steady-state OS tuning with bounded language-model guidance. SemaTune turns knob schemas, telemetry, current configuration, recent action--response history, and retrieved prior runs into a compact decision context. A fast loop proposes low-latency updates, a slower loop periodically revises the search strategy, and every proposed change passes through typed validation before reaching kernel or sysctl interfaces. This lets the controller reason about OS-control meaning and indirect performance signals while keeping model cost, latency, and authority constrained. We evaluate SemaTune on 13 live workloads from five benchmark suites while tuning up to 41 Linux parameters. Across the suite, SemaTune improves stable-phase performance by 72.5\% over default settings and by 153.3\% relative to the strongest non-LLM baseline. A 30-window session costs about \$0.20 in model calls. With only host-level metrics, SemaTune still outperforms baselines given direct application objectives by 93.7 percentage points, while avoiding severe degraded regions reached by structure-blind exploration.
- Abstract(参考訳): オンラインOSチューニングは、長時間稼働するサービスを改善することができるが、既存のコントローラはライブホストとあまり一致しない。
スケジューラ、パワー、メモリ、I/Oコントロールをブラックボックス変数として扱い、スカラー報酬を最適化する。
このビューは、クロスノブのポリシー構造を無視し、アプリケーションのメトリクスが利用できないときに停止し、悪い設定が削除された後に持続する劣化したリージョンにランニングサービスを送信できる。
本稿では,言語モデルガイダンスを用いた定常OSチューニングのためのホストサイドフレームワークであるSemaTuneを紹介する。
SemaTuneは、knobスキーマ、テレメトリ、現在の構成、最近のアクション-レスポンス履歴、検索前の実行をコンパクトな決定コンテキストに変換する。
高速ループは低レイテンシ更新を提案し、遅いループは定期的に検索戦略を変更し、提案された変更はカーネルやsysctlインターフェースに到達する前に型付きバリデーションを通過する。
これにより、コントローラはOSコントロールの意味と間接的なパフォーマンス信号について、モデルコスト、レイテンシ、権限の制約を保ちながら判断することができる。
最大41のLinuxパラメータをチューニングしながら、5つのベンチマークスイートから13のライブワークロード上でSemaTuneを評価する。
スイート全体では、SemaTuneはデフォルト設定よりも72.5\%、最強の非LLMベースラインに比べて153.3\%、安定したフェーズパフォーマンスを改善している。
30ウィンドウのセッションはモデルコールで約0.20ドルである。
ホストレベルの測定値だけで、SemaTuneは依然として93.7ポイントの直接適用目標のベースラインを上回っている。
関連論文リスト
- DiscreteRTC: Discrete Diffusion Policies are Natural Asynchronous Executors [57.944744187489185]
外部修正をネイティブなアンマスクに置き換えるDiscreteRTCを提案する。
DiscreteRTCは、非同期のインペインティングのために0行のコードを実装するのが簡単で、スクラッチから生成したアクションに比べてわずか0.7倍の計算速度で推論が高速で、フローベースのRTCに比べて実世界の動的ピックタスクの成功率が50%向上した。
論文 参考訳(メタデータ) (2026-04-27T23:04:03Z) - A Practical Framework for Flaky Failure Triage in Distributed Database Continuous Integration [15.789124858175827]
分散データベース継続的インテグレーション(CI)を効率的かつ信頼性に維持するためには、不安定な障害トリアージが不可欠だ。
SCOUTは、分散データベースCIのための、状態認識型オンライン不確実性を校正したトリアージフレームワークである。
SCOUTは、障害前のテレメトリや厳密な歴史的データなど、厳格な因果関係のみを使用して、ルックアヘッドなしでオンライン決定を行う。
論文 参考訳(メタデータ) (2026-03-24T10:50:25Z) - AsyncVLA: An Asynchronous VLA for Fast and Robust Navigation on the Edge [49.66156306240961]
高レイテンシは制御ループを壊し、リアルタイムデプロイメントでは安全でない強力なモデルをレンダリングする。
リアクティブ実行からセマンティック推論を分離する非同期制御フレームワークであるAsyncVLAを提案する。
AsyncVLAは、最先端のベースラインよりも40%高い成功率を達成する。
論文 参考訳(メタデータ) (2026-02-13T21:31:19Z) - ANCHOR: Branch-Point Data Generation for GUI Agents [52.22377425487]
デスクトップ環境向けのエンドツーエンドGUIエージェントは、大量の高品質なインタラクションデータを必要とする。
本稿では,拡張フレームワークであるAnchorについて紹介する。このフレームワークは,小規模で検証済みのシードデモから,スケーラブルなデスクトップ監視をブートストラップする。
OSWorldとWindowsAgentArenaの標準デスクトップベンチマークの実験では、拡張されたコーパスに微調整されたモデルが一貫した改善を実現している。
論文 参考訳(メタデータ) (2026-02-06T19:55:26Z) - ROMA: Recursive Open Meta-Agent Framework for Long-Horizon Multi-Agent Systems [25.131570054560353]
現在のエージェントフレームワークは、ロングホライゾンタスクでパフォーマンスが低い。
これらの制限に対処するドメインに依存しないフレームワークであるROMAを紹介します。
ROMAとGEPA+が組み合わさって、推論と長文生成のベンチマークにおいて、システムレベルの主要な性能を提供することを示す。
論文 参考訳(メタデータ) (2026-02-02T09:20:59Z) - Hidden States as Early Signals: Step-level Trace Evaluation and Pruning for Efficient Test-Time Scaling [19.080366193748127]
大規模言語モデル(LLM)は、複数のトレースを生成することによって、テスト時間スケーリングを通じて推論能力を向上することができる。
長い推論トレースと多重サンプリングの組み合わせは、相当な計算とエンドツーエンドのレイテンシをもたらす。
隠れ状態を用いて推論ステップを評価する新しいプルーニングフレームワークであるStep-level Trace Evaluation and Pruningを提案する。
論文 参考訳(メタデータ) (2026-01-14T02:54:55Z) - Adaptive Edge-Cloud Inference for Speech-to-Action Systems Using ASR and Large Language Models [0.0]
ASTAは、エッジとクラウドの推論の間で音声コマンドを動的にルーティングする適応型音声対話ソリューションである。
NVIDIA Jetsonベースのエッジプラットフォームにソリューションを実装し、80の音声コマンドの多様なデータセットを使用して評価した。
論文 参考訳(メタデータ) (2025-12-14T17:07:23Z) - Parallax: Runtime Parallelization for Operator Fallbacks in Heterogeneous Edge Systems [6.9060172287001365]
既存のフレームワークは動的制御フロー演算子とサポート対象のカーネルを貧弱に処理し、CPUコアがアイドル状態になり、レイテンシとメモリスパイクが高くなる。
モデルやカスタム演算子実装を使わずに,モバイルDNN推論を高速化するフレームワークであるParallaxを紹介する。
Parallaxは最大で46%のレイテンシ削減を実現し、制御されたメモリオーバーヘッド(平均26.5%)を維持し、最先端のフレームワークと比較して最大30%の省エネを実現している。
論文 参考訳(メタデータ) (2025-12-12T13:07:00Z) - CSGO: Generalized Optimization for Cold Start in Wireless Collaborative Edge LLM Systems [62.24576366776727]
本稿では,全体の推論遅延を最小限に抑えるために,遅延を考慮したスケジューリングフレームワークを提案する。
提案手法は,ベースライン戦略と比較して,コールドスタート遅延を著しく低減することを示す。
論文 参考訳(メタデータ) (2025-08-15T07:49:22Z) - On Controller Tuning with Time-Varying Bayesian Optimization [74.57758188038375]
制御対象とその変更に関する適切な事前知識を用いて、時間変化最適化(TVBO)を用いて、変更環境におけるコントローラのオンラインチューニングを行う。
本研究では,不確実性注入(UI)を用いたTVBO戦略を提案する。
我々のモデルはTVBOの最先端手法よりも優れており、後悔の軽減と不安定なパラメータ構成の低減を実現している。
論文 参考訳(メタデータ) (2022-07-22T14:54:13Z) - Better than the Best: Gradient-based Improper Reinforcement Learning for
Network Scheduling [60.48359567964899]
パケット遅延を最小限に抑えるため,制約付き待ち行列ネットワークにおけるスケジューリングの問題を考える。
我々は、利用可能な原子ポリシーよりも優れたスケジューラを生成するポリシー勾配に基づく強化学習アルゴリズムを使用する。
論文 参考訳(メタデータ) (2021-05-01T10:18:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。