論文の概要: ProbeLogits: Kernel-Level LLM Inference Primitives for AI-Native Operating Systems
- arxiv url: http://arxiv.org/abs/2604.11943v1
- Date: Mon, 13 Apr 2026 18:32:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 19:11:32.060425
- Title: ProbeLogits: Kernel-Level LLM Inference Primitives for AI-Native Operating Systems
- Title(参考訳): ProbeLogits: AIネイティブオペレーティングシステムのためのカーネルレベルLLM推論プリミティブ
- Authors: Daeyeon Son,
- Abstract要約: LLM推論を内部で実行するOSカーネルは、任意のテキストが生成される前にロジット分布を読み取ることができる。
ProbeLogitsはカーネルレベルのオペレーションで、単一のフォワードパスを実行し、特定のトークンログを読み、エージェントアクションを安全か危険であると分類します。
私はAnima OSでProbeLogitsを実装しています。これは、80,400行のRustで書かれたベアメタルのx86_64 OSです。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: An OS kernel that runs LLM inference internally can read logit distributions before any text is generated -- and act on them as a governance primitive. I present ProbeLogits, a kernel-level operation that performs a single forward pass and reads specific token logits to classify agent actions as safe or dangerous, with zero learned parameters. On a 260-prompt OS action benchmark (9 categories including adversarial attacks), ProbeLogits achieves F1=0.980, Precision=1.000, and Recall=0.960 using a general-purpose 7B model at 4-bit quantization. On ToxicChat (1,000 human-annotated real conversations), it achieves F1=0.790 at default calibration strength $α$=1.0, improving to F1=0.837 at $α$=0.5 -- 89% of Llama Guard 3's F1~0.939 with zero learned parameters. A key design contribution is the calibration strength $α$, which serves as a deployment-time policy knob rather than a learned hyperparameter. By adjusting $α$, the OS can enforce strict policies for privileged operations ($α\geq 0.8$, maximizing recall) or relaxed policies for conversational agents ($α$=0.5, maximizing precision). Contextual calibration improves accuracy from 64.8% to 97.3% on the custom benchmark. I implement ProbeLogits within Anima OS, a bare-metal x86_64 OS written in 80,400 lines of Rust. Because agent actions must pass through kernel-mediated host functions, ProbeLogits enforcement operates below the WASM sandbox boundary, making it significantly harder to circumvent than application-layer classifiers. Each classification costs 65ms on 7B -- fast enough for per-action governance. I also show that treating KV cache as process state enables checkpoint, restore, and fork operations analogous to traditional process management. To my knowledge, no prior system exposes LLM logit vectors as OS-level governance primitives.
- Abstract(参考訳): LLM推論を内部で実行するOSカーネルは、テキストが生成される前にロジット分布を読み取ることができ、ガバナンスプリミティブとして機能する。
ProbeLogitsはカーネルレベルのオペレーションで、単一のフォワードパスを実行し、特定のトークンログを読み、エージェントアクションを安全または危険と分類し、学習パラメータをゼロにする。
260プロンプトのOSアクションベンチマーク(敵攻撃を含む9つのカテゴリ)では、ProbeLogitsはF1=0.980、Precision=1.000、Recall=0.960を4ビット量子化時に汎用7Bモデルを用いて達成している。
ToxicChat (1,000人の人間による実際の会話)では、デフォルトキャリブレーション強度$α$=1.0でF1=0.790を達成し、学習パラメータがゼロのラマガード3のF1~0.939のF1=0.837を$α$=0.5でF1=0.837に改善した。
主要な設計コントリビューションはキャリブレーション強度$α$であり、これは学習されたハイパーパラメータではなく、デプロイ時のポリシーノブとして機能する。
α$を調整することで、OSは特権操作の厳格なポリシー(α\geq 0.8$、リコールの最大化)や会話エージェントの緩和ポリシー(α$=0.5、精度の最大化)を強制することができる。
コンテキストキャリブレーションにより、カスタムベンチマークでは64.8%から97.3%に精度が向上する。
私はAnima OSでProbeLogitsを実装しています。これは、80,400行のRustで書かれたベアメタルのx86_64 OSです。
エージェントアクションはカーネルを介するホスト関数を経由しなければならないため、ProbeLogitsの実行はWASMサンドボックス境界の下で動作し、アプリケーション層分類器よりも回避が極めて難しい。
それぞれの分類は7Bで65ミリ秒かかります。
また、KVキャッシュをプロセス状態として扱うことで、従来のプロセス管理と同様のチェックポイント、リストア、フォーク操作が可能になります。
私の知る限り、LLMロジットベクトルをOSレベルのガバナンスプリミティブとして公開する以前のシステムはありません。
関連論文リスト
- $λ_A$: A Typed Lambda Calculus for LLM Agent Composition [2.1900658889606097]
エージェント合成のための計算である$_A$を提示し、単に型付けされた計算をオラクルコール、有界固定点、可変環境で拡張する。
動作意味論から構造的構成誤差を直接検出するlintツールを作成した。
LLMエージェント合成のための統一計算として、$_A$が$_A$のフラグメントを埋め込み、$_A$を確立する。
論文 参考訳(メタデータ) (2026-04-13T17:39:23Z) - SkillSieve: A Hierarchical Triage Framework for Detecting Malicious AI Agent Skills [0.0]
SkillSieveは3層検出フレームワークで、必要に応じてより深く分析する。
400スキルのラベル付きベンチマークでは、SkillSieveは0.800 F1を達成し、ClawVetの0.421を上回った。
論文 参考訳(メタデータ) (2026-04-08T00:58:48Z) - ML Defender (aRGus NDR): An Open-Source Embedded ML NIDS for Botnet and Anomalous Traffic Detection in Resource-Constrained Organizations [0.0]
本稿では,C++20で構築された,150-200 USDのコモディティハードウェア上にデプロイ可能なオープンソースのネットワーク侵入検知システムを提案する。
ML Defenderは、eBPF/XDPパケットキャプチャ、ZeroMQトランスポート、Protocol Buffersシリアライゼーションの6成分パイプラインを実装している。
Ransomware Threat Winsポリシーは、ML推論を用いて両方のスコアの最大演算を選択し、偽陽性を抑える。
論文 参考訳(メタデータ) (2026-04-03T05:20:13Z) - LLM Readiness Harness: Evaluation, Observability, and CI Gates for LLM/RAG Applications [51.56484100374058]
評価をデプロイメント決定ワークフローに変換するLLMおよびRAGアプリケーションのための準備性ハーネスを提案する。
このシステムは、最小限のAPI契約の下で、自動ベンチマーク、OpenTelemetryオブザーバビリティ、CI品質ゲートを組み合わせる。
チケットルーティングとBEIRタスクのハーネスを、完全なAzureマトリックスカバレッジで評価する。
論文 参考訳(メタデータ) (2026-03-28T18:03:32Z) - Synthesizing the Kill Chain: A Zero-Shot Framework for Target Verification and Tactical Reasoning on the Edge [12.201060368447251]
本稿では,コンパクトな視覚言語モデル(VLM)を用いた軽量物体検出を実現する階層型ゼロショットフレームワークを提案する。
我々は,このパイプラインを,偽陽性フィルタリング(100%精度),損傷評価(97.5%),きめ細かい車両分類(55-90%)の3つのタスクで,バトルフィールド6の55個の高忠実合成ビデオ上で評価した。
論文 参考訳(メタデータ) (2026-02-10T23:00:19Z) - SOPBench: Evaluating Language Agents at Following Standard Operating Procedures and Constraints [59.645885492637845]
SOPBenchは、各サービス固有のSOPコードプログラムを実行可能な関数の有向グラフに変換する評価パイプラインである。
提案手法では,各サービス固有のSOPコードプログラムを実行可能関数の有向グラフに変換し,自然言語SOP記述に基づいてこれらの関数を呼び出しなければならない。
我々は18の先行モデルを評価し、上位モデルでさえタスクが困難であることを示す。
論文 参考訳(メタデータ) (2025-03-11T17:53:02Z) - Model Surgery: Modulating LLM's Behavior Via Simple Parameter Editing [63.20133320524577]
パラメータの小さなサブセットを編集することで、大きな言語モデル(LLM)の特定の振る舞いを効果的に調節できることを示す。
我々の手法は、RealToxicityPromptsデータセットで最大90.0%の毒性を減少させ、ToxiGenで49.2%を達成する。
論文 参考訳(メタデータ) (2024-07-11T17:52:03Z) - Acting in Delayed Environments with Non-Stationary Markov Policies [57.52103323209643]
本稿では,MDPにおける学習と計画のためのフレームワークについて紹介する。
実行が遅れると、元の状態空間における決定論的マルコフポリシーは最大報酬を得るのに十分であるが、非定常である必要があることを証明します。
我々は、状態拡張に頼らずに遅延実行タスクを解く非定常Q学習スタイルのモデルベースアルゴリズムを考案した。
論文 参考訳(メタデータ) (2021-01-28T13:35:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。