Fugu-MT 論文翻訳(概要): ProbeLogits: Kernel-Level LLM Inference Primitives for AI-Native Operating Systems

論文の概要: ProbeLogits: Kernel-Level LLM Inference Primitives for AI-Native Operating Systems

arxiv url: http://arxiv.org/abs/2604.11943v2
Date: Sat, 18 Apr 2026 06:28:19 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-21 13:51:31.091316
Title: ProbeLogits: Kernel-Level LLM Inference Primitives for AI-Native Operating Systems
Title（参考訳）: ProbeLogits: AIネイティブオペレーティングシステムのためのカーネルレベルLLM推論プリミティブ
Authors: Daeyeon Son,
Abstract要約: LLM推論を内部で実行するOSカーネルは、任意のテキストが生成される前にロジット分布を読み取ることができる。本稿では,シングルフォワードパスを実行するカーネルレベルの操作であるProbeLogitsについて述べる。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: An OS kernel that runs LLM inference internally can read logit distributions before any text is generated and act on them as a governance primitive. This paper presents ProbeLogits, a kernel-level operation that performs a single forward pass and reads specific token logits to classify agent actions as safe or dangerous, with zero learned parameters. I evaluate ProbeLogits across three base models (Qwen 2.5-7B, Llama 3 8B, Mistral 7B) on three external benchmarks: HarmBench, XSTest, and ToxicChat. On HarmBench non-copyright (n=300), all three models reach 97-99% block rate with the right verbalizer. On ToxicChat (n=1,000), ProbeLogits achieves F1 parity-or-better against Llama Guard 3 in the same hosted environment: the strongest configuration (Qwen 2.5-7B Safe/Dangerous, alpha=0.0) reaches F1=0.812 with bootstrap 95% CIs disjoint from LG3 (+13.7pp significant); Llama 3 S/D matches LG3 within CI (+0.4pp, parity); Mistral Y/N exceeds by +4.4pp. Latency is approximately 2.5x faster than LG3 in the same hosted environment because the primitive reads a single logit position instead of generating tokens; in the bare-metal native runtime ProbeLogits drops to 65 ms. A key design contribution is the calibration strength alpha, which serves as a deployment-time policy knob rather than a learned hyperparameter. Contextual calibration corrects verbalizer prior asymmetry, with bias magnitude varying by (model, verbalizer) pair. I implement ProbeLogits within Anima OS, a bare-metal x86_64 OS written in approximately 86,000 lines of Rust. Because agent actions must pass through 15 kernel-mediated host functions, ProbeLogits enforcement operates below the WASM sandbox boundary, making it significantly harder to circumvent than application-layer classifiers.
Abstract（参考訳）: LLM推論を内部で実行するOSカーネルは、任意のテキストが生成される前にログの配布を読み取ることができ、ガバナンスプリミティブとして機能する。本稿では,シングルフォワードパスを実行するカーネルレベルの操作であるProbeLogitsを提案する。私は3つのベースモデル(Qwen 2.5-7B、Llama 3 8B、Mistral 7B)で、HarmBench、XSTest、ToxicChatの3つの外部ベンチマークでProbeLogitsを評価します。 HarmBench non-copyright (n=300) では、3つのモデル全てが97-99%のブロックレートに達している。最強構成(Qwen 2.5-7B Safe/Dangerous, alpha=0.0)は、ブートストラップ 95% CIs disjoint from LG3 (+13.7pp significant)、Llama 3 S/D match LG3 within CI (+0.4pp, parity)、Mistral Y/N exceeds +4.4pp。プリミティブがトークンを生成する代わりに単一のロジット位置を読み取るため、同じホスト環境では、レイテンシはLG3よりも約2.5倍高速である。ベアメタルのネイティブランタイムであるProbeLogitsは65msに低下する。主要な設計コントリビューションはキャリブレーション強度アルファである。これは学習されたハイパーパラメータではなく、デプロイメント時のポリシノブとして機能する。文脈キャリブレーションは非対称性の前の動詞化を補正し、バイアスの度合いは(モデル、動詞化)ペアによって変化する。私はAnima OSでProbeLogitsを実装しています。これは約86,000行のRustで書かれたベアメタルのx86_64 OSです。エージェントアクションは15のカーネルを介するホスト関数を通さなければならないため、ProbeLogitsの実行はWASMサンドボックス境界の下で動作し、アプリケーション層分類器よりも回避が極めて難しい。

関連論文リスト

$λ_A$: A Typed Lambda Calculus for LLM Agent Composition [2.1900658889606097]
エージェント合成のための計算である$_A$を提示し、単に型付けされた計算をオラクルコール、有界固定点、可変環境で拡張する。動作意味論から構造的構成誤差を直接検出するlintツールを作成した。 LLMエージェント合成のための統一計算として、$_A$が$_A$のフラグメントを埋め込み、$_A$を確立する。
論文参考訳（メタデータ） (2026-04-13T17:39:23Z)
SkillSieve: A Hierarchical Triage Framework for Detecting Malicious AI Agent Skills [0.0]
SkillSieveは3層検出フレームワークで、必要に応じてより深く分析する。 400スキルのラベル付きベンチマークでは、SkillSieveは0.800 F1を達成し、ClawVetの0.421を上回った。
論文参考訳（メタデータ） (2026-04-08T00:58:48Z)
ML Defender (aRGus NDR): An Open-Source Embedded ML NIDS for Botnet and Anomalous Traffic Detection in Resource-Constrained Organizations [0.0]
本稿では,C++20で構築された,150-200 USDのコモディティハードウェア上にデプロイ可能なオープンソースのネットワーク侵入検知システムを提案する。 ML Defenderは、eBPF/XDPパケットキャプチャ、ZeroMQトランスポート、Protocol Buffersシリアライゼーションの6成分パイプラインを実装している。 Ransomware Threat Winsポリシーは、ML推論を用いて両方のスコアの最大演算を選択し、偽陽性を抑える。
論文参考訳（メタデータ） (2026-04-03T05:20:13Z)
LLM Readiness Harness: Evaluation, Observability, and CI Gates for LLM/RAG Applications [51.56484100374058]
評価をデプロイメント決定ワークフローに変換するLLMおよびRAGアプリケーションのための準備性ハーネスを提案する。このシステムは、最小限のAPI契約の下で、自動ベンチマーク、OpenTelemetryオブザーバビリティ、CI品質ゲートを組み合わせる。チケットルーティングとBEIRタスクのハーネスを、完全なAzureマトリックスカバレッジで評価する。
論文参考訳（メタデータ） (2026-03-28T18:03:32Z)
Synthesizing the Kill Chain: A Zero-Shot Framework for Target Verification and Tactical Reasoning on the Edge [12.201060368447251]
本稿では,コンパクトな視覚言語モデル(VLM)を用いた軽量物体検出を実現する階層型ゼロショットフレームワークを提案する。我々は,このパイプラインを,偽陽性フィルタリング(100%精度),損傷評価(97.5%),きめ細かい車両分類(55-90%)の3つのタスクで,バトルフィールド6の55個の高忠実合成ビデオ上で評価した。
論文参考訳（メタデータ） (2026-02-10T23:00:19Z)
SOPBench: Evaluating Language Agents at Following Standard Operating Procedures and Constraints [59.645885492637845]
SOPBenchは、各サービス固有のSOPコードプログラムを実行可能な関数の有向グラフに変換する評価パイプラインである。提案手法では,各サービス固有のSOPコードプログラムを実行可能関数の有向グラフに変換し,自然言語SOP記述に基づいてこれらの関数を呼び出しなければならない。我々は18の先行モデルを評価し、上位モデルでさえタスクが困難であることを示す。
論文参考訳（メタデータ） (2025-03-11T17:53:02Z)
Model Surgery: Modulating LLM's Behavior Via Simple Parameter Editing [63.20133320524577]
パラメータの小さなサブセットを編集することで、大きな言語モデル(LLM)の特定の振る舞いを効果的に調節できることを示す。我々の手法は、RealToxicityPromptsデータセットで最大90.0%の毒性を減少させ、ToxiGenで49.2%を達成する。
論文参考訳（メタデータ） (2024-07-11T17:52:03Z)
Acting in Delayed Environments with Non-Stationary Markov Policies [57.52103323209643]
本稿では,MDPにおける学習と計画のためのフレームワークについて紹介する。実行が遅れると、元の状態空間における決定論的マルコフポリシーは最大報酬を得るのに十分であるが、非定常である必要があることを証明します。我々は、状態拡張に頼らずに遅延実行タスクを解く非定常Q学習スタイルのモデルベースアルゴリズムを考案した。
論文参考訳（メタデータ） (2021-01-28T13:35:37Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。