論文の概要: AI Code Sandboxes: A Comparative Security Study. Part 1 of 2 -- Engine-Level Properties (Attack Surface, Leakage, Stackability, CVE History, Patch Cadence, Fuzzing)
- arxiv url: http://arxiv.org/abs/2606.08433v1
- Date: Sun, 07 Jun 2026 03:20:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.10205
- Title: AI Code Sandboxes: A Comparative Security Study. Part 1 of 2 -- Engine-Level Properties (Attack Surface, Leakage, Stackability, CVE History, Patch Cadence, Fuzzing)
- Title(参考訳): AIコードサンドボックス: 比較セキュリティ研究 第2部 - エンジンレベルプロパティ(Attack Surface, Leakage, Stackability, CVE History, Patch Cadence, Fuzzing)
- Authors: George Andronchik, Pavel Lokhmakov,
- Abstract要約: 本稿では、ホスト攻撃面1.1、情報リーク1.2、詳細なスタックビリティ1.3、公開CVE履歴1.4、パッチケイデンス1.5、上流ファジイング姿勢1.6の6つのエンジンレベルの測定結果をまとめて、ホストカーネルから5つのAIサンドボックス製品がゲストコードを分離する方法を説明する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper reads six engine-level measurements together -- 1.1 host attack surface, 1.2 information leakage, 1.3 defense-in-depth stackability, 1.4 public CVE history, 1.5 patch cadence, and 1.6 upstream fuzzing posture -- to describe how five AI-sandbox products isolate guest code from the host kernel. No single axis is a sufficient basis for a comparative judgement; the cross-axis reading is the load-bearing analysis. Three high-level findings: (1) engine classes (microVM, userspace kernel, OCI container) separate cleanly on every architectural axis, but products within a class do not; (2) product pin policy is the dominant operator-facing variable -- engine-side patch latency aggregates to ~0 days for coordinated disclosures, while downstream lag spans 0 days to 471+ days to "opaque" to infinity; (3) fuzzing investment splits into three tiers, and the strongest combination -- microVM x continuous public fuzzer -- is unoccupied in this set, leaving the "0 published CVEs x no upstream fuzzer x no academic study" intersection structurally unmeasured. We report per-axis orderings, per-product portraits, and a threat-model qualification matrix; no overall ranking is proposed. Companion repository (code, Apache-2.0): https://github.com/orbitalab/RnD-ai-sandboxes-sec-study-part-1. License: CC BY 4.0.
- Abstract(参考訳): 本稿では、ホスト攻撃面1.1、情報リーク1.2、詳細なスタックビリティ1.3、公開CVE履歴1.4、パッチケイデンス1.5、上流ファジイング姿勢1.6の6つのエンジンレベルの測定結果をまとめて、ホストカーネルからAIサンドボックス製品5つのゲストコードを分離する方法を説明する。
単軸は比較判断に十分な基礎を持たず、クロス軸読影はロードベアリング解析である。
1) エンジンクラス(microVM、ユーザスペースカーネル、OCIコンテナ)は、すべてのアーキテクチャ軸をきれいに分離するが、クラス内の製品はそうではない (2) プロダクトピンポリシーは、支配的なオペレーター対応変数 -- エンジンサイドのパッチレイテンシーは、コーディネートされた開示のために ~0日、ダウンストリームラグは、0日から471日から、インフィニティまで"オパク"まで、そして(3) ファジィング投資は、3層に分割され、最強の組み合わせ -- microVM x 連続公開ファジィア -- このセットには、"0 公開された CVEs x no upstream fuzzer x no academic study" は、構造的に測定されていない。
本報告では, 軸方向の注文, 製品ごとの肖像画, 脅威モデル認定行列について報告するが, 総合的なランキングは提案されていない。
Companionリポジトリ (コード, Apache-2.0): https://github.com/orbitalab/RnD-ai-sandboxes-sec-study-part-1
ライセンス:CC BY 4.0。
関連論文リスト
- Diagnosing Overhead in Dispatch Operations: Cross-architecture Observatory [1.081571058570587]
AlltoAllのディスパッチは、MoEの専門家並列性の主要なボトルネックである。
ワークロードに関する2つの仮定をテストするために、DODOCOを導入します。
EPのスケーリングは、各アーキテクチャの計測可能な範囲内で、専門家ごとの最大/平均トークン比を5%以上変更する。
論文 参考訳(メタデータ) (2026-05-20T10:14:00Z) - AgentPulse: A Continuous Multi-Signal Framework for Evaluating AI Agents in Deployment [1.2299000423193074]
静的ベンチマークは、AIエージェントが一定時点で何ができるかを測定するが、どのように採用され、維持され、デプロイの経験があるかは測らない。
AgentPulseは,10のワークロードカテゴリにまたがる50のエージェントを4つの要因から評価する継続的評価フレームワークである。
すべての収集信号、スコア出力、評価ハーネスをCC BY 4.0でリリースする。
論文 参考訳(メタデータ) (2026-04-27T04:48:13Z) - AlphaLab: Autonomous Multi-Agent Research Across Optimization Domains with Frontier LLMs [14.167136550376497]
計算集約ドメインの完全な実験サイクルを自動化する自律的な研究ハーネスであるAlphaLabを紹介する。
ドメインに適応し、データを探索し、分析コードを書き、研究レポートを作成する。
Strategist/Workerループを通じて大規模な実験を実行し、永続的なプレイブックでドメイン知識を蓄積する。
論文 参考訳(メタデータ) (2026-03-31T21:16:20Z) - Scaling DoRA: High-Rank Adaptation via Factored Norms and Fused Kernels [83.99688944263843]
DoRA(Weight-De Low-Rank Adaptation)は、LoRAを方向から分離することで拡張する。
d_in = 8192 とランク r = 384 では、単一のモジュールのノルムは bf16 で512MB の過渡的なワーキングメモリを必要とする。
因子ノルムは、二乗ノルムを O(d_out r + r2) 中間体を通して計算可能な基底、交差、およびグラマー項に分解し、密積を除去する。
論文 参考訳(メタデータ) (2026-03-23T17:57:24Z) - Outrunning LLM Cutoffs: A Live Kernel Crash Resolution Benchmark for All [57.23434868678603]
Live-kBenchは、新たに発見されたカーネルバグのエージェントをスクラップし、評価するセルフ進化ベンチマークの評価フレームワークである。
kEnvは、カーネルのコンパイル、実行、フィードバックのためのエージェントに依存しないクラッシュ解決環境である。
kEnvを用いて3つの最先端エージェントをベンチマークし、最初の試行で74%のクラッシュを解決したことを示す。
論文 参考訳(メタデータ) (2026-02-02T19:06:15Z) - Leveraging ASIC AI Chips for Homomorphic Encryption [12.209134343914537]
ホモモルフィック暗号化(HE)は強力なプライバシー保証を提供するが、平文での計算よりもはるかに多くのリソースを必要とする。
このレイテンシ問題を緩和するためにアクセラレータが登場したが、ASICのコストが高い。
HEプリミティブは、すでにクラウドに広くデプロイされているTPUのような既存のASIC AIアクセラレータ上で、AIオペレータに変換され、アクセラレーションされることを示す。
論文 参考訳(メタデータ) (2025-01-13T04:08:14Z) - KGym: A Platform and Dataset to Benchmark Large Language Models on Linux Kernel Crash Resolution [59.20933707301566]
大規模言語モデル(LLM)は、ますます現実的なソフトウェア工学(SE)タスクにおいて一貫して改善されている。
現実世界のソフトウェアスタックでは、Linuxカーネルのような基本的なシステムソフトウェアの開発にSEの取り組みが費やされています。
このような大規模システムレベルのソフトウェアを開発する際にMLモデルが有用かどうかを評価するため、kGymとkBenchを紹介する。
論文 参考訳(メタデータ) (2024-07-02T21:44:22Z) - S3M: Siamese Stack (Trace) Similarity Measure [55.58269472099399]
本稿では、深層学習に基づくスタックトレースの類似性を計算する最初のアプローチであるS3Mを紹介します。
BiLSTMエンコーダと、類似性を計算するための完全接続型分類器をベースとしている。
私たちの実験は、オープンソースデータとプライベートなJetBrainsデータセットの両方において、最先端のアプローチの優位性を示しています。
論文 参考訳(メタデータ) (2021-03-18T21:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。