論文の概要: Bit-Exact AI Inference Verification Without Performance Tradeoffs
- arxiv url: http://arxiv.org/abs/2606.00279v2
- Date: Fri, 05 Jun 2026 13:54:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.269926
- Title: Bit-Exact AI Inference Verification Without Performance Tradeoffs
- Title(参考訳): パフォーマンストレードオフのないBit-Exact AI推論検証
- Authors: Naci Cankaya,
- Abstract要約: カバー敵は、監視された計算において検証不可能な自由度を利用することができる。
現代の推論エンジンが決定論的だが不変ではない出力をいかに生み出すかを分析する。
ビットワイズな再計算は同一ハードウェアへのアクセスを必要としないことを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Verifying claims about AI workloads is a prerequisite for credible AI governance of covert adversaries (who comply with monitoring only when detection likelihood is high), yet the apparent non-determinism of GPU floating-point arithmetic forces auditors to accept approximate output matches. Covert adversaries can exploit unverifiable degrees of freedom in monitored computation. Attack vectors include steganography, unreported modification of inference software, and covert computation via unreported batch elements. Empirically, we analyze how modern inference engines (vLLM, HF transformers) produce deterministic but non-invariant outputs, without needing to set performance-compromising determinism flags, if the right information is available for re-computation and no atomic functions are called in the backend. We demonstrate that such bitwise-precise re-computation does not require access to identical hardware, via a software-only emulation of LLM inference across multiple NVIDIA GPU variants. Thus, accumulated rounding errors can be an auditable signature of the software and hardware setup used for inference, instead of a constraint on verifiability.
- Abstract(参考訳): AIワークロードに関する主張を検証することは、秘密の敵(検出可能性が高い場合にのみ監視に従う)の信頼できるAIガバナンスの前提条件であるが、GPU浮動小数点演算の明らかに非決定性は、監査人に近似出力マッチを受け入れるように強制する。
カバー敵は、監視された計算において検証不可能な自由度を利用することができる。
攻撃ベクトルには、ステガノグラフィ、未報告の推論ソフトウェアの変更、未報告のバッチ要素による秘密計算が含まれる。
提案手法は,最新の推論エンジン (vLLM, HF 変換器) がどのようにして決定論的だが不変な出力を生成するのかを,性能を妥協する決定性フラグを設定することなく解析する。
このようなビットワイズな再計算は、複数のNVIDIA GPU変種にまたがるLLM推論のソフトウェアのみのエミュレーションを通じて、同一ハードウェアへのアクセスを必要としないことを実証する。
したがって、累積ラウンドエラーは、検証可能性の制約ではなく、推論に使用されるソフトウェアとハードウェア設定の監査可能なシグネチャとなる。
関連論文リスト
- LiveFMBench: Unveiling the Power and Limits of Agentic Workflows in Specification Generation [75.05397479715576]
大規模言語モデル(LLM)とエージェントは有望な進歩を示しているが、その真の能力と失敗モードは未だ不明である。
CプログラムのためのLCMおよびエージェントベースの形式仕様生成に関する、最初の体系的および汚染に配慮した研究を提案する。
論文 参考訳(メタデータ) (2026-05-02T11:31:33Z) - Dynamic analysis enhances issue resolution [53.50448142467294]
DAIRA(Dynamic Analysis-enhanced Issue Resolution Agent)は、エージェントの推論サイクルに動的解析を組み込む自動修復フレームワークである。
テストトレース駆動の方法論によって駆動されるDAIRAは、軽量モニタを使用して重要なランタイムデータを抽出する。
Gemini 3 Flash Previewを使用すると、DAIRAは新たな最先端(SOTA)パフォーマンスを確立し、SWE-bench Verifiedデータセットで79.4%の解像度を達成する。
論文 参考訳(メタデータ) (2026-03-23T14:48:54Z) - IMMACULATE: A Practical LLM Auditing Framework via Verifiable Computation [49.796717294455796]
経済的なモチベーションのある逸脱を検出するための実践的な監査フレームワークIMMACULATEを提案する。
IMMACULATEは、検証可能な計算を用いて少数のリクエストを選択的に監査し、暗号オーバーヘッドを償却しながら強力な検出保証を達成する。
論文 参考訳(メタデータ) (2026-02-26T07:21:02Z) - EigenAI: Deterministic Inference, Verifiable Results [3.231493128964671]
EigenAIは、EigenLayerの再試行エコシステムの上に構築された検証可能なAIプラットフォームである。
決定論的大言語モデル(LLM)推論エンジンと、暗号学的に保護された楽観的な再実行プロトコルを組み合わせる。
論文 参考訳(メタデータ) (2026-01-30T04:46:22Z) - Nondeterminism-Aware Optimistic Verification for Floating-Point Neural Networks [11.159101812934503]
不均一加速器上での浮動小数点実行のための非決定論的アウェア最適検証プロトコル
NAOをPyTorch互換ランタイムとして実装し、現在Horeskyテストネット上にデプロイされているコントラクト層を運用しています。
論文 参考訳(メタデータ) (2025-10-15T21:10:39Z) - Unsupervised Conformal Inference: Bootstrapping and Alignment to Control LLM Uncertainty [49.19257648205146]
生成のための教師なし共形推論フレームワークを提案する。
我々のゲートは、分断されたUPPよりも厳密で安定した閾値を提供する。
その結果は、ラベルのない、API互換の、テスト時間フィルタリングのゲートになる。
論文 参考訳(メタデータ) (2025-09-26T23:40:47Z) - \texttt{Range-Arithmetic}: Verifiable Deep Learning Inference on an Untrusted Party [14.282969274113066]
textttRange-Arithmeticは、非算術演算をsum-checkプロトコルとMatrixd Rangeを使って検証可能なステップに変換する。
提案手法は,既存手法の性能に適合するだけでなく,計算コストの低減も図っている。
論文 参考訳(メタデータ) (2025-05-23T08:33:50Z) - WATCH: Adaptive Monitoring for AI Deployments via Weighted-Conformal Martingales [22.789611187514975]
非パラメトリックシーケンシャルテストのメソッド -- 特にコンフォーマルテストマーチンチャル(CTM)と任意の時間価推論 -- は、この監視タスクに有望なツールを提供する。
既存のアプローチは、限られた仮説クラスやアラーム基準の監視に限られています。」
論文 参考訳(メタデータ) (2025-05-07T17:53:47Z) - Are You Getting What You Pay For? Auditing Model Substitution in LLM APIs [71.7892165868749]
LLM(Commercial Large Language Model) APIは基本的な信頼の問題を生み出します。
ユーザーは特定のモデルに課金するが、プロバイダが忠実に提供できることを保証することはない。
我々は,このモデル置換問題を定式化し,現実的な逆条件下での検出方法を評価する。
我々は,信頼された実行環境(TEE)を実用的で堅牢なソリューションとして使用し,評価する。
論文 参考訳(メタデータ) (2025-04-07T03:57:41Z) - Auditing AI models for Verified Deployment under Semantic Specifications [65.12401653917838]
AuditAIは、解釈可能な形式検証とスケーラビリティのギャップを埋める。
AuditAIは、画素空間の摂動のみを用いた検証の限界に対処しながら、検証と認定トレーニングのための制御されたバリエーションを得られるかを示す。
論文 参考訳(メタデータ) (2021-09-25T22:53:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。