論文の概要: Zero knowledge verification for frontier AI training is possible
- arxiv url: http://arxiv.org/abs/2606.05433v1
- Date: Wed, 03 Jun 2026 20:57:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-05 22:39:44.399574
- Title: Zero knowledge verification for frontier AI training is possible
- Title(参考訳): フロンティアAIトレーニングのためのゼロ知識検証が可能
- Authors: Pierre Peigné, Ky Nguyen, Paul Wang,
- Abstract要約: 本稿では,フロンティア高密度事前学習のための検証アーキテクチャを提案する。
これは、事前コミットされたトレーニング仕様、ノード間ネットワーク観測、中間計算のオンザフライメルクルコミットメントを組み合わせたものである。
単桁のトレーニング側オーバーヘッドで36ヶ月以内に、デプロイ可能な概念実証を見積もる。
- 参考スコア(独自算出の注目度): 1.4177719559608997
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Frontier AI governance frameworks increasingly use cumulative training compute as the primary criterion for designating high-impact models, but enforcement rests on self-reporting because no technical verification primitive for training exists. Any future international agreement on frontier AI faces the same problem at higher stakes: coordinated regulation of technologies with significant externalities has historically rested on technical verification, without which agreements are declaratory. Recent governance analyses judge zero-knowledge proofs a promising candidate but currently impractical at frontier scale [26, 4]. We argue the impracticality is paradigm-bound rather than fundamental, and propose a verification architecture for frontier dense pre-training combining a pre-committed training specification, inter-node network observations, and on-the-fly Merkle commitments of intermediate computation, verified through a zero-knowledge Virtual Machine (zkVM) with native BF16/FP32 precompiles. The proof checks the actual floating-point computation the GPU performed rather than a fixed-point approximation, and preserves model-architecture confidentiality through a private training specification. The protocol produces three proof types: a genesis proof at initialisation, in-training step proofs across the run, and ex-ante attestations enforcing policy-relevant claims as running invariants, turning the training record into a governance-enforceable artefact. We estimate a deployable proof of concept within approximately 36 months at single-digit-percent training-side overhead, against a six-to-ten-year cycle for verification-grade custom silicon. Thirteen open research and engineering problems are catalogued as a research agenda for external contribution
- Abstract(参考訳): 最前線のAIガバナンスフレームワークは、ハイインパクトモデルを指定するための主要な基準として累積的トレーニング計算を使用することが多いが、訓練のための技術的検証プリミティブは存在しないため、実施は自己報告に依存している。
重要な外部性を持つ技術の協調的な規制は、歴史的に技術的検証に委ねられており、合意が宣言されていない。
最近のガバナンス分析では、ゼロ知識は有望な候補であるが、現在、フロンティアスケールでは実践的でないことが証明されている [26, 4]。
提案手法は,ゼロ知識仮想マシン(zkVM)とネイティブなBF16/FP32プリコンパイルを用いて検証された,事前コミットされたトレーニング仕様,ノード間ネットワーク観測,中間計算のマークルコミットメントを組み合わせた,フロンティア密集事前学習のための検証アーキテクチャを提案する。
この証明は、固定点近似ではなくGPUが実行した実際の浮動小数点計算をチェックし、プライベートトレーニング仕様を通じてモデルアーキテクチャの機密性を保存する。
このプロトコルは3つの証明タイプを生成する: 初期化時の生成証明、実行中のステップ証明、およびポリシー関連クレームを不変(invariant)の実行として強制する元証明、そしてトレーニングレコードをガバナンス強化可能なアーティファクトに変換する。
我々は,1桁のトレーニング側オーバーヘッドで約36ヶ月以内に,検証グレードのカスタムシリコンの6年から10年サイクルに対して,デプロイ可能な概念証明を推定する。
外部貢献のための研究課題として、13のオープンリサーチとエンジニアリングの課題がリストアップされる
関連論文リスト
- VASO: Formally Verifiable Self-Evolving Skills for Physical AI Agents [57.240036084348354]
本稿では,ロボットスキルコントラクトの検証誘導自己進化のためのフレームワークであるVASOを紹介する。
VASOは論理的に一貫性のないスキル契約を検証し、グローバルおよびローカルな時間的仕様に対してスキルによって誘発される計画を検証する。
Clearpath Jackal と PX4 のクアッドコプタータスクでは、VASO は100点未満の最適化サンプルを使用して97.2% の形式的な仕様準拠に達した。
論文 参考訳(メタデータ) (2026-06-03T20:02:35Z) - Only Say What You Know: Calibration-Aware Generation for Long-Form Factuality [64.83776302639727]
大規模な推論モデルは複雑なタスクで強いパフォーマンスを達成するが、幻覚に苦しむ傾向にある。
最終コミットメントから知識探索を阻害するTextbfExploration-Commitment Decouplingパラダイムを提案する。
textbfCalibration-Aware Generation(CAG)は、エンド・ツー・エンドのキャリブレーション・アウェア・ジェネレーション機能を備えたモデルを提供するフレームワークである。
論文 参考訳(メタデータ) (2026-05-03T07:07:09Z) - Decidable By Construction: Design-Time Verification for Trustworthy AI [0.0]
機械学習における一般的な仮定は、モデル正しさは事実の後に強制されなければならないというものである。
我々は,AIモデルが数値的に安定しているか,計算的に正しいか,あるいは物理領域と整合しているかを決定する特性が,必ずしもポストホック強制を要求するとは限らないことを観察する。
論文 参考訳(メタデータ) (2026-03-26T13:09:36Z) - Reasoning Core: A Scalable Procedural Data Generation Suite for Symbolic Pre-training and Post-Training [2.62112541805429]
Reasoning Coreは、コア形式ドメイン間で検証可能なシンボリック推論データを手続き的に生成するスケーラブルなスイートである。
各タスクは厳密な検証のための外部解決器と組み合わせられ、カリキュラム設計のための継続的な難易度制御が認められる。
実験によると、Reasoning Coreのデータを事前トレーニングに混ぜることによって、下流の推論が改善され、保存されたり、わずかに改善された言語モデリングの品質が向上する。
論文 参考訳(メタデータ) (2026-03-02T18:59:29Z) - Trustworthy Agentic AI Requires Deterministic Architectural Boundaries [2.378211191937908]
現在のエージェントAIアーキテクチャは、高度な科学領域のセキュリティと要求と根本的に相容れない。
3つのメカニズムを通じてセキュリティを強制するトリニティ・ディフェンス・アーキテクチャを導入する。
疑わしい証明と決定論的調停がなければ、Lethal Trifecta'(信頼できない入力、特権データアクセス、外部アクション能力)は、認証セキュリティをエクスプロイト発見の問題にします。
論文 参考訳(メタデータ) (2026-02-10T16:33:40Z) - Can We Predict Before Executing Machine Learning Agents? [74.39460101251792]
データ中心のソリューション優先のタスクを形式化し、18,438対比較の包括的コーパスを構築する。
検証データ解析レポートを作成した場合, LLM は重要な予測能力を示すことを示す。
このフレームワークをForEAGENT(Predict-then-Verifyループを利用するエージェント)でインスタンス化し、実行ベースラインを+6%超えながらコンバージェンスを6倍高速化する。
論文 参考訳(メタデータ) (2026-01-09T16:44:17Z) - Propose, Solve, Verify: Self-Play Through Formal Verification [75.44204610186587]
形式的検証が信頼性の高い正当性信号を提供する検証コード生成設定における自己再生について検討する。
本稿では,PSV(Propose, Solve, Verify)という,難易度の高い合成問題を生成可能なプロジェクタと,専門家の反復によって訓練された解決器を作成するための,形式的検証信号を用いた簡単なセルフプレイフレームワークを紹介する。
そこで本研究では,生成した質問数とトレーニングの繰り返し数によるパフォーマンスの尺度を示し,形式的検証と難易度を考慮した提案を,自己再生を成功させる上で不可欠な要素として同定する。
論文 参考訳(メタデータ) (2025-12-20T00:56:35Z) - A Mathematical Framework for AI Singularity: Conditions, Bounds, and Control of Recursive Improvement [1.932555230783329]
我々は、自己改善のための分析フレームワークを開発し、能力向上とリソースのビルトアウトとデプロイメントポリシを結びつける。
我々は、可観測級数から脱走と非特異な振る舞いの証明をYes/Noにマッピングする決定ルールを導出する。
このフレームワークは、現在のレベルに対して、高速な改善がいかに加速するかに基づいて、偽造可能なテストを生成する。
論文 参考訳(メタデータ) (2025-11-08T21:25:38Z) - Beyond Scaling: Measuring and Predicting the Upper Bound of Knowledge Retention in Language Model Pre-Training [68.94373533768501]
我々は、知識保持をモデル化し、そのコーパスから事実情報を記憶するための事前学習言語モデルの能力を示し、学習前にそれを推定する原則的手法を導入する。
本稿では,知識周波数,知識特異度,モデルサイズを統合し,クローズドブック質問応答(QA)の精度を予測する情報理論予測器である,サイズ依存型相互情報(SMI)を提案する。
論文 参考訳(メタデータ) (2025-02-06T13:23:53Z) - Optimistic Verifiable Training by Controlling Hardware Nondeterminism [22.85808027490485]
トレーニング中のGPUタイプ間の非決定性は、トレーニングプロセスの正確な複製を防ぐ。
本稿では,目標よりも高精度なトレーニング,中間計算後のラウンドリング,適応的しきい値決定に基づくラウンドリング決定の共有を併用する手法を提案する。
検証可能なトレーニング手法は,証明ベースシステムと比較して,ストレージと時間コストを著しく削減する。
論文 参考訳(メタデータ) (2024-03-14T17:44:35Z) - Auditing AI models for Verified Deployment under Semantic Specifications [65.12401653917838]
AuditAIは、解釈可能な形式検証とスケーラビリティのギャップを埋める。
AuditAIは、画素空間の摂動のみを用いた検証の限界に対処しながら、検証と認定トレーニングのための制御されたバリエーションを得られるかを示す。
論文 参考訳(メタデータ) (2021-09-25T22:53:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。