論文の概要: OVIG: Optimistic Verification of AI Training Integrity via Gradient Signals
- arxiv url: http://arxiv.org/abs/2606.21045v1
- Date: Fri, 19 Jun 2026 02:22:28 GMT
- ステータス: 情報取得中
- システム内更新日: 2026-06-23 11:15:34.133562
- Title: OVIG: Optimistic Verification of AI Training Integrity via Gradient Signals
- Title(参考訳): OVIG: 勾配信号によるAIトレーニング統合の最適検証
- Authors: Hongxu Su, Jianzhu Yao, Huan Zhang, Xuechao Wang, Pramod Viswanath,
- Abstract要約: アウトソーストレーニングは、トレーニング統合性ギャップを生み出します。
OVIGは、異種実行下でのトレーニング後のアウトソースAIに対して、実用的な整合性レイヤを提供する。
- 参考スコア(独自算出の注目度): 12.13115443718909
- License:
- Abstract: The rapid growth of AI has increased the demand for domain-specific post-training, while the cost and specialization of accelerator infrastructure push many model owners to outsource this process. Outsourced training lowers operational barriers, but creates a training-integrity gap: the owner receives a checkpoint, logs, and aggregate metrics without direct evidence that the declared training trajectory was faithfully executed. An untrusted provider may have incentives to deviate from that trajectory, either to save computation or to introduce targeted security risks. Auditing such deviations is difficult because floating-point execution on heterogeneous accelerators introduces benign numerical drift, making it hard to distinguish honest replay differences from integrity violations. Existing verification methods either observe training at too coarse a granularity or impose costs and deployment constraints that are impractical at scale. We present OVIG, an optimistic verification framework that audits outsourced post-training using an empirical boundary on gradient differences calibrated from honest heterogeneous replays. OVIG checks opened intervals against this boundary and combines optimistic sampling with a stride parameter $s$, which partitions training into stride-aligned intervals and retains only interval-endpoint evidence. Across shortcut training attacks and targeted manipulation attacks, OVIG maintains $0\%$ ASR on language, vision, and diffusion workloads. On Qwen3, increasing the stride from $s=1$ to $s=2000$ reduces off-chain storage and evidence transmission by $1996\times$ while preserving $0\%$ ASR; at this setting, OVIG incurs only $1.143\times$ total system overhead relative to training without verification. These results show that OVIG provides a practical integrity layer for outsourced AI post-training under heterogeneous execution.
- Abstract(参考訳): AIの急速な成長により、ドメイン固有のポストトレーニングの需要が増加し、アクセラレータインフラストラクチャのコストと専門化により、多くのモデルオーナーがこのプロセスのアウトソースを迫られている。
オーナーは、宣言されたトレーニング軌跡が忠実に実行されたという直接的な証拠なしで、チェックポイント、ログ、集約されたメトリクスを受け取る。
信頼できないプロバイダは、計算を節約するか、ターゲットとするセキュリティリスクを導入するために、その軌道から逸脱するインセンティブを持つかもしれない。
異種加速器での浮動小数点実行は、良質な数値ドリフトをもたらすため、整合性違反と正直なリプレイの違いを区別することが困難である。
既存の検証方法は、粗い粒度でトレーニングを観察するか、大規模で非現実的なコストとデプロイメントの制約を課すかのどちらかです。
OVIGという楽観的な検証フレームワークは、誠実な異種リプレイから校正された勾配差に関する経験的境界を用いて、訓練後のアウトソースを監査する。
OVIGはこの境界に対して開区間をチェックし、楽観的なサンプリングとストライドパラメータ$s$を組み合わせる。
ショートカットトレーニングアタックとターゲット操作アタックを通じて、OVIGは言語、ビジョン、拡散ワークロードに対して、0\%のASRを維持している。
Qwen3では、ストライドを$s=1$から$s=2000$に増やし、オフチェーンのストレージとエビデンスを$ 1996\times$に減らし、ASRは$0\%を保った。
これらの結果は、OVIGが異種実行下でのトレーニング後のAIをアウトソースする実用的な整合性レイヤを提供することを示している。
関連論文リスト
- Fair Finetuning Mitigates Distribution Inference Attacks [0.609170287691728]
センシティブなデータに基づいてトレーニングされた機械学習モデルは、トレーニングディストリビューションに関する人口レベルの情報を不注意に漏洩させる可能性がある。
フェアファインチューニング (FFt: Fair Fine-tuning) モデルを提案する。
我々の研究は、モデルが測定したEO差分をDIAゲームにおける敵の優位性に直接接続する最初の形式的境界を提供する。
論文 参考訳(メタデータ) (2026-06-01T05:34:19Z) - Affordance Agent Harness: Verification-Gated Skill Orchestration [45.231685718099264]
Affordance groundingは、オープンワールドのシーンでエージェントがどこでどのように対話すべきかを特定する必要がある。
本稿では,エビデンスストアとコストコントロールを備えたクローズドループランタイムであるAffordance Agent Harnessを提案する。
論文 参考訳(メタデータ) (2026-05-01T13:45:16Z) - Causal Bootstrapped Alignment for Unsupervised Video-Based Visible-Infrared Person Re-Identification [52.784239635604735]
VVI-ReIDは、静止画像以外にも時間情報が付加的な手がかりを提供する、全日監視のための重要な技術である。
既存のアプローチは、高価なクロスモダリティアノテーションによる完全な教師付き学習に大きく依存しており、スケーラビリティが制限されています。
そこで,本研究では,ビデオの先行を明示的に活用するCausal Bootstrapped Alignmentフレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-17T02:15:59Z) - Byzantine-Robust and Differentially Private Federated Optimization under Weaker Assumptions [89.52532304099522]
フェデレートラーニング(FL)は、クライアントが生データを集中せずに共有モデルを共同でトレーニングすることを可能にし、固有のプライバシーレベルを提供する。
グラデーションとモデル更新は機密情報を漏洩する可能性があるが、悪意のあるサーバはビザンティン操作のような敵攻撃をマウントする可能性がある。
これらの脆弱性は、統合されたフレームワーク内の差分プライバシー(DP)とビザンチンの堅牢性に対処する必要性を強調している。
Byz-Clip21-SGD2Mを提案する。
論文 参考訳(メタデータ) (2026-03-24T17:39:09Z) - Improving Search Agent with One Line of Code [68.58667107354253]
ツールベースのエージェント強化学習(TARL)は,検索エージェントが外部ツールと対話できるようにトレーニングするための,有望なパラダイムとして登場した。
textbfSearch textbfAgent textbfPolicy textbfOptimization (textbfSAPO)を提案する。
論文 参考訳(メタデータ) (2026-03-10T04:07:39Z) - How Far Can Unsupervised RLVR Scale LLM Training? [57.44753418846446]
検証可能な報酬を伴う教師なし強化学習(URLVR)は、監督ボトルネックを越えてLLMトレーニングをスケールするための経路を提供する。
最近の研究は、モデル固有の信号を活用し、期待できる早期の利得を示しているが、その可能性と限界は未だ不明である。
我々は、URLVRメソッドを報酬源に基づく固有対外部に分類し、統一された理論的枠組みを確立する。
論文 参考訳(メタデータ) (2026-03-09T17:38:11Z) - Autonomous Chain-of-Thought Distillation for Graph-Based Fraud Detection [73.9189065770752]
テキスト分散グラフ(TAG)上のグラフベースの不正検出には、リッチテキストセマンティクスとリレーショナル依存関係を共同でモデル化する必要がある。
我々は,自律型グラフ認識チェーン(CoT)推論とスケーラブルなLLM-GNN協調学習を通じて,TAGに基づく不正検出を促進する統一フレームワークであるFraudCoTを提案する。
論文 参考訳(メタデータ) (2026-01-30T13:12:12Z) - FedGraph-VASP: Privacy-Preserving Federated Graph Learning with Post-Quantum Security for Cross-Institutional Anti-Money Laundering [0.0]
我々は、アンチマネーロンダリング検出のためのプライバシ生成グラフ学習フレームワークであるFedGraph-VASPを提案する。
私たちの重要なコントリビューションは、境界アカウントの圧縮された非可逆グラフニューラルネットワーク表現のみを共有する境界埋め込み交換プロトコルです。
論文 参考訳(メタデータ) (2026-01-25T18:14:26Z) - Two-phase Pseudo Label Densification for Self-training based Domain
Adaptation [93.03265290594278]
TPLDと呼ばれる,新規な二相擬似ラベル高密度化フレームワークを提案する。
第1フェーズでは,スライディングウインドウ投票を用いて,画像内の内在的空間相関を利用して,自信のある予測を広める。
第2フェーズでは,信頼度に基づく容易な分類を行う。
トレーニングプロセスの容易化と騒音予測の回避を目的として,ブートストラップ機構の導入を行った。
論文 参考訳(メタデータ) (2020-12-09T02:35:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。