論文の概要: AITH: A Post-Quantum Continuous Delegation Protocol for Human-AI Trust Establishment
- arxiv url: http://arxiv.org/abs/2604.07695v1
- Date: Thu, 09 Apr 2026 01:30:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.626028
- Title: AITH: A Post-Quantum Continuous Delegation Protocol for Human-AI Trust Establishment
- Title(参考訳): AITH:人間-AI信頼確立のためのポスト量子連続デリゲートプロトコル
- Authors: Zhaoliang Chen,
- Abstract要約: 本稿では,ポスト量子連続デリゲートプロトコルであるAITH(AI Trust Handshake)を提案する。
AITHは、(1)ML-DSA-87 (FIPS 204, NIST Level 5)で署名された継続的デリゲーション証明書、(2)ハード制約、レート制限、エスカレーショントリガを強制する6チェック境界エンジン、(3)プッシュベースのリコールプロトコルが、1秒以内に無効を伝搬する。
- 参考スコア(独自算出の注目度): 9.198471344145092
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The rapid deployment of AI agents acting autonomously on behalf of human principals has outpaced the development of cryptographic protocols for establishing, bounding, and revoking human-AI trust relationships. Existing frameworks (TLS, OAuth 2.0, Macaroons) assume deterministic software and cannot address probabilistic AI agents operating continuously within variable trust boundaries. We present AITH (AI Trust Handshake), a post-quantum continuous delegation protocol. AITH introduces: (1) a Continuous Delegation Certificate signed once with ML-DSA-87 (FIPS 204, NIST Level 5), replacing per-operation signing with sub-microsecond boundary checks at 4.7M ops/sec; (2) a six-check Boundary Engine enforcing hard constraints, rate limits, and escalation triggers with zero cryptographic overhead on the critical path; (3) a push-based Revocation Protocol propagating invalidation within one second. A three-tier SHA-256 Responsibility Chain provides tamper-evident audit logging. All five security theorems are machine-verified via Tamarin Prover under the Dolev-Yao model. We validate AITH through five rounds of multi-model adversarial auditing, resolving 12 vulnerabilities across four severity layers. Simulation of 100,000 operations shows 79.5% autonomous execution, 6.1% human escalation, and 14.4% blocked.
- Abstract(参考訳): 人間のプリンシパルに代わって自律的に行動するAIエージェントの迅速な展開は、人間とAIの信頼関係を確立し、拘束し、取り消しするための暗号プロトコルの開発を大きく上回っている。
既存のフレームワーク(TLS、OAuth 2.0、Macaroons)は決定論的ソフトウェアを前提としており、可変信頼境界内で継続的に動作する確率的AIエージェントには対処できない。
本稿では,ポスト量子連続デリゲートプロトコルであるAITH(AI Trust Handshake)を提案する。
AITHは、(1)ML-DSA-87 (FIPS 204, NIST Level 5)で署名された継続的デリゲーション証明書、(2)ハード制約、レート制限、エスカレーショントリガを強制する6チェック境界エンジン、1秒以内に無効化を伝搬するプッシュベースのRevocation Protocol。
3層SHA-256 Responsibility Chainは、タンパーの明確な監査ログを提供する。
5つのセキュリティ定理はすべて、ドレフ・ヤオモデルの下でタマリン・プロバーを介して機械検証される。
我々は,4層の重度層にまたがる12の脆弱性を解消し,AITHを5ラウンドのマルチモデル対逆監査を通じて検証する。
10000の運用シミュレーションでは、79.5%の自律的な実行、6.1%の人間のエスカレーション、14.4%がブロックされている。
関連論文リスト
- Claw-Eval: Toward Trustworthy Evaluation of Autonomous Agents [66.97968363332465]
エージェントベンチマークの3つのギャップに対処するエンドツーエンド評価スイートであるClaw-Evalを紹介した。
Claw-Evalは3つのグループにまたがる9つのカテゴリにまたがる300の人間検証タスクで構成されている。
すべてのエージェントアクションは、3つの独立したエビデンスチャネルを通じて記録される。
論文 参考訳(メタデータ) (2026-04-07T17:43:18Z) - Agent Control Protocol: Admission Control for Agent Actions [0.4929694290403903]
エージェントコントロールプロトコル(エージェントコントロールプロトコル、ACP)は、B2Bの機関環境における自律エージェントの受け入れ制御ガバナンスのための正式な仕様である。
ACPは、暗号ID、能力に基づく認可、決定論的リスク評価、連鎖デリゲート、および暗号化連鎖監査を定義する。
ACPはRBACとZero Trustの上で動作し、どちらのモデルも解決しない問題に対処する。
論文 参考訳(メタデータ) (2026-03-19T12:28:28Z) - Governing Dynamic Capabilities: Cryptographic Binding and Reproducibility Verification for AI Agent Tool Use [0.0]
既存のセキュリティレイヤでは、AIエージェントに何ができるか、それが主張するものを実行したのか、マルチエージェントインタラクションで何が起きたのかを検証できない。
既存のフレームワークはこれら2つを詳述し、サイレントな能力のエスカレーションを可能にし、検証済みの証明なしに相互作用を残す。
我々は3つのエージェントガバナンス要件を導出する:能力の完全性(G1)、行動の妥当性(G2)、相互作用監査性(G3)。
基本(Ed25519, SHA-256; 97 us verify)と拡張(BBS+選択開示、Groth16 DV-SNARK; 13.8 ms)の2つの暗号に依存しないインスタンス化で検証する。
論文 参考訳(メタデータ) (2026-03-15T11:46:57Z) - LDP: An Identity-Aware Protocol for Multi-Agent LLM Systems [0.0]
現在のプロトコルでは、モデルレベルのプロパティを第一級プリミティブとして公開していない。
5つのメカニズムを導入したAIネイティブ通信プロトコルであるLDM Delegate Protocol(LDP)を提案する。
アイデンティティを意識したルーティングは、デリゲートの特殊化によって、簡単なタスクの12倍のレイテンシを実現するが、小さなデリゲートプールの集約品質は向上しない。
論文 参考訳(メタデータ) (2026-03-09T19:13:17Z) - Agent Behavioral Contracts: Formal Specification and Runtime Enforcement for Reliable Autonomous AI Agents [0.0]
Agent Behavioral Contracts (ABC)は、自律型AIエージェントにDesign-by-Contractの原則をもたらす正式なフレームワークである。
ABCは、プリコンディション、不変性、ガバナンスポリシー、およびリカバリメカニズムをランタイム強化可能なコンポーネントとして定義している。
実行時実行ライブラリであるAgentAssertにABCを実装し、AgentContract-Benchで評価する。
論文 参考訳(メタデータ) (2026-02-25T18:42:56Z) - Towards a Science of Scaling Agent Systems [79.64446272302287]
エージェント評価の定義を定式化し,エージェント量,コーディネーション構造,モデル,タスク特性の相互作用として,スケーリング法則を特徴付ける。
協調指標を用いて予測モデルを導出し,R2=0をクロスバリデーションし,未知のタスク領域の予測を可能にする。
ツールコーディネーショントレードオフ: 固定的な計算予算の下では, ツールヘビータスクはマルチエージェントのオーバーヘッドから不均衡に悩まされ, 2) 能力飽和: 調整が減少または負のリターンを, 単一エージェントのベースラインが45%を超えると達成できる。
論文 参考訳(メタデータ) (2025-12-09T06:52:21Z) - Making LLMs Reliable When It Matters Most: A Five-Layer Architecture for High-Stakes Decisions [51.56484100374058]
現在の大規模言語モデル(LLM)は、実行前にアウトプットをチェックできるが、不確実な結果を伴う高い戦略決定には信頼性が低い検証可能な領域で優れている。
このギャップは、人間と人工知能(AI)システムの相互認知バイアスによって引き起こされ、そのセクターにおける評価と投資の持続可能性の保証を脅かす。
本報告では、7つのフロンティアグレードLDMと3つの市場向けベンチャーヴィグネットの時間的圧力下での系統的質的評価から生まれた枠組みについて述べる。
論文 参考訳(メタデータ) (2025-11-10T22:24:21Z) - Adaptive Attacks on Trusted Monitors Subvert AI Control Protocols [80.68060125494645]
プロトコルとモニタモデルを知っている信頼できないモデルによるアダプティブアタックについて検討する。
我々は、攻撃者がモデル出力に公知またはゼロショットプロンプトインジェクションを埋め込む単純な適応攻撃ベクトルをインスタンス化する。
論文 参考訳(メタデータ) (2025-10-10T15:12:44Z) - Eigen-1: Adaptive Multi-Agent Refinement with Monitor-Based RAG for Scientific Reasoning [53.45095336430027]
暗黙的な検索と構造化された協調を組み合わせた統合フレームワークを開発する。
Humanity's Last Exam (HLE) Bio/Chem Goldでは,48.3%の精度を実現している。
SuperGPQAとTRQAの結果はドメイン間の堅牢性を確認した。
論文 参考訳(メタデータ) (2025-09-25T14:05:55Z) - Security Challenges in AI Agent Deployment: Insights from a Large Scale Public Competition [101.86739402748995]
44の現実的なデプロイメントシナリオを対象とした,22のフロンティアAIエージェントを対象にしています。
Agent Red Teamingベンチマークを構築し、19の最先端モデルで評価します。
私たちの発見は、今日のAIエージェントの重要かつ永続的な脆弱性を浮き彫りにしたものです。
論文 参考訳(メタデータ) (2025-07-28T05:13:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。