論文の概要: VET Your Agent: Towards Host-Independent Autonomy via Verifiable Execution Traces
- arxiv url: http://arxiv.org/abs/2512.15892v1
- Date: Wed, 17 Dec 2025 19:05:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-19 18:10:31.78118
- Title: VET Your Agent: Towards Host-Independent Autonomy via Verifiable Execution Traces
- Title(参考訳): VETのエージェント: 検証可能な実行トレースによるホスト非依存の自律性を目指して
- Authors: Artem Grigor, Christian Schroeder de Witt, Simon Birnbach, Ivan Martinovic,
- Abstract要約: VET(Verifiable Execution Traces)は、エージェント出力のホストに依存しない認証を実現するフォーマルなフレームワークである。
VETの中心はエージェントIDドキュメント(AID)であり、エージェントの設定を指定する。
APIベースのLLMエージェントにVETを実装し、現実的なワークロードに対するインスタンス化を評価する。
- 参考スコア(独自算出の注目度): 5.948440195568225
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in large language models (LLMs) have enabled a new generation of autonomous agents that operate over sustained periods and manage sensitive resources on behalf of users. Trusted for their ability to act without direct oversight, such agents are increasingly considered in high-stakes domains including financial management, dispute resolution, and governance. Yet in practice, agents execute on infrastructure controlled by a host, who can tamper with models, inputs, or outputs, undermining any meaningful notion of autonomy. We address this gap by introducing VET (Verifiable Execution Traces), a formal framework that achieves host-independent authentication of agent outputs and takes a step toward host-independent autonomy. Central to VET is the Agent Identity Document (AID), which specifies an agent's configuration together with the proof systems required for verification. VET is compositional: it supports multiple proof mechanisms, including trusted hardware, succinct cryptographic proofs, and notarized TLS transcripts (Web Proofs). We implement VET for an API-based LLM agent and evaluate our instantiation on realistic workloads. We find that for today's black-box, secret-bearing API calls, Web Proofs appear to be the most practical choice, with overhead typically under 3$\times$ compared to direct API calls, while for public API calls, a lower-overhead TEE Proxy is often sufficient. As a case study, we deploy a verifiable trading agent that produces proofs for each decision and composes Web Proofs with a TEE Proxy. Our results demonstrate that practical, host-agnostic authentication is already possible with current technology, laying the foundation for future systems that achieve full host-independent autonomy.
- Abstract(参考訳): 大規模言語モデル(LLM)の最近の進歩は、持続する期間にわたって運用し、ユーザに代わって機密資源を管理する新しい世代の自律エージェントを可能にしている。
直接の監視なしに行動する能力に信頼され、金融管理、紛争解決、統治といった高額な領域において、このようなエージェントはますます検討されている。
しかし実際には、エージェントはホストによって制御されるインフラストラクチャ上で実行され、モデルやインプット、アウトプットを妨害し、自律性という意味のある概念を損なうことができる。
VET(Verifiable Execution Traces)は,エージェント出力のホスト非依存的な認証を実現し,ホスト非依存の自律性に向けた一歩を踏み出すフォーマルなフレームワークである。
VETの中心はエージェント識別ドキュメント(AID)であり、エージェントの構成と検証に必要な証明システムを指定する。
VETは構成的であり、信頼されたハードウェア、簡潔な暗号証明、表記されたTLS文字起こし(Web Proofs)など、複数の証明メカニズムをサポートしている。
APIベースのLLMエージェントにVETを実装し、現実的なワークロードに対するインスタンス化を評価する。
現在のブラックボックス、シークレット・ベアリングAPIコールでは、Web Proofsが最も実用的な選択であり、通常、直接APIコールよりも3$\times$以下であるのに対して、公開APIコールでは、下位のTEE Proxyで十分である。
ケーススタディとして、各決定の証明を作成し、TEEプロキシでWeb Proofsを構成する検証可能なトレーディングエージェントをデプロイする。
以上の結果から,ホストに依存しない現実的な認証は,現在の技術ですでに可能であり,ホスト非依存の自律性を実現する将来のシステムの基礎を築き上げている。
関連論文リスト
- Secure Autonomous Agent Payments: Verifying Authenticity and Intent in a Trustless Environment [0.0]
人工知能(AI)エージェントは、ユーザーや他のエージェントに代わって金融取引を開始する能力が高まっている。
従来の決済システムは、人間の認可を前提としているが、自律的なエージェント主導の支払いは、その保護を排除している。
本稿では,すべてのAI開始トランザクションの意図を暗号化的に認証し,検証するブロックチェーンベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-08T19:53:51Z) - AI Agents with Decentralized Identifiers and Verifiable Credentials [32.505127447635864]
本稿では, エージェントに自己主権のデジタルIDを付与する, プロトタイプ型マルチエージェントシステムを提案する。
エージェントの独特かつ台帳に記載された分散識別子(DID)と、発行された検証認証(VC)のセットを組み合わせる。
ダイアログの開始時のエージェントは、認証目的で自己管理されたDIDの所有権を証明し、さまざまなドメイン間の信頼関係を確立することができる。
論文 参考訳(メタデータ) (2025-10-01T08:10:37Z) - Using the NANDA Index Architecture in Practice: An Enterprise Perspective [9.707223291705601]
自律型AIエージェントの普及は、従来のWebアーキテクチャから協調的なインテリジェントシステムへのパラダイムシフトを表している。
本稿では,セキュアで信頼性が高く,相互運用可能なAIエージェントエコシステムの基盤要件に対処する包括的なフレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-05T05:27:27Z) - Cognitive Kernel-Pro: A Framework for Deep Research Agents and Agent Foundation Models Training [67.895981259683]
汎用AIエージェントは、次世代人工知能の基礎となるフレームワークとして、ますます認識されている。
現在のエージェントシステムはクローズドソースか、さまざまな有料APIやプロプライエタリなツールに大きく依存している。
我々は,完全オープンソースかつ(最大限に)フリーなマルチモジュールエージェントフレームワークであるCognitive Kernel-Proを提案する。
論文 参考訳(メタデータ) (2025-08-01T08:11:31Z) - From Cloud-Native to Trust-Native: A Protocol for Verifiable Multi-Agent Systems [7.002091295810318]
エージェントインフラストラクチャに直接構造保証を組み込むプロトコルであるTrustTrackを導入する。
TrustTrackは、知的エージェントが組織や司法機関をまたいでどのように機能するかを再設定する。
Cloud -> AI -> Agent -> Trust transitionは、自律システムのための次のアーキテクチャレイヤである、と私たちは主張する。
論文 参考訳(メタデータ) (2025-07-25T04:38:38Z) - Trusted Identities for AI Agents: Leveraging Telco-Hosted eSIM Infrastructure [0.0]
テレコムグレードのeSIMインフラを利用する概念アーキテクチャを提案する。
SIM認証情報をハードウェアデバイスに埋め込むのではなく、通信会社がセキュアで認証されたハードウェアモジュールをホストするモデルを想定する。
本論文は,標準化,セキュリティアーキテクチャ,およびエージェント経済の進展における通信インフラの役割について,オープンな議論を行うための概念的枠組みとして意図されている。
論文 参考訳(メタデータ) (2025-04-17T15:36:26Z) - Agent-as-a-Judge: Evaluate Agents with Agents [61.33974108405561]
本稿ではエージェント・アズ・ア・ジャッジ(Agent-as-a-Judge)フレームワークを紹介し,エージェント・システムを用いてエージェント・システムの評価を行う。
これはLLM-as-a-Judgeフレームワークの有機的拡張であり、タスク解決プロセス全体の中間フィードバックを可能にするエージェント的特徴を取り入れている。
55のリアルな自動化AI開発タスクのベンチマークであるDevAIを紹介します。
論文 参考訳(メタデータ) (2024-10-14T17:57:02Z) - Internet of Agents: Weaving a Web of Heterogeneous Agents for Collaborative Intelligence [79.5316642687565]
既存のマルチエージェントフレームワークは、多種多様なサードパーティエージェントの統合に苦慮することが多い。
我々はこれらの制限に対処する新しいフレームワークであるInternet of Agents (IoA)を提案する。
IoAはエージェント統合プロトコル、インスタントメッセージのようなアーキテクチャ設計、エージェントのチーム化と会話フロー制御のための動的メカニズムを導入している。
論文 参考訳(メタデータ) (2024-07-09T17:33:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。