論文の概要: TRUST: A Framework for Decentralized AI Service v.0.1
- arxiv url: http://arxiv.org/abs/2604.27132v1
- Date: Wed, 29 Apr 2026 19:32:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-01 16:31:53.775527
- Title: TRUST: A Framework for Decentralized AI Service v.0.1
- Title(参考訳): TRUST: 分散AIサービスv.0.1のためのフレームワーク
- Authors: Yu-Chao Huang, Zhen Tan, Mohan Zhang, Pingzhi Li, Zhuo Zhang, Tianlong Chen,
- Abstract要約: 大規模推論モデル (LRM) とマルチエージェントシステム (MAS) は, 信頼性の高い検証を必要とする。
TRUST(Transparent, Robust, and Unified Services for Trustworthy AI)は,3つのイノベーションを備えた分散フレームワークである。
我々は、悪質な俳優が損失を被っている間、正直な監査人の利益を確実に確保する安全利益理論を証明する。
- 参考スコア(独自算出の注目度): 47.384270414446604
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Reasoning Models (LRMs) and Multi-Agent Systems (MAS) in high-stakes domains demand reliable verification, yet centralized approaches suffer four limitations: (1) Robustness, with single points of failure vulnerable to attacks and bias; (2) Scalability, as reasoning complexity creates bottlenecks; (3) Opacity, as hidden auditing erodes trust; and (4) Privacy, as exposed reasoning traces risk model theft. We introduce TRUST (Transparent, Robust, and Unified Services for Trustworthy AI), a decentralized framework with three innovations: (i) Hierarchical Directed Acyclic Graphs (HDAGs) that decompose Chain-of-Thought reasoning into five abstraction levels for parallel distributed auditing; (ii) the DAAN protocol, which projects multi-agent interactions into Causal Interaction Graphs (CIGs) for deterministic root-cause attribution; and (iii) a multi-tier consensus mechanism among computational checkers, LLM evaluators, and human experts with stake-weighted voting that guarantees correctness under 30% adversarial participation. We prove a Safety-Profitability Theorem ensuring honest auditors profit while malicious actors incur losses. All decisions are recorded on-chain, while privacy-by-design segmentation prevents reconstruction of proprietary logic. Across multiple LLMs and benchmarks, TRUST attains 72.4% accuracy (4-18% above baselines) and remains resilient against 20% corruption. DAAN reaches 70% root-cause attribution (vs. 54-63% for standard methods) with 60% token savings. Human studies validate the design (F1 = 0.89, Brier = 0.074). The framework supports (A1) decentralized auditing, (A2) tamper-proof leaderboards, (A3) trustless data annotation, and (A4) governed autonomous agents, pioneering decentralized AI auditing for safe, accountable deployment of reasoning-capable systems.
- Abstract(参考訳): 大規模推論モデル(LRM)とマルチエージェントシステム(MAS)は,信頼性の高い検証を必要とするが,集中型アプローチでは,(1)攻撃やバイアスに弱い単一障害点を持つロバスト性,(2)複雑化の理由としてボトルネックを生じさせるスケーラビリティ,(3)エローダ信頼の隠蔽監査としてのオパシティ,(4)リスクモデル盗難の露呈としてのプライバシ,の4つの制限がある。
TRUST(Transparent, Robust, and Unified Services for Trustworthy AI)は,3つのイノベーションを持つ分散フレームワークである。
一 並列分散監査のための5つの抽象化レベルに分解する階層指向非巡回グラフ(HDAGs)
(II)決定論的根本原因帰属のための因果相互作用グラフ(CIG)へのマルチエージェントインタラクションをプロジェクションするDAANプロトコル
三 計算精算者、LCM評価者及び利害関係のある投票者の専門家の多層合意機構により、30%の反対参加者の正当性を保証する。
我々は、悪質な俳優が損失を被っている間、正直な監査人の利益を確実に確保する安全利益理論を証明する。
すべての決定はチェーン上で記録されるが、プライバシ・バイ・デザインのセグメンテーションはプロプライエタリなロジックの再構築を妨げている。
複数のLCMとベンチマークで、TRUSTは72.4%の精度(ベースラインより4-18%高い)を獲得し、20%の汚職に対して回復力を維持している。
DAANは70%の根起因属性(標準メソッドでは54-63%)に到達し、60%のトークンを節約した。
人間による研究は、この設計を検証する(F1 = 0.89, Brier = 0.074)。
このフレームワークは、(A1)分散監査、(A2)タンパー保護型リーダーボード、(A3)信頼なしデータアノテーション、および(A4)管理された自律エージェントをサポートし、推論可能なシステムの安全かつ説明可能なデプロイのための分散AI監査を開拓している。
関連論文リスト
- Claw-Eval: Toward Trustworthy Evaluation of Autonomous Agents [66.97968363332465]
エージェントベンチマークの3つのギャップに対処するエンドツーエンド評価スイートであるClaw-Evalを紹介した。
Claw-Evalは3つのグループにまたがる9つのカテゴリにまたがる300の人間検証タスクで構成されている。
すべてのエージェントアクションは、3つの独立したエビデンスチャネルを通じて記録される。
論文 参考訳(メタデータ) (2026-04-07T17:43:18Z) - Re-Evaluating EVMBench: Are AI Agents Ready for Smart Contract Security? [10.248746359119625]
EVMbenchは、スマートコントラクトセキュリティに関するAIエージェントのための最初の大規模なベンチマークである。
その成果は、完全に自動化されたAI監査が到達範囲内にあるという期待を後押しした。
これらの発見は、完全に自動化されたAI監査が差し迫っているという物語に挑戦する。
論文 参考訳(メタデータ) (2026-03-11T14:07:16Z) - LDP: An Identity-Aware Protocol for Multi-Agent LLM Systems [0.0]
現在のプロトコルでは、モデルレベルのプロパティを第一級プリミティブとして公開していない。
5つのメカニズムを導入したAIネイティブ通信プロトコルであるLDM Delegate Protocol(LDP)を提案する。
アイデンティティを意識したルーティングは、デリゲートの特殊化によって、簡単なタスクの12倍のレイテンシを実現するが、小さなデリゲートプールの集約品質は向上しない。
論文 参考訳(メタデータ) (2026-03-09T19:13:17Z) - Towards a Science of Scaling Agent Systems [79.64446272302287]
エージェント評価の定義を定式化し,エージェント量,コーディネーション構造,モデル,タスク特性の相互作用として,スケーリング法則を特徴付ける。
協調指標を用いて予測モデルを導出し,R2=0をクロスバリデーションし,未知のタスク領域の予測を可能にする。
ツールコーディネーショントレードオフ: 固定的な計算予算の下では, ツールヘビータスクはマルチエージェントのオーバーヘッドから不均衡に悩まされ, 2) 能力飽和: 調整が減少または負のリターンを, 単一エージェントのベースラインが45%を超えると達成できる。
論文 参考訳(メタデータ) (2025-12-09T06:52:21Z) - Making LLMs Reliable When It Matters Most: A Five-Layer Architecture for High-Stakes Decisions [51.56484100374058]
現在の大規模言語モデル(LLM)は、実行前にアウトプットをチェックできるが、不確実な結果を伴う高い戦略決定には信頼性が低い検証可能な領域で優れている。
このギャップは、人間と人工知能(AI)システムの相互認知バイアスによって引き起こされ、そのセクターにおける評価と投資の持続可能性の保証を脅かす。
本報告では、7つのフロンティアグレードLDMと3つの市場向けベンチャーヴィグネットの時間的圧力下での系統的質的評価から生まれた枠組みについて述べる。
論文 参考訳(メタデータ) (2025-11-10T22:24:21Z) - TRUST: A Decentralized Framework for Auditing Large Language Model Reasoning [45.228233498964755]
大規模言語モデルは、意思決定を明らかにする推論チェーンを生成する。
既存の監査手法は集中的で、不透明で、スケールが難しい。
透明で分散化された監査フレームワークであるTRUSTを提案する。
論文 参考訳(メタデータ) (2025-10-23T04:16:44Z) - VeriLLM: A Lightweight Framework for Publicly Verifiable Decentralized Inference [3.8760740008451156]
本稿では,分散言語モデル (LLM) 推論のための公開検証プロトコルであるVeriLLMを紹介する。
VeriLLMは、軽量な経験的再実行と暗号的なコミットメントを組み合わせることで、検証者は基礎となる推論コストの約1%で結果を検証することができる。
We show that VeriLLM achieve reliable public verifiability with least overhead。
論文 参考訳(メタデータ) (2025-09-29T04:07:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。