論文の概要: Sovereign Context Protocol: An Open Attribution Layer for Human-Generated Content in the Age of Large Language Models
- arxiv url: http://arxiv.org/abs/2603.27094v1
- Date: Sat, 28 Mar 2026 02:28:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:44.779825
- Title: Sovereign Context Protocol: An Open Attribution Layer for Human-Generated Content in the Age of Large Language Models
- Title(参考訳): Sovereign Context Protocol:大規模言語モデルの時代における人間生成コンテンツに対するオープンな属性層
- Authors: Praneel Panchigar, Torlach Rush, Matthew Canabarro,
- Abstract要約: Sovereign Context Protocolは、大規模言語モデルと人為的コンテンツの間の属性対応データアクセス層として機能する。
SCPは6つのコアメソッド(クリエータプロファイル、セマンティック検索、コンテンツ検索、信頼/価値評価、信頼性検証、アクセス監査)を、RESTとMPP互換インターフェースの両方で公開している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models (LLMs) consume vast quantities of human-generated content for both training and real-time inference, yet the creators of that content remain largely invisible in the value chain. Existing approaches to data attribution operate either at the model-internals level, tracing influence through gradient signals, or at the legal-policy level through transparency mandates and copyright litigation. Neither provides a runtime mechanism for content creators to know when, by whom, and how their work is being consumed. We introduce the Sovereign Context Protocol (SCP), an open-source protocol specification and reference architecture that functions as an attribution-aware data access layer between LLMs and human-generated content. Inspired by Anthropic's Model Context Protocol (MCP), which standardizes how LLMs connect to tools, SCP standardizes how LLMs connect to creator-owned data, with every access event logged, licensed, and attributable. SCP defines six core methods (creator profiles, semantic search, content retrieval, trust/value scoring, authenticity verification, and access auditing) exposed over both REST and MCP-compatible interfaces. We formalize the protocol's message envelope, present a threat model with five adversary classes, propose a log-proportional revenue attribution model, and report preliminary latency benchmarks from a reference implementation built on FastAPI, ChromaDB, and NetworkX. We situate SCP within the emerging regulatory landscape, including the EU AI Act's Article 53 training data transparency requirements and ongoing U.S. copyright litigation, and argue that the attribution gap requires a protocol-level intervention that makes attribution a default property of data access.
- Abstract(参考訳): 大規模言語モデル(LLM)は、トレーニングとリアルタイム推論の両方に膨大な量の人為的コンテンツを消費しますが、そのコンテンツの作成者はバリューチェーンの中でほとんど見えません。
既存のデータ帰属へのアプローチは、モデル内部レベル、勾配信号による影響の追跡、透明性委任と著作権訴訟による法政レベルのいずれかで動作する。
コンテンツクリエーターがいつ、誰が、どのように仕事を消費しているかを知るためのランタイムメカニズムも提供していない。
本稿では,オープンソースプロトコル仕様およびリファレンスアーキテクチャであるSovereign Context Protocol(SCP)を紹介する。
Anthropic の Model Context Protocol (MCP) に触発された SCP は LLM がツールにどう接続するかを標準化し、すべてのアクセスイベントをログし、ライセンスし、属性化できるように LLM がクリエーターが所有するデータにどのように接続するかを標準化している。
SCPは6つのコアメソッド(クリエータプロファイル、セマンティック検索、コンテンツ検索、信頼/価値評価、信頼性検証、アクセス監査)を、RESTとMPP互換インターフェースの両方で公開している。
本稿では,FastAPI,ChromaDB,NetworkX上に構築されたリファレンス実装から,プロトコルのメッセージエンベロープを形式化し,脅威モデルを示す。
我々は、EU AI Actの第53条によるデータ透明性要件のトレーニングや、現在進行中の米国著作権訴訟など、新たな規制の状況にSCPを配置し、属性がデータアクセスのデフォルトプロパティになるようなプロトコルレベルの介入を必要とすると主張している。
関連論文リスト
- IDP Accelerator: Agentic Document Intelligence from Extraction to Compliance Validation [3.539467892338473]
IDP(Intelligent Document Processing) Acceleratorは、エンドツーエンドのドキュメントインテリジェンスのためのエージェントAIを実現するフレームワークである。
インタラクティブなデモでは、ユーザはドキュメントのパケットをアップロードし、分類結果を視覚化し、抽出したデータを探索することができる。
論文 参考訳(メタデータ) (2026-02-26T20:20:38Z) - DAVE: A Policy-Enforcing LLM Spokesperson for Secure Multi-Document Data Sharing [0.0]
DAVEは利用ポリシーを強制するスポークスパーソンで、データプロバイダに代わってプライベートドキュメントに関する質問に答える。
我々は、この設定でポリシー違反の情報開示を形式化し、利用制御と情報フローのセキュリティに基づく。
当社のコントリビューションは主にアーキテクチャです – 完全な実行パイプラインの実装や試験的な評価は行いません。
論文 参考訳(メタデータ) (2026-02-19T14:43:48Z) - RefProtoFL: Communication-Efficient Federated Learning via External-Referenced Prototype Alignment [20.458428841832742]
フェデレートラーニング(FL)は、エッジ環境で生データを共有せずに協調的なモデルトレーニングを可能にする。
本稿では,外部参照型プロトタイプアライメントを統合した通信効率の高いFLフレームワークRefProtoFLを提案する。
RefProtoFLは、最先端のプロトタイプベースのFLベースラインよりも高い分類精度が得られることを示す。
論文 参考訳(メタデータ) (2026-01-21T08:01:14Z) - Model-Document Protocol for AI Search [11.377241012645994]
原文が大規模言語モデル (LLM) にどのようにブリッジされているかを形式化する汎用フレームワークである Model-Document Protocol (MDP) を導入する。
MDPは、検索をパスフェッチとして扱う代わりに、構造化されていない文書をタスク固有のLCM対応の入力に変換する複数の経路を定義している。
本稿では,エージェントプロセスを通じてプロトコルを実現するMPP-Agentを提案する。
論文 参考訳(メタデータ) (2025-10-29T04:29:17Z) - Analyzing and Internalizing Complex Policy Documents for LLM Agents [53.14898416858099]
大規模言語モデル(LLM)ベースのエージェントシステムは、多様なビジネスルールをコードするコンテキスト内ポリシー文書に依存している。
これは、パフォーマンスを保ちながら、ポリシー文書をモデルプリエントに組み込む内部化手法の開発を動機付けます。
CC-Genは4つのレベルにまたがる制御可能な複雑度を持つエージェントベンチマークジェネレータである。
論文 参考訳(メタデータ) (2025-10-13T16:30:07Z) - Latent Factor Models Meets Instructions: Goal-conditioned Latent Factor Discovery without Task Supervision [50.45597801390757]
Instruct-LFはゴール指向の潜在因子発見システムである。
命令フォロー機能と統計モデルを統合して、ノイズの多いデータセットを処理する。
論文 参考訳(メタデータ) (2025-02-21T02:03:08Z) - ReCaLL: Membership Inference via Relative Conditional Log-Likelihoods [56.073335779595475]
本稿ではReCaLL(Relative Conditional Log-Likelihood)を提案する。
実験の結果,非メンバープレフィックスの条件付きメンバーデータは,非メンバーデータと比較してログライクな傾向が著しく低下することがわかった。
我々は総合的な実験を行い、ReCaLLがWikiMIAデータセット上で最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2024-06-23T00:23:13Z) - FLIP: Fine-grained Alignment between ID-based Models and Pretrained Language Models for CTR Prediction [49.510163437116645]
クリックスルーレート(CTR)予測は、パーソナライズされたオンラインサービスにおいてコア機能モジュールとして機能する。
CTR予測のための従来のIDベースのモデルは、表形式の1ホットエンコードされたID特徴を入力として取る。
事前訓練された言語モデル(PLM)は、テキストのモダリティの文を入力として取る別のパラダイムを生み出した。
本稿では,CTR予測のためのIDベースモデルと事前学習言語モデル(FLIP)間の細粒度特徴レベルのアライメントを提案する。
論文 参考訳(メタデータ) (2023-10-30T11:25:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。