論文の概要: The Digital Apprentice: A Framework for Human-Directed Agentic AI Development
- arxiv url: http://arxiv.org/abs/2606.04321v1
- Date: Wed, 03 Jun 2026 00:49:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.452248
- Title: The Digital Apprentice: A Framework for Human-Directed Agentic AI Development
- Title(参考訳): The Digital Apprentice: エージェントAI開発のためのフレームワーク
- Authors: Travis Weber, Rohit Taneja,
- Abstract要約: 我々は,自律性を前提とせず,スケーラブルで安全なAIエージェンシーのためのフレームワークを提案する。
デジタル・アレンティス(Digital Apprentice)は、人間の暗黙の方法論を内包する発達学習者である。
我々は,データドリフトを捕捉し,実行時に異なる手法を適用することによって,トラフィックシフト時の品質の劣化を回復する方法を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Agentic AI deployments face a recurring design tension: heavy human oversight limits scale, while broad autonomy outruns accountability. Neither posture provides the governance infrastructure required for responsible delegation. We present the Digital Apprentice, a framework for scalable, safe AI agency in which autonomy is earned, not assumed. The Digital Apprentice is a developmental learner that internalizes the tacit methodology of a directing human, graduating through per-skill autonomy tiers only when empirical evidence justifies it. The result is an agent that becomes genuinely useful over time while remaining aligned to a specific human's standards. Three architectural components make this possible. (1) Methodology capture, distilling a directing professional's tacit approach into structured assets. (2) Authorization, with autonomy escalation gated by explicit human approval. (3) Continuous alignment, correcting drift at runtime and converting each correction into owned preference data. We instantiate this framework as an inference-time control plane. We mathematically model the quality framework and discuss policies and techniques designed to raise quality. We apply the framework to an open professional corpus, and we show how catching data drift and applying a different technique at runtime recovers degraded quality dimensions under traffic shift. The implication extends beyond any single application. We believe these three pillars, stitched together as a system, form a safer and more viable path to agentic systems that can scale without sacrificing trust.
- Abstract(参考訳): エージェントAIの展開は、人間の監視が重く、スケールが制限され、広範な自律性は説明責任を負うという、繰り返し発生する設計上の緊張に直面します。
どちらも、責任を負う代表団に必要なガバナンス基盤を提供していません。
私たちはDigital Apprenticeという,自律性が前提ではなく,スケーラブルで安全なAIエージェンシーのためのフレームワークを紹介します。
デジタル・アレンティス(Digital Apprentice)は、人間を指示する暗黙の方法論を内包する発達学習者であり、経験的証拠が正しければ、スキルごとの自律層を通じて卒業する。
その結果は、特定の人間の基準に順応しながら、時間とともに真に有用なエージェントとなる。
3つのアーキテクチャコンポーネントがこれを可能にします。
1) 構造化資産への指示的専門家の暗黙のアプローチを蒸留する方法
2)明示的な人的承認によって自治のエスカレーションが促進される権限。
(3)連続的なアライメント、実行時のドリフトの修正、各修正を所有する好みデータに変換する。
我々はこのフレームワークを推論時制御プレーンとしてインスタンス化する。
品質フレームワークを数学的にモデル化し、品質を高めるために設計されたポリシーとテクニックについて議論する。
このフレームワークをオープンなプロフェッショナルコーパスに適用し、データドリフトを捕捉し、実行時に異なるテクニックを適用して、トラフィックシフトによる劣化した品質次元を回復する方法を示す。
この意味は、どのアプリケーションにも及ばない。
これら3つの柱は、システムとして縫合され、信頼を犠牲にすることなくスケールできる、より安全で実行可能なエージェントシステムへの道を形成すると信じています。
関連論文リスト
- Beyond the 'Diff': Addressing Agentic Entropy in Agentic Software Development [42.371764229953165]
エージェントによる決定が時間やツールコール,アーキテクチャ境界を越えてどのように展開されるかを明らかにする,プロセス指向の説明可能性フレームワークを提案する。
私たちのアプローチは、既存のレビュープラクティスを置き換えるのではなく、補完するインテントレベルのテレメトリを提供します。
認知的ドリフトをコード品質と並んで第一級の関心事として扱うことで、エージェントの監視に必要な人間の理解の最小レベルを安定的に維持する。
論文 参考訳(メタデータ) (2026-03-03T12:55:28Z) - Institutional AI: A Governance Framework for Distributional AGI Safety [1.3763052684269788]
AIモデルのコア特性から生じる3つの構造的問題を同定する。
ソリューションはInstitutional AIであり、AIエージェント集団の効果的なガバナンスの問題としてアライメントを扱うシステムレベルのアプローチである。
論文 参考訳(メタデータ) (2026-01-15T17:08:26Z) - ReAL-AD: Towards Human-Like Reasoning in End-to-End Autonomous Driving [27.75047397292818]
エンドツーエンドの自動運転は、単一のフレームワーク内で認識、予測、計画を統合するための有望なアプローチとして現れています。
本稿では,3階層の認知モデルに基づいて自律運転における意思決定を構造化するReAL-ADを提案する。
我々のフレームワークを統合することで、計画の正確さと安全性が30%以上向上し、エンドツーエンドの自動運転がより解釈可能になり、人間のような階層的推論に適合することを示します。
論文 参考訳(メタデータ) (2025-07-16T02:23:24Z) - Rethinking Data Protection in the (Generative) Artificial Intelligence Era [138.07763415496288]
現代の(生産的な)AIモデルやシステムに生じる多様な保護ニーズを捉える4段階の分類法を提案する。
当社のフレームワークは、データユーティリティとコントロールのトレードオフに関する構造化された理解を提供し、AIパイプライン全体にわたっています。
論文 参考訳(メタデータ) (2025-07-03T02:45:51Z) - Cascaded Language Models for Cost-effective Human-AI Decision-Making [52.81324217423194]
複数の専門分野にまたがってタスクを適応的に委譲するLLM決定フレームワークを提案する。
まず、deferral Policyは、ベースモデルの回答を受け入れるか、あるいは大きなモデルでそれを再生するかを決定する。
第2に、禁忌ポリシーは、カスケードモデル応答が十分に確実であるか、または人間の介入を必要とするかを判定する。
論文 参考訳(メタデータ) (2025-06-13T15:36:22Z) - Generalising from Self-Produced Data: Model Training Beyond Human Constraints [0.0]
本稿では,AIモデルが新たな知識を自律的に生成し,検証する新しい枠組みを提案する。
このアプローチの中心は、人間のベンチマークを必要とせずに学習をガイドする、無制限で使い捨ての数値報酬である。
論文 参考訳(メタデータ) (2025-04-07T03:48:02Z) - Pangu-Agent: A Fine-Tunable Generalist Agent with Structured Reasoning [50.47568731994238]
人工知能(AI)エージェント作成の鍵となる方法は強化学習(RL)である
本稿では,構造化推論をAIエージェントのポリシーに統合し,学習するための一般的なフレームワークモデルを提案する。
論文 参考訳(メタデータ) (2023-12-22T17:57:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。