論文の概要: Randomized Controlled Trials for Conditional Access Optimization Agent
- arxiv url: http://arxiv.org/abs/2511.13865v1
- Date: Mon, 17 Nov 2025 19:33:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-19 16:23:52.766337
- Title: Randomized Controlled Trials for Conditional Access Optimization Agent
- Title(参考訳): 条件付きアクセス最適化エージェントのためのランダム化制御試験
- Authors: James Bono, Beibei Cheng, Joaquin Lozano,
- Abstract要約: Microsoft Entraにおける条件アクセス(CA)ポリシー管理のためのAIエージェントの評価を行った最初のランダム化制御試験(RCT)の結果を報告する。
エージェントアクセスは、精度が48%向上し、タスク完了時間が43%低下し、精度が一定であった。
これらの結果から, 汎用AIエージェントは, アイデンティティ管理における速度と精度の両方を著しく向上させることができることがわかった。
- 参考スコア(独自算出の注目度): 0.9558392439655014
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: AI agents are increasingly deployed to automate complex enterprise workflows, yet evidence of their effectiveness in identity governance is limited. We report results from the first randomized controlled trial (RCT) evaluating an AI agent for Conditional Access (CA) policy management in Microsoft Entra. The agent assists with four high-value tasks: policy merging, Zero-Trust baseline gap detection, phased rollout planning, and user-policy alignment. In a production-grade environment, 162 identity administrators were randomly assigned to a control group (no agent) or treatment group (agent-assisted) and asked to perform these tasks. Agent access produced substantial gains: accuracy improved by 48% and task completion time decreased by 43% while holding accuracy constant. The largest benefits emerged on cognitively demanding tasks such as baseline gap detection. These findings demonstrate that purpose-built AI agents can significantly enhance both speed and accuracy in identity administration.
- Abstract(参考訳): AIエージェントは、複雑なエンタープライズワークフローを自動化するためにますますデプロイされているが、アイデンティティガバナンスの有効性の証拠は限られている。
Microsoft Entraにおける条件アクセス(CA)ポリシー管理のためのAIエージェントの評価を行った最初のランダム化制御試験(RCT)の結果を報告する。
エージェントは、ポリシーマージ、ゼロトラストベースラインギャップ検出、フェーズドロールアウト計画、ユーザー・ポリシーアライメントの4つの高価値タスクを支援する。
運用段階の環境では、162人のID管理者がランダムにコントロールグループ(エージェントなし)または治療グループ(エージェント支援)に割り当てられ、これらのタスクの実行を依頼した。
エージェントアクセスは、精度が48%向上し、タスク完了時間が43%低下し、精度が一定になった。
最大のメリットは、ベースラインギャップ検出のような認知的に要求されるタスクに現れました。
これらの結果から, 汎用AIエージェントは, アイデンティティ管理における速度と精度の両方を著しく向上させることができることがわかった。
関連論文リスト
- Randomized Controlled Trials for Phishing Triage Agent [1.2691047660244335]
本稿では,ドメイン固有のAIエージェントがアナリストの生産性と精度に与える影響を評価するために,最初のランダム化制御試験(RCT)を提案する。
エージェント強化アナリストは、アナリスト毎分あたりの真正値の最大6.5倍、予測精度がコントロールグループに比べて77%向上した。
論文 参考訳(メタデータ) (2025-11-17T19:23:08Z) - AgentPRM: Process Reward Models for LLM Agents via Step-Wise Promise and Progress [71.02263260394261]
大規模言語モデル(LLM)は、マルチターン意思決定タスクにおいて依然として課題に直面している。
プロセス報酬モデル(PRM)を構築し、各意思決定を評価し、エージェントの意思決定プロセスを導く。
AgentPRMは、シーケンシャルな決定と最終的な目標への貢献の間の相互依存の両方をキャプチャする。
論文 参考訳(メタデータ) (2025-11-11T14:57:54Z) - Stop Wasting Your Tokens: Towards Efficient Runtime Multi-Agent Systems [11.42175340352007]
SupervisorAgentは、ランタイムと適応的な監視のための軽量でモジュール化されたフレームワークです。
SupervisorAgentは、エラーを積極的に修正し、非効率な振る舞いを誘導し、観察を浄化するために、臨界点に介入する。
挑戦的なGAIAベンチマークでは、SupervisorAgentは成功率を損なうことなく、Smolagentフレームワークのトークン消費を平均29.45%削減した。
論文 参考訳(メタデータ) (2025-10-30T15:12:59Z) - Alita-G: Self-Evolving Generative Agent for Agent Generation [54.49365835457433]
汎用エージェントをドメインエキスパートに変換するフレームワークであるALITA-Gを提案する。
このフレームワークでは、ジェネラリストエージェントが対象ドメインタスクのキュレートされたスイートを実行する。
計算コストを削減しながら、大きな利益を得ることができます。
論文 参考訳(メタデータ) (2025-10-27T17:59:14Z) - What Is Your Agent's GPA? A Framework for Evaluating Agent Goal-Plan-Action Alignment [3.5583478152586756]
Agent GPAは、目標を設定し、計画を立て、アクションを実行するエージェントの運用ループに基づいた評価パラダイムである。
フレームワークには、ゴールフルフィルメント、論理一貫性、実行効率、プラン品質、プラン順守の5つの評価指標が含まれている。
論文 参考訳(メタデータ) (2025-10-09T22:40:19Z) - AdvEvo-MARL: Shaping Internalized Safety through Adversarial Co-Evolution in Multi-Agent Reinforcement Learning [78.5751183537704]
AdvEvo-MARLは、タスクエージェントに安全性を内部化する、共進化型マルチエージェント強化学習フレームワークである。
外部ガードに頼るのではなく、AdvEvo-MARLは攻撃者と防御者を共同で最適化する。
論文 参考訳(メタデータ) (2025-10-02T02:06:30Z) - Eigen-1: Adaptive Multi-Agent Refinement with Monitor-Based RAG for Scientific Reasoning [53.45095336430027]
暗黙的な検索と構造化された協調を組み合わせた統合フレームワークを開発する。
Humanity's Last Exam (HLE) Bio/Chem Goldでは,48.3%の精度を実現している。
SuperGPQAとTRQAの結果はドメイン間の堅牢性を確認した。
論文 参考訳(メタデータ) (2025-09-25T14:05:55Z) - VulAgent: Hypothesis-Validation based Multi-Agent Vulnerability Detection [55.957275374847484]
VulAgentは仮説検証に基づくマルチエージェント脆弱性検出フレームワークである。
セマンティクスに敏感なマルチビュー検出パイプラインを実装しており、それぞれが特定の分析の観点から一致している。
平均して、VulAgentは全体的な精度を6.6%改善し、脆弱性のある固定されたコードペアの正確な識別率を最大450%向上させ、偽陽性率を約36%削減する。
論文 参考訳(メタデータ) (2025-09-15T02:25:38Z) - Security Challenges in AI Agent Deployment: Insights from a Large Scale Public Competition [101.86739402748995]
44の現実的なデプロイメントシナリオを対象とした,22のフロンティアAIエージェントを対象にしています。
Agent Red Teamingベンチマークを構築し、19の最先端モデルで評価します。
私たちの発見は、今日のAIエージェントの重要かつ永続的な脆弱性を浮き彫りにしたものです。
論文 参考訳(メタデータ) (2025-07-28T05:13:04Z) - Enhancing Clinical Decision-Making: Integrating Multi-Agent Systems with Ethical AI Governance [1.0195618602298682]
実験結果, バイタルサイン, 臨床状況を分析するために, モジュラーエージェントを用いた新規エージェントシステムの設計を比較した。
我々は,eICUデータベースを用いて,実験室分析,バイタルのみのインタプリタ,文脈推論エージェントなどのエージェントシステムを実装した。
論文 参考訳(メタデータ) (2025-03-25T05:32:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。