論文の概要: Learning Selective LLM Autonomy from Copilot Feedback in Enterprise Customer Support Workflows
- arxiv url: http://arxiv.org/abs/2604.23855v1
- Date: Sun, 26 Apr 2026 19:50:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.595119
- Title: Learning Selective LLM Autonomy from Copilot Feedback in Enterprise Customer Support Workflows
- Title(参考訳): 企業顧客支援ワークフローにおけるコパイロットフィードバックからの選択型LDMオートノミーの学習
- Authors: Nikita Borovkov, Elisei Rykov, Olga Tsymboi, Sergei Filimonov, Nikita Surnachev, Dmitry Bitman, Anatolii Potapov,
- Abstract要約: 本稿では,エンタープライズ・プロセス・マネジメント・プラットフォーム内でエンド・ツー・エンドのカスタマーサポートを自動化するシステムを提案する。
このアプローチはプロダクション環境でスケーラブルで、新しいプロセスのために2週間以内に選択的な自動化に到達します。
プロダクションでは、セッションの45%を自動化し、サポート品質のレベルを低下させることなく平均処理時間を39%削減した。
- 参考スコア(独自算出の注目度): 1.4629316842224667
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a deployed system that automates end-to-end customer support workflows inside an enterprise Business Process Management (BPM) platform. The approach is scalable in production and reaches selective automation within two weeks for a new process, leveraging supervision already generated at scale: structured per-case UI interaction traces and low-overhead copilot feedback, where operators either accept a suggestion or provide a correction. A staged deployment pipeline trains a next UI action policy, learns a critic from copilot feedback to calibrate abstention, and executes only high-confidence steps in the background while deferring uncertain decisions to operators and resuming from the updated UI state. This setup lets one operator supervise multiple concurrent sessions and be interrupted only when the system is uncertain. The system operates on a schema-driven view of the BPM interface and includes monitoring and safe fallbacks for production. In production, it automated 45% of sessions and reduced average handling time by 39% without degrading support quality level.
- Abstract(参考訳): エンタープライズビジネスプロセスマネジメント(BPM)プラットフォーム内で、エンド・ツー・エンドのカスタマーサポートワークフローを自動化するデプロイシステムを提案する。
このアプローチは本番環境でスケーラブルで、新しいプロセスのために2週間以内に選択的な自動化に到達し、構造化されたケースごとのUIインタラクショントレースと低オーバーヘッドのコピロトフィードバックという、すでに生成した監視機能を活用する。
ステージ化されたデプロイメントパイプラインは、次のUIアクションポリシをトレーニングし、コピロのフィードバックから批判を学び、停止を調整し、バックグラウンドで信頼性の高いステップのみを実行し、不確実な決定をオペレータに延期し、更新されたUI状態から再開する。
このセットアップにより、1つのオペレータが複数の同時セッションを監視でき、システムが不確実な場合にのみ中断される。
システムはBPMインターフェースのスキーマ駆動ビューで動作し、監視と運用上の安全なフォールバックを含む。
プロダクションでは、セッションの45%を自動化し、サポート品質のレベルを低下させることなく平均処理時間を39%削減した。
関連論文リスト
- EE-MCP: Self-Evolving MCP-GUI Agents via Automated Environment Generation and Experience Learning [24.190399395358014]
MCP-GUIは、エージェントが各モダリティが相補的な利点を提供するときに学習する統合型ポリシー学習問題として定式化される。
本稿では,自動環境生成と検証,軌跡収集,ギャップ駆動型タスク合成,品質フィルタによるトレーニングを編成する,完全自動パイプラインによる自己進化型フレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-10T18:46:05Z) - GPA: Learning GUI Process Automation from Demonstrations [59.82483926336919]
GPAは軽量だが汎用的なビジョンベースロボットプロセス自動化(RPA)である
1つのデモだけで、高速で安定したプロセスのリプレイが可能になる。
従来のRPAの脆弱性と、現在のビジョン言語モデルに基づくGUIエージェントの非決定論的リスクに対処する。
論文 参考訳(メタデータ) (2026-04-02T06:27:52Z) - Orchestration-Free Customer Service Automation: A Privacy-Preserving and Flowchart-Guided Framework [16.034888856877565]
本稿では,タスク指向フローチャート(TOF)を用いたオーケストレーションフリーフレームワークを提案する。
まず、TOFのコンポーネントと評価基準を定義し、次にコスト効率の良いフローチャート構築アルゴリズムを定式化し、サービス対話から手続き的知識を抽象化する。
ケーススタディを備えたWebベースのシステムデモをリリースすることにより、将来のサービス自動化の合理化を促進することを目指している。
論文 参考訳(メタデータ) (2026-02-17T06:17:37Z) - Auditable DevOps Automation via VSM and GQM [0.0]
本稿では、エンドツーエンドの配信システムを可視化し、遅延、リワーク、ハンドオフを定量化する統合フレームワークである textitVSM-GQM-DevOps を提案する。
このフレームワークは、観測された無駄からゴールに沿った質問、メトリクス、自動化候補まで、トレーサビリティを運用し、防御可能な優先順位付けアプローチを提供する。
論文 参考訳(メタデータ) (2026-01-07T04:36:24Z) - SCUBA: Salesforce Computer Use Benchmark [63.66753028386581]
SCUBAは、Salesforceプラットフォーム内の顧客関係管理(CRM)上のコンピュータ利用エージェントを評価するために設計されたベンチマークである。
SCUBAには、実際のユーザインタビューから派生した300のタスクインスタンスが含まれており、3つの主要なペルソナ、プラットフォーム管理者、セールス担当者、サービスエージェントで構成されている。
ゼロショット設定とデモ拡張設定の両方で、多様なエージェントのセットをベンチマークします。
論文 参考訳(メタデータ) (2025-09-30T16:48:49Z) - DriveTransformer: Unified Transformer for Scalable End-to-End Autonomous Driving [62.62464518137153]
DriveTransformerは、スケールアップを簡単にするためのシンプルなE2E-ADフレームワークである。
タスク・セルフ・アテンション、センサー・クロス・アテンション、時間的クロス・アテンションという3つの統合された操作で構成されている。
シミュレーションされたクローズドループベンチマークBench2Driveと、FPSの高い実世界のオープンループベンチマークnuScenesの両方で、最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-03-07T11:41:18Z) - AutoPT: How Far Are We from the End2End Automated Web Penetration Testing? [54.65079443902714]
LLMによって駆動されるPSMの原理に基づく自動浸透試験エージェントであるAutoPTを紹介する。
以上の結果から, AutoPT は GPT-4o ミニモデル上でのベースラインフレームワーク ReAct よりも優れていた。
論文 参考訳(メタデータ) (2024-11-02T13:24:30Z) - Automating Staged Rollout with Reinforcement Learning [1.3750624267664155]
ステージドロールアウト(Staged rollout)は、システム障害などの壊滅的な結果を招くことなく、欠陥発見を加速するために、ソフトウェアアップデートをユーザの一部に段階的にリリースする戦略である。
本稿では,多目的強化学習による段階的ロールアウトを自動化し,新規機能の提供時間や遅延欠陥によるダウンタイムといった利害関係者のニーズを動的にバランスさせる可能性を示す。
論文 参考訳(メタデータ) (2022-04-01T21:22:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。