Fugu-MT 論文翻訳(概要): Helping Customers in Distress: An LLM-powered Agent that Converses, Probes, and Routes

論文の概要: Helping Customers in Distress: An LLM-powered Agent that Converses, Probes, and Routes

arxiv url: http://arxiv.org/abs/2605.16268v1
Date: Tue, 31 Mar 2026 15:07:20 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-25 12:34:33.839898
Title: Helping Customers in Distress: An LLM-powered Agent that Converses, Probes, and Routes
Title（参考訳）: リモートで顧客を助ける: 会話、プローブ、ルートをLLMで操作するエージェント
Authors: Alankar Atreya, Stefan Sylvius Wanger, Devesh Batra, Robert Hankache, Cristovao Iglesias, Patrick Sinclair, Giulio Pelosio, Michael McMillan, Greig A. Cowan, Raad Khraishi,
Abstract要約: 銀行は毎年数百万件の詐欺、詐欺、紛争の報告を受け取っている。この問題に対処するため、顧客向けAI駆動トリアージエージェントを開発した。マルチターン会話を行い、関連する質問をし、正確でポリシーを導いたルーティングのケースを分類する。
参考スコア（独自算出の注目度）: 0.8738446148742723
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Banks receive millions of reports of fraud, scams, and disputed transactions every year, making it challenging to accurately direct customers to the appropriate specialist teams for assistance. The existing manual process driven by humans is slow and stressful for both customers and staff. To address this, we develop a customer-facing AI powered triaging agent that leverages large language models (LLMs) to conduct multi-turn conversations, ask relevant questions, and classify cases for accurate, policy-guided routing, making it embedded in the customer journey. To evaluate and continuously improve the agent, synthetic digital twins of real customers were simulated, generating realistic, labelled dialogues based on historical data to test a wide range of real-world scenarios. This work details the triage agent's modelling approach, integration with policy, safety guardrails and reasoning frameworks, the use of the synthetic agent for scalable evaluation, and findings on the AI system's accuracy, robustness, and compliance. Results show that the agent successfully improves triaging of historical cases, achieving a 30.6% increase in classification accuracy, with high satisfaction levels reported by our subject-matter experts, highlighting how targeted probing can lead to more effective triage in banking operations at scale.
Abstract（参考訳）: 銀行は毎年数百万件の詐欺、詐欺、紛争行為の報告を受けており、顧客を適切な専門家チームに正確に支援するのは難しい。人間によって駆動される既存の手動のプロセスは、顧客とスタッフの両方にとって遅くてストレスがあります。これを解決するために、大規模な言語モデル(LLM)を活用して、マルチターン会話を行い、関連する質問をし、正確でポリシーを導いたルーティングのケースを分類し、顧客ジャーニーに組み込む、顧客向けAI駆動型トリアージエージェントを開発した。エージェントの評価と改善を継続的に行うために、実際の顧客のデジタルツインをシミュレートし、歴史的データに基づいてリアルなラベル付き対話を生成し、幅広い実世界のシナリオをテストする。この研究は、トリアージエージェントのモデリングアプローチ、ポリシーとの統合、安全ガードレールと推論フレームワーク、スケーラブルな評価のための合成エージェントの使用、AIシステムの正確性、堅牢性、コンプライアンスに関する知見を詳述する。以上の結果から,対象検定が銀行業務においてより効果的なトリアージに繋がる可能性を明らかにするとともに,分類精度を30.6%向上させることで,過去の事例のトリアージの改善に成功していることが示された。

関連論文リスト

From Transcripts to AI Agents: Knowledge Extraction, RAG Integration, and Robust Evaluation of Conversational AI Assistants [0.0]
顧客向け産業向けの信頼できる会話AIアシスタントの構築は、ノイズの多い会話データ、断片化された知識、正確なヒューマンハンドオフの必要性により、依然として困難である。本稿では,履歴書から直接対話型AIアシスタントを構築し,評価するためのエンドツーエンドフレームワークを提案する。
論文参考訳（メタデータ） (2026-01-26T07:44:47Z)
AgentPRM: Process Reward Models for LLM Agents via Step-Wise Promise and Progress [71.02263260394261]
大規模言語モデル(LLM)は、マルチターン意思決定タスクにおいて依然として課題に直面している。プロセス報酬モデル(PRM)を構築し、各意思決定を評価し、エージェントの意思決定プロセスを導く。 AgentPRMは、シーケンシャルな決定と最終的な目標への貢献の間の相互依存の両方をキャプチャする。
論文参考訳（メタデータ） (2025-11-11T14:57:54Z)
Holistic Agent Leaderboard: The Missing Infrastructure for AI Agent Evaluation [87.47155146067962]
数百のタスクで並列評価をオーケストレーションする,標準化された評価ハーネスを提供する。モデル、足場、ベンチマークにまたがる3次元解析を行う。私たちの分析では、ほとんどのランで精度を低下させる高い推論努力など、驚くべき洞察が示されています。
論文参考訳（メタデータ） (2025-10-13T22:22:28Z)
How can we assess human-agent interactions? Case studies in software agent design [52.953425368394306]
我々は,人間とエージェントの相互作用の厳密な評価に向けて,二つの大きな一歩を踏み出した。エージェント設計のより効率的な人間中心評価のためのフレームワークであるPULSEを提案する。私たちは、オープンソースのソフトウェアエージェントOpenHandsを中心に構築された大規模なWebプラットフォームにフレームワークをデプロイします。
論文参考訳（メタデータ） (2025-10-10T19:04:28Z)
MADS: Multi-Agent Dialogue Simulation for Diverse Persuasion Data Generation [10.585352489359684]
エージェントによるマルチターン対話を生成するスケーラブルなフレームワークMADS(Multi-Agent Dialogue Simulation)を提案する。 MADSには3つの調整されたエージェントがある: ユーザエージェントは、Zodiac SignsやMBTIタイプのようなパーソナライズ記号を活用することで、多様なペルソナ駆動の振る舞いをシミュレートするように設計されている。さらに,ユーザによるCoA(Chain-of-Attitude)モデリングとLLMのパーサーション評価を通じて,その有効性を検証する。
論文参考訳（メタデータ） (2025-09-30T06:55:39Z)
Co-Investigator AI: The Rise of Agentic AI for Smarter, Trustworthy AML Compliance Narratives [2.7295959384567356]
Co-Investigator AIは、SAR(Suspicious Activity Reports)の作成に最適化されたエージェントフレームワークであり、従来の方法よりも大幅に高速で精度が高い。我々は、SARの草案作成を効率化し、物語を規制上の期待と一致させ、コンプライアンスチームが高次の分析作業に集中できるようにする能力を示します。
論文参考訳（メタデータ） (2025-09-10T08:16:04Z)
CRMArena: Understanding the Capacity of LLM Agents to Perform Professional CRM Tasks in Realistic Environments [90.29937153770835]
CRMArenaは、プロフェッショナルな作業環境に根ざした現実的なタスクにおいて、AIエージェントを評価するために設計されたベンチマークである。現状のLDMエージェントはReActプロンプトのタスクの40%以下で成功し,機能呼び出し能力でも55%以下であった。この結果から,実環境に展開する関数呼び出しやルールフォローにおいて,エージェント機能の向上の必要性が示唆された。
論文参考訳（メタデータ） (2024-11-04T17:30:51Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。