論文の概要: DuIVRS-2: An LLM-based Interactive Voice Response System for Large-scale POI Attribute Acquisition
- arxiv url: http://arxiv.org/abs/2605.17900v1
- Date: Mon, 18 May 2026 06:06:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:48.908237
- Title: DuIVRS-2: An LLM-based Interactive Voice Response System for Large-scale POI Attribute Acquisition
- Title(参考訳): DuIVRS-2:大規模POI属性獲得のためのLLMを用いた対話型音声応答システム
- Authors: Le Zhang, Shengming Zhang, Rui Zha, Yunpeng Wu, Jingbo Zhou, Jizhou Huang,
- Abstract要約: 本稿では,Baidu Mapsにおける大規模POI属性取得のための大規模言語モデル(LLM)に基づくエンドツーエンドフレームワークを提案する。
DuIVRS-2は毎日0.4万回の通話を処理し、83.9%のタスク成功率(TSR)を達成した。
この研究は、大規模産業対話アプリケーションのためのロバストで費用対効果の高いLLMエージェントを開発するために、生産実績のあるリファレンスを提供する。
- 参考スコア(独自算出の注目度): 28.52285542771737
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate Point of Interest (POI) attribute acquisition is essential for location-based services, yet traditional modular Interactive Voice Response (IVR) systems suffer from error accumulation and high maintenance overhead. We present DuIVRS-2, a large language model (LLM)-based end-to-end framework designed for large-scale POI attribute acquisition at Baidu Maps. To address the long-tail distribution of real-world interactions, our methodology first employs a finite state machine (FSM)-guided data augmentation strategy to synthesize a balanced and diverse training dataset. We then streamline dialogue management via a selective generation scheme combined with a Chain-of-Thought (CoT) mechanism, which ensures output stability and effectively eliminates hallucinations in industrial settings. To facilitate continuous policy refinement with minimal manual effort, we design a cooperative iterative learning framework that leverages a dual-evaluator voting system. Deployed in production for two months, DuIVRS-2 processed 0.4 million calls daily and achieved a 83.9\% Task Success Rate (TSR), outperforming its predecessor by 4 percentage points while maintaining a low reaction time of 130ms. This work provides a production-proven reference for developing robust, cost-effective LLM agents for large-scale industrial dialogue applications.
- Abstract(参考訳): 正確なpoint of Interest(POI)属性の取得は位置情報ベースのサービスには不可欠だが、従来のモジュール型インタラクティブ音声応答(IVR)システムはエラーの蓄積と高いメンテナンスオーバーヘッドに悩まされている。
Baidu Mapsにおける大規模POI属性取得のために設計された,大規模言語モデル(LLM)に基づくエンドツーエンドフレームワークであるDuIVRS-2を提案する。
実世界の相互作用の長期分布に対処するために,本手法ではまず有限状態マシン(FSM)誘導データ拡張戦略を用いて,バランスの取れた多様なトレーニングデータセットを合成する。
次に、選択生成方式とChain-of-Thought(CoT)機構を組み合わせることで対話管理を効率化し、出力安定性を確保し、産業環境における幻覚を効果的に除去する。
手作業が最小限に抑えられた継続的政策改善を容易にするために,両立投票システムを活用した協調的反復学習フレームワークを設計する。
2ヶ月の運用期間を経て、DuIVRS-2は毎日0.4万回の通話を処理し、83.9倍のタスク成功率(TSR)を達成した。
この研究は、大規模産業対話アプリケーションのためのロバストで費用対効果の高いLLMエージェントを開発するために、生産実績のあるリファレンスを提供する。
関連論文リスト
- RelayLLM: Efficient Reasoning via Collaborative Decoding [23.351598429979024]
RelayLLMはトークンレベルのコラボレーティブデコーディングによる効率的な推論のための新しいフレームワークである。
RelayLLM の平均精度は 49.52% であり,両モデル間の性能ギャップを効果的に埋めることを示す。
論文 参考訳(メタデータ) (2026-01-08T17:56:16Z) - Retrieval-Augmented Multi-LLM Ensemble for Industrial Part Specification Extraction [0.0]
本稿では,9つの最先端大言語モデル(LLM)を編成する検索強化マルチLLMアンサンブルフレームワークを提案する。
RAGsembleは、Gemini (2.0, 2.5, 1.5)、OpenAI (GPT-4o, o4-mini)、Mistral Large、Gemma (1B, 4B, 3n-e4b)などのモデルファミリーの補完的な強みを組み合わせることで、単一モデルシステムの重要な制限に対処する。
論文 参考訳(メタデータ) (2025-11-08T14:43:20Z) - LLM2: Let Large Language Models Harness System 2 Reasoning [65.89293674479907]
大規模言語モデル(LLM)は、無数のタスクにまたがって印象的な機能を示してきたが、時には望ましくない出力が得られる。
本稿では LLM とプロセスベースの検証器を組み合わせた新しいフレームワーク LLM2 を紹介する。
LLMs2は妥当な候補を生成するのに責任を持ち、検証者は望ましい出力と望ましくない出力を区別するためにタイムリーなプロセスベースのフィードバックを提供する。
論文 参考訳(メタデータ) (2024-12-29T06:32:36Z) - Automatic Evaluation for Text-to-image Generation: Task-decomposed Framework, Distilled Training, and Meta-evaluation Benchmark [62.58869921806019]
GPT-4oに基づくタスク分解評価フレームワークを提案し、新しいトレーニングデータセットを自動構築する。
我々は、GPT-4oの評価能力を7BオープンソースMLLM、MiniCPM-V-2.6に効果的に蒸留するための革新的なトレーニング戦略を設計する。
実験結果から,我々の蒸留したオープンソースMLLMは,現在のGPT-4oベースラインよりも有意に優れていた。
論文 参考訳(メタデータ) (2024-11-23T08:06:06Z) - DS-Agent: Automated Data Science by Empowering Large Language Models with Case-Based Reasoning [56.887047551101574]
大規模言語モデル(LLM)エージェントとケースベース推論(CBR)を利用した新しいフレームワークであるDS-Agentを提案する。
開発段階では、DS-AgentはCBRフレームワークに従い、自動イテレーションパイプラインを構築する。
デプロイメントの段階では、DS-Agentは、シンプルなCBRパラダイムで低リソースのデプロイメントステージを実装し、LCMの基本能力に対する需要を大幅に削減する。
論文 参考訳(メタデータ) (2024-02-27T12:26:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。