論文の概要: Contextual Bandit Applications in Customer Support Bot
- arxiv url: http://arxiv.org/abs/2112.03210v1
- Date: Mon, 6 Dec 2021 18:07:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-07 17:38:25.471241
- Title: Contextual Bandit Applications in Customer Support Bot
- Title(参考訳): 顧客サポートボットにおけるコンテキスト帯域アプリケーション
- Authors: Sandra Sajeev, Jade Huang, Nikos Karampatziakis, Matthew Hall,
Sebastian Kochman, and Weizhu Chen
- Abstract要約: 文脈的包帯のような適応型学習技術は、この問題設定に自然に適合する。
本稿では,Microsoft仮想エージェントのコンテキスト帯の現実的実装について論じる。
その結果,問題解決率の12%以上の相対的な増加と,操作者に対するエスカレーションの4%以上の相対的な減少が得られた。
- 参考スコア(独自算出の注目度): 8.339868677201062
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Virtual support agents have grown in popularity as a way for businesses to
provide better and more accessible customer service. Some challenges in this
domain include ambiguous user queries as well as changing support topics and
user behavior (non-stationarity). We do, however, have access to partial
feedback provided by the user (clicks, surveys, and other events) which can be
leveraged to improve the user experience. Adaptable learning techniques, like
contextual bandits, are a natural fit for this problem setting. In this paper,
we discuss real-world implementations of contextual bandits (CB) for the
Microsoft virtual agent. It includes intent disambiguation based on
neural-linear bandits (NLB) and contextual recommendations based on a
collection of multi-armed bandits (MAB). Our solutions have been deployed to
production and have improved key business metrics of the Microsoft virtual
agent, as confirmed by A/B experiments. Results include a relative increase of
over 12% in problem resolution rate and relative decrease of over 4% in
escalations to a human operator. While our current use cases focus on intent
disambiguation and contextual recommendation for support bots, we believe our
methods can be extended to other domains.
- Abstract(参考訳): 仮想サポートエージェントは、ビジネスがより良く、よりアクセスしやすいカスタマサービスを提供する手段として人気を高めています。
この領域の課題には、あいまいなユーザクエリ、サポートトピックの変更、ユーザ動作(非定常性)などがある。
しかし、ユーザから提供される部分的なフィードバック(クリック、サーベイ、その他のイベント)へのアクセスは、ユーザエクスペリエンスを改善するために利用できます。
文脈的包帯のような適応型学習技術は、この問題設定に自然に適合する。
本稿では,Microsoft 仮想エージェントのコンテキスト的帯域幅 (CB) の現実的実装について論じる。
神経リニア・バンディット(NLB)に基づく意図の曖昧さや、マルチアーム・バンディット(MAB)のコレクションに基づくコンテキストレコメンデーションが含まれる。
私たちのソリューションは本番環境にデプロイされ、A/B実験で確認されたように、Microsoft仮想エージェントの重要なビジネスメトリクスが改善されました。
その結果,問題解決率の12%以上の相対的な増加と,操作者に対するエスカレーションの4%以上の相対的な減少が得られた。
現在のユースケースは、サポートボットに対する意図の曖昧さとコンテキスト的推奨に重点を置いていますが、私たちのメソッドは他のドメインにも拡張できると考えています。
関連論文リスト
- Salespeople vs SalesBot: Exploring the Role of Educational Value in
Conversational Recommender Systems [78.84530426424838]
既存の会話レコメンデータシステムは、ユーザのバックグラウンド知識の欠如をよく見落とし、好みの収集にのみ焦点をあてる。
このようなシステムのシミュレーションと評価を容易にするフレームワークであるSalesOpsを紹介する。
私たちは、フレームワークの両側をシミュレートできるLLMベースのエージェントであるSalesBotとShopperBotを構築しています。
論文 参考訳(メタデータ) (2023-10-26T19:44:06Z) - Leveraging User-Triggered Supervision in Contextual Bandits [34.58466163463977]
本研究では,コンテキスト的帯域幅(CB)問題について検討する。
我々は,そのバイアスの性質に頑健でありながら,そのような信号を利用する新しい枠組みを開発する。
論文 参考訳(メタデータ) (2023-02-07T22:42:27Z) - A Nonparametric Contextual Bandit with Arm-level Eligibility Control for
Customer Service Routing [61.10434777324718]
Amazon Customer Serviceは、毎年数百万の顧客連絡先をリアルタイムにサポートしている。
ボット・リゾルバは一部のトラフィックを自動化するのに役立ちますが、人間エージェントの需要は高いままです。
論文 参考訳(メタデータ) (2022-09-08T19:20:20Z) - Two-Stage Neural Contextual Bandits for Personalised News Recommendation [50.3750507789989]
既存のパーソナライズされたニュースレコメンデーション手法は、ユーザの興味を搾取することに集中し、レコメンデーションにおける探索を無視する。
我々は、エクスプロイトと探索のトレードオフに対処する文脈的包括的レコメンデーション戦略に基づいて構築する。
我々はユーザとニュースにディープラーニング表現を使用し、ニューラルアッパー信頼境界(UCB)ポリシーを一般化し、加法的 UCB と双線形 UCB を一般化する。
論文 参考訳(メタデータ) (2022-06-26T12:07:56Z) - Incentivizing Combinatorial Bandit Exploration [87.08827496301839]
自己関心のあるユーザに対してレコメンデーションシステムでアクションを推奨するバンディットアルゴリズムを考える。
ユーザーは他のアクションを自由に選択でき、アルゴリズムの推奨に従うためにインセンティブを得る必要がある。
ユーザは悪用を好むが、アルゴリズムは、前のユーザから収集した情報を活用することで、探索にインセンティブを与えることができる。
論文 参考訳(メタデータ) (2022-06-01T13:46:25Z) - Byzantine-Robust Online and Offline Distributed Reinforcement Learning [60.970950468309056]
本稿では,複数のエージェントが環境を探索し,その経験を中央サーバを通じて伝達する分散強化学習環境について考察する。
エージェントの$alpha$-fractionは敵対的であり、任意の偽情報を報告することができる。
我々は、これらの対立エージェントの存在下で、マルコフ決定プロセスの根底にある準最適政策を特定することを模索する。
論文 参考訳(メタデータ) (2022-06-01T00:44:53Z) - LBCF: A Large-Scale Budget-Constrained Causal Forest Algorithm [11.82503645248441]
予算制約の下で各ユーザに対して適切なインセンティブ(すなわち治療)を選択する方法が重要な研究課題である。
本稿では,大規模予算制約付き因果樹林 (LBCF) アルゴリズムと呼ばれる,予算制約下での新規な木に基づく治療選択手法を提案する。
当社のアプローチは,ユーザのキャンペーンエンゲージメント期間を増やすために,大規模なビデオプラットフォーム上で現実のシナリオに展開する。
論文 参考訳(メタデータ) (2022-01-29T13:21:07Z) - Learning without Knowing: Unobserved Context in Continuous Transfer
Reinforcement Learning [16.814772057210366]
連続状態と行動空間における伝達強化学習問題を、観測不能な文脈情報の下で検討する。
我々のゴールは、コンテキスト認識の専門家データを使用して、学習者に最適なコンテキスト認識ポリシーを学習することである。
論文 参考訳(メタデータ) (2021-06-07T17:49:22Z) - Partial Bandit and Semi-Bandit: Making the Most Out of Scarce Users'
Feedback [62.997667081978825]
本稿では,ユーザのフィードバックを考慮し,3つの戦略を用いて評価する手法を提案する。
ユーザからのフィードバックが制限されているにも関わらず(全体の20%以下)、我々の手法は最先端のアプローチと同じような結果が得られる。
論文 参考訳(メタデータ) (2020-09-16T07:32:51Z) - User Intention Recognition and Requirement Elicitation Method for
Conversational AI Services [7.941589241861105]
私たちは、できるだけ少数のラウンドで、ユーザー要求を正確に取得することを目指しています。
ファジィ要件推論のための知識グラフ(KG)に基づくユーザ意図認識手法を開発した。
ダイアログポリシ生成のために,グラニュラーコンピューティングに基づく要件抽出手法を提案した。
論文 参考訳(メタデータ) (2020-09-03T08:26:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。