論文の概要: A Nonparametric Contextual Bandit with Arm-level Eligibility Control for
Customer Service Routing
- arxiv url: http://arxiv.org/abs/2209.05278v1
- Date: Thu, 8 Sep 2022 19:20:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-13 13:36:51.796229
- Title: A Nonparametric Contextual Bandit with Arm-level Eligibility Control for
Customer Service Routing
- Title(参考訳): 顧客サービスルーティングのためのアームレベル適性制御を用いた非パラメトリックコンテキストバンディット
- Authors: Ruofeng Wen, Wenjun Zeng, Yi Liu
- Abstract要約: Amazon Customer Serviceは、毎年数百万の顧客連絡先をリアルタイムにサポートしている。
ボット・リゾルバは一部のトラフィックを自動化するのに役立ちますが、人間エージェントの需要は高いままです。
- 参考スコア(独自算出の注目度): 61.10434777324718
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Amazon Customer Service provides real-time support for millions of customer
contacts every year. While bot-resolver helps automate some traffic, we still
see high demand for human agents, also called subject matter experts (SMEs).
Customers outreach with questions in different domains (return policy, device
troubleshooting, etc.). Depending on their training, not all SMEs are eligible
to handle all contacts. Routing contacts to eligible SMEs turns out to be a
non-trivial problem because SMEs' domain eligibility is subject to training
quality and can change over time. To optimally recommend SMEs while
simultaneously learning the true eligibility status, we propose to formulate
the routing problem with a nonparametric contextual bandit algorithm (K-Boot)
plus an eligibility control (EC) algorithm. K-Boot models reward with a kernel
smoother on similar past samples selected by $k$-NN, and Bootstrap Thompson
Sampling for exploration. EC filters arms (SMEs) by the initially
system-claimed eligibility and dynamically validates the reliability of this
information. The proposed K-Boot is a general bandit algorithm, and EC is
applicable to other bandits. Our simulation studies show that K-Boot performs
on par with state-of-the-art Bandit models, and EC boosts K-Boot performance
when stochastic eligibility signal exists.
- Abstract(参考訳): Amazon Customer Serviceは、毎年数百万の顧客連絡先をリアルタイムにサポートする。
ボット・リゾルバは一部のトラフィックを自動化するのに役立ちますが、それでも人間のエージェントには高い需要があります。
顧客は、異なるドメイン(ポリシー、デバイストラブルシューティングなど)の質問に圧倒される。
訓練によっては、すべての中小企業がすべての連絡先を処理できるわけではない。
適格な中小企業へのコンタクトのルーティングは、SMEのドメインの適格性はトレーニング品質の対象であり、時間とともに変化する可能性があるため、非自明な問題であることが判明した。
そこで本研究では,smesを最適に推奨するために,非パラメトリックコンテクストバンディットアルゴリズム (k-boot) とeligibility control (ec) アルゴリズムを用いてルーティング問題を定式化する手法を提案する。
k-bootモデルは、$k$-nnとbootstrap thompson samplingによって選択された同様の過去のサンプルでカーネルスムースに報いる。
ECは、初期システム定義の適性によってアーム(SME)をフィルタリングし、この情報の信頼性を動的に検証する。
提案したK-Bootは一般的なバンディットアルゴリズムであり、ECは他のバンディットに適用できる。
シミュレーションにより,K-Bootは最先端のBanditモデルと同等に動作し,ECは確率的可視信号が存在する場合,K-Bootの性能を向上させることが示された。
関連論文リスト
- A Federated Distributionally Robust Support Vector Machine with Mixture of Wasserstein Balls Ambiguity Set for Distributed Fault Diagnosis [3.662364375995991]
本研究では、中央サーバとG$クライアントで構成されるネットワーク上で、データを共有せずに、分散ロバストな(DR)サポートベクタマシン(SVM)をフェデレーション方式でトレーニングする問題について検討する。
グローバルFDR-SVMをトレーニングするための2つの分散最適化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-04T19:21:45Z) - A Federated Online Restless Bandit Framework for Cooperative Resource Allocation [23.698976872351576]
MRPの未知系力学を用いた協調資源配分問題について検討する。
我々は、このマルチエージェントオンラインRMAB問題を解決するために、フェデレートトンプソン対応Whittle Index(FedTSWI)アルゴリズムを作成した。
数値計算の結果,提案アルゴリズムは,ベースラインと比較して,$mathcalO(sqrtTlog(T))$の高速収束率と性能の向上を実現している。
論文 参考訳(メタデータ) (2024-06-12T08:34:53Z) - FedADMM-InSa: An Inexact and Self-Adaptive ADMM for Federated Learning [1.802525429431034]
我々はFedADMM-InSaと呼ばれる不正確な自己適応型FedADMMアルゴリズムを提案する。
結果の不正確なADMMの収束は、強い凸損失関数の仮定の下で証明される。
提案アルゴリズムは,クライアントの局所的な計算負荷を大幅に低減し,バニラFedADMMと比較して学習プロセスを高速化する。
論文 参考訳(メタデータ) (2024-02-21T18:19:20Z) - Multi-agent Attention Actor-Critic Algorithm for Load Balancing in
Cellular Networks [33.72503214603868]
セルラーネットワークでは、ユーザ機器(UE)が基地局から別の基地局へハンドオフし、BS間の負荷分散問題を引き起こした。
本稿では,負荷分散問題をマルコフゲームとして定式化し,ロバストマルチエージェント・アテンション・アクタ・クリティカル(Robust-MA3C)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-03-14T15:51:33Z) - Beyond ADMM: A Unified Client-variance-reduced Adaptive Federated
Learning Framework [82.36466358313025]
我々はFedVRAと呼ばれる原始二重FLアルゴリズムを提案し、このアルゴリズムはグローバルモデルの分散還元レベルとバイアスを適応的に制御することができる。
半教師付き画像分類タスクに基づく実験は,既存の手法よりもFedVRAの方が優れていることを示す。
論文 参考訳(メタデータ) (2022-12-03T03:27:51Z) - Byzantine-Robust Online and Offline Distributed Reinforcement Learning [60.970950468309056]
本稿では,複数のエージェントが環境を探索し,その経験を中央サーバを通じて伝達する分散強化学習環境について考察する。
エージェントの$alpha$-fractionは敵対的であり、任意の偽情報を報告することができる。
我々は、これらの対立エージェントの存在下で、マルコフ決定プロセスの根底にある準最適政策を特定することを模索する。
論文 参考訳(メタデータ) (2022-06-01T00:44:53Z) - Markov Decision Process modeled with Bandits for Sequential Decision
Making in Linear-flow [73.1896399783641]
会員/加入者の獲得と保持では、複数のページを連続してマーケティングコンテンツを推奨する必要がある。
遷移確率行列をモデル化するためにBandits を用いた MDP としてこの問題を定式化することを提案する。
提案したMDPのBanditsアルゴリズムは,$epsilon$-greedyと$epsilon$-greedy,$epsilon$,IndependentBandits,InteractionBanditsでQ-learningを上回っている。
論文 参考訳(メタデータ) (2021-07-01T03:54:36Z) - Low-Latency Federated Learning over Wireless Channels with Differential
Privacy [142.5983499872664]
フェデレートラーニング(FL)では、モデルトレーニングはクライアントに分散し、ローカルモデルは中央サーバによって集約される。
本稿では,各クライアントの差分プライバシ(DP)要件だけでなく,全体としてのトレーニング性能に制約された無線チャネル上でのFLトレーニング遅延を最小限に抑えることを目的とする。
論文 参考訳(メタデータ) (2021-06-20T13:51:18Z) - Coded Stochastic ADMM for Decentralized Consensus Optimization with Edge
Computing [113.52575069030192]
セキュリティ要件の高いアプリケーションを含むビッグデータは、モバイルデバイスやドローン、車両など、複数の異種デバイスに収集され、格納されることが多い。
通信コストとセキュリティ要件の制限のため、核融合センターにデータを集約するのではなく、分散的に情報を抽出することが最重要となる。
分散エッジノードを介してデータを局所的に処理するマルチエージェントシステムにおいて,モデルパラメータを学習する問題を考える。
分散学習モデルを開発するために,乗算器アルゴリズムの最小バッチ交互方向法(ADMM)のクラスについて検討した。
論文 参考訳(メタデータ) (2020-10-02T10:41:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。