論文の概要: A Semi-supervised Multi-task Learning Approach to Classify Customer
Contact Intents
- arxiv url: http://arxiv.org/abs/2106.07381v1
- Date: Thu, 10 Jun 2021 16:13:05 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-15 16:39:13.018404
- Title: A Semi-supervised Multi-task Learning Approach to Classify Customer
Contact Intents
- Title(参考訳): 半教師付きマルチタスク学習による顧客接触意図の分類
- Authors: Li Dong, Matthew C. Spencer, Amir Biagi
- Abstract要約: EコマースのWebサイト上で、顧客サポートサービスのためのテキストベースの意図分類モデルを構築します。
我々は、モデルをマルチクラス分類からセミ教師付きマルチタスク学習に進化させることにより、性能を著しく向上させる。
評価において、最終モデルは、ベースラインの微調整されたマルチクラス分類ALBERTモデルと比較して平均AUC ROCを約20ポイント向上させる。
- 参考スコア(独自算出の注目度): 6.267558847860381
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the area of customer support, understanding customers' intents is a
crucial step. Machine learning plays a vital role in this type of intent
classification. In reality, it is typical to collect confirmation from customer
support representatives (CSRs) regarding the intent prediction, though it can
unnecessarily incur prohibitive cost to ask CSRs to assign existing or new
intents to the mis-classified cases. Apart from the confirmed cases with and
without intent labels, there can be a number of cases with no human curation.
This data composition (Positives + Unlabeled + multiclass Negatives) creates
unique challenges for model development. In response to that, we propose a
semi-supervised multi-task learning paradigm. In this manuscript, we share our
experience in building text-based intent classification models for a customer
support service on an E-commerce website. We improve the performance
significantly by evolving the model from multiclass classification to
semi-supervised multi-task learning by leveraging the negative cases, domain-
and task-adaptively pretrained ALBERT on customer contact texts, and a number
of un-curated data with no labels. In the evaluation, the final model boosts
the average AUC ROC by almost 20 points compared to the baseline finetuned
multiclass classification ALBERT model.
- Abstract(参考訳): カスタマーサポートの分野では、顧客の意図を理解することが重要なステップです。
機械学習は、この種の意図分類において重要な役割を果たす。
実際には、顧客サポート担当者(csr)から意図予測に関する確認を集めるのが一般的であるが、誤分類されたケースに既存の意図や新しい意図を割り当てるようcsrに依頼するのに必要な制限コストは不要である。
意図ラベルのない確認された症例とは別に、人間の治験のないケースが多数存在する。
このデータ構成(Positives + Unlabeled + Multiclass Negatives)は、モデル開発に固有の課題を生み出します。
そこで本研究では,半教師付きマルチタスク学習パラダイムを提案する。
本論文では,EコマースのWebサイト上で,顧客サポートサービスのためのテキストベースの意図分類モデルを構築する経験について紹介する。
我々は,ユーザコンタクトテキストに負の場合,ドメインおよびタスク適応型ALBERT,ラベルのない未修正データを活用することで,マルチクラス分類から半教師付きマルチタスク学習へモデルを進化させることにより,性能を著しく向上させる。
評価において、最終モデルは、ベースラインの微調整されたマルチクラス分類ALBERTモデルと比較して平均AUC ROCを約20ポイント向上させる。
関連論文リスト
- A General Model for Aggregating Annotations Across Simple, Complex, and
Multi-Object Annotation Tasks [51.14185612418977]
ラベルの品質を改善するための戦略は、複数のアノテータに同じ項目にラベルを付け、ラベルを集約するように求めることである。
特定のタスクに対して様々なbespokeモデルが提案されているが、様々な複雑なタスクを一般化するアグリゲーションメソッドを導入するのはこれが初めてである。
本論では,3つの新たな研究課題について検討し,今後の課題を概説する。
論文 参考訳(メタデータ) (2023-12-20T21:28:35Z) - Multi-output Headed Ensembles for Product Item Classification [0.9053163124987533]
本稿では,eコマースカタログを対象としたディープラーニングに基づく分類モデルフレームワークを提案する。
我々は、ロバストな業界標準ベースラインモデルに対する改善を示す。
また,ユーザセッションを用いたモデル性能評価手法を提案する。
論文 参考訳(メタデータ) (2023-07-29T01:23:36Z) - Scalable Collaborative Learning via Representation Sharing [53.047460465980144]
フェデレートラーニング(FL)とスプリットラーニング(SL)は、データを(デバイス上で)プライベートにしながら協調学習を可能にする2つのフレームワークである。
FLでは、各データ保持者がモデルをローカルにトレーニングし、集約のために中央サーバにリリースする。
SLでは、クライアントは個々のカット層アクティベーション(スマッシュされたデータ)をサーバにリリースし、そのレスポンス(推論とバックの伝搬の両方)を待つ必要があります。
本研究では, クライアントがオンライン知識蒸留を通じて, 対照的な損失を生かして協調する, プライバシ保護機械学習の新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-11-20T10:49:22Z) - Few-Shot Class-Incremental Learning by Sampling Multi-Phase Tasks [59.12108527904171]
モデルは新しいクラスを認識し、古いクラスに対する差別性を維持すべきである。
古いクラスを忘れずに新しいクラスを認識するタスクは、FSCIL ( few-shot class-incremental Learning) と呼ばれる。
我々は,LearnIng Multi-phase Incremental Tasks (LIMIT) によるメタラーニングに基づくFSCILの新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2022-03-31T13:46:41Z) - Neighborhood Contrastive Learning for Novel Class Discovery [79.14767688903028]
我々は,クラスタリング性能に重要な識別表現を学習するために,Neighborhood Contrastive Learningという新しいフレームワークを構築した。
これらの2つの成分がクラスタリング性能に大きく寄与し、我々のモデルが最先端の手法よりも大きなマージンで優れていることを実験的に実証した。
論文 参考訳(メタデータ) (2021-06-20T17:34:55Z) - Improved Customer Transaction Classification using Semi-Supervised
Knowledge Distillation [0.0]
本稿では,セミスーパービジョンおよび知識蒸留フレームワークに基づくコスト効率の高いトランザクション分類手法を提案する。
このアプローチは、顧客が入力した自由テキストを用いてトランザクションのカテゴリを特定する。
弱いラベルを使い、人間の注釈付きサンプルを使うのと性能が似ていることに気付きます。
論文 参考訳(メタデータ) (2021-02-15T16:16:42Z) - Adaptive Prototypical Networks with Label Words and Joint Representation
Learning for Few-Shot Relation Classification [17.237331828747006]
本研究は,少ショット関係分類(FSRC)に焦点を当てる。
クラスプロトタイプの表現にラベル単語を追加するための適応的混合機構を提案する。
FewRelでは、異なる数ショット(FS)設定で実験が行われた。
論文 参考訳(メタデータ) (2021-01-10T11:25:42Z) - Learning Adaptive Embedding Considering Incremental Class [55.21855842960139]
CIL(Class-Incremental Learning)は,未知のクラスを逐次生成するストリーミングデータを用いて,信頼性の高いモデルをトレーニングすることを目的としている。
従来のクローズドセット学習とは異なり、CILには2つの大きな課題がある。
新たなクラスが検出された後、以前のデータ全体を使用して再トレーニングすることなく、モデルを更新する必要がある。
論文 参考訳(メタデータ) (2020-08-31T04:11:24Z) - Automatic Validation of Textual Attribute Values in E-commerce Catalog
by Learning with Limited Labeled Data [61.789797281676606]
そこで我々はMetaBridgeと呼ばれる新しいメタ学習潜伏変数アプローチを提案する。
限られたラベル付きデータを持つカテゴリのサブセットから、転送可能な知識を学ぶことができる。
ラベルのないデータで、目に見えないカテゴリの不確実性を捉えることができる。
論文 参考訳(メタデータ) (2020-06-15T21:31:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。