論文の概要: A Million Tweets Are Worth a Few Points: Tuning Transformers for
Customer Service Tasks
- arxiv url: http://arxiv.org/abs/2104.07944v1
- Date: Fri, 16 Apr 2021 07:45:04 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-20 00:01:19.728826
- Title: A Million Tweets Are Worth a Few Points: Tuning Transformers for
Customer Service Tasks
- Title(参考訳): 何百万ものツイートが重要: 顧客サービスタスクにトランスフォーマーをチューニング
- Authors: Amir Hadifar, Sofie Labat, V\'eronique Hoste, Chris Develder and
Thomas Demeester
- Abstract要約: オンラインドメイン固有のカスタマーサービスアプリケーションでは、多くの企業が高度なNLPモデルをうまくデプロイすることに苦労している。
特定のエンドタスクを微調整する前に、インドメインデータセット上で汎用的な多言語トランスフォーマーモデルを事前にトレーニングすることで、パフォーマンスが一貫して向上します。
- 参考スコア(独自算出の注目度): 11.506062545971568
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In online domain-specific customer service applications, many companies
struggle to deploy advanced NLP models successfully, due to the limited
availability of and noise in their datasets. While prior research demonstrated
the potential of migrating large open-domain pretrained models for
domain-specific tasks, the appropriate (pre)training strategies have not yet
been rigorously evaluated in such social media customer service settings,
especially under multilingual conditions. We address this gap by collecting a
multilingual social media corpus containing customer service conversations
(865k tweets), comparing various pipelines of pretraining and finetuning
approaches, applying them on 5 different end tasks. We show that pretraining a
generic multilingual transformer model on our in-domain dataset, before
finetuning on specific end tasks, consistently boosts performance, especially
in non-English settings.
- Abstract(参考訳): オンラインドメイン固有のカスタマーサービスアプリケーションでは、データセットの可用性とノイズが限られているため、多くの企業が高度なNLPモデルをうまくデプロイすることに苦労している。
以前の研究は、ドメイン固有タスクのための大規模なオープンドメイン事前トレーニングモデルへの移行の可能性を示したが、適切な(事前)トレーニング戦略は、ソーシャルメディアのカスタマーサービス設定、特に多言語環境において、厳密に評価されていない。
このギャップに対処するために,カスタマサービス会話(865万ツイート)を含む多言語ソーシャルメディアコーパスを収集し,プリトレーニングと微調整のさまざまなパイプラインを比較し,これらを5つの異なるエンドタスクに適用する。
ドメイン内データセット上で汎用多言語トランスフォーマーモデルを事前トレーニングした後、特定のタスクを微調整することで、特に英語以外の設定では、パフォーマンスが一貫して向上することを示す。
関連論文リスト
- P-MMEval: A Parallel Multilingual Multitask Benchmark for Consistent Evaluation of LLMs [84.24644520272835]
大きな言語モデル(LLM)は、翻訳、コード生成、推論といったタスクにまたがる様々な多言語機能を示す。
以前の評価では、その範囲を基本自然言語処理(NLP)や、独立した機能固有のタスクに制限することが多かった。
我々は、これらのベンチマークの有用性に関する以前の研究の監視に対処するため、大規模ベンチマークから利用可能な、合理的なベンチマークを選択するパイプラインを提案する。
本稿では,P-MMEvalを提案する。P-MMEval,P-MMEval,P-MMEval,P-MMEval,P-MMEval,P-MMEval。
論文 参考訳(メタデータ) (2024-11-14T01:29:36Z) - Feature Diversification and Adaptation for Federated Domain Generalization [27.646565383214227]
実世界のアプリケーションでは、ローカルクライアントは、しばしば制限されたドメイン内で動作し、クライアント間でのドメインシフトにつながる。
フェデレーション(federated feature diversification)の概念を導入し,プライバシを保ちながら,ローカルモデルによるクライアント不変表現の学習を支援する。
我々のグローバルモデルでは、目に見えないテスト領域データに対して堅牢な性能を示す。
論文 参考訳(メタデータ) (2024-07-11T07:45:10Z) - AnyTaskTune: Advanced Domain-Specific Solutions through Task-Fine-Tuning [22.208506419271043]
textbfAnyTaskTuneは、さまざまなドメイン固有のタスクでモデルパフォーマンスを高めるための、新しい微調整手法である。
金融,医療,法,心理学,消費者サービス,人的資源の領域から派生した20以上のサブタスクを対象とした実験を行った。
以上の結果から,textbfTask-Fine-Tune法を用いて微調整したモデルが,これらのタスクにおいて優れた性能を発揮するだけでなく,各領域で高い汎用性を持つモデルよりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2024-07-09T17:59:56Z) - Multi-Stage Pre-training Enhanced by ChatGPT for Multi-Scenario
Multi-Domain Dialogue Summarization [20.60018442168502]
マルチシナリオ・マルチドメイン・ダイアログの要約に特化して設計された,事前学習型モデルを提案する。
事前学習目標と微調整目標とのギャップを減らすために、多段階事前学習戦略を採用する。
論文 参考訳(メタデータ) (2023-10-16T11:16:07Z) - Bridging Cross-Lingual Gaps During Leveraging the Multilingual
Sequence-to-Sequence Pretraining for Text Generation [80.16548523140025]
プレトレインとファインチューンの間のギャップを埋めるために、コードスイッチングの復元タスクを追加して、バニラプレトレイン-ファインチューンパイプラインを拡張します。
提案手法は,言語間文表現距離を狭くし,簡単な計算コストで低周波語翻訳を改善する。
論文 参考訳(メタデータ) (2022-04-16T16:08:38Z) - Efficient Domain Adaptation of Language Models via Adaptive Tokenization [5.058301279065432]
ドメイン固有のサブワードシーケンスは,ベースおよびドメイン固有のコーパスの条件付きトークン分布の分岐から,直接的に決定可能であることを示す。
我々の手法は、トークン化器の強化を用いた他の手法よりも、より小さなモデルで、トレーニングや推論の時間が少なくなります。
論文 参考訳(メタデータ) (2021-09-15T17:51:27Z) - Federated Multi-Target Domain Adaptation [99.93375364579484]
フェデレートされた学習手法により、プライバシを保護しながら、分散ユーザデータ上で機械学習モデルをトレーニングすることが可能になります。
分散クライアントデータがラベル付けされず、集中型ラベル付きデータセットがサーバ上で利用可能となる、より実用的なシナリオを考えます。
本稿では,新しい課題に対処する効果的なDualAdapt法を提案する。
論文 参考訳(メタデータ) (2021-08-17T17:53:05Z) - Task-specific Objectives of Pre-trained Language Models for Dialogue
Adaptation [79.0866650271659]
PrLMを利用する一般的なプロセスは、まずタスク非依存のLMトレーニング目標を持つ大規模汎用コーパス上で事前トレーニングを行い、タスク固有のトレーニング目標を持つタスクデータセットを微調整する。
タスク固有の目的を持つドメイン内タスク関連コーパスにタスク固有の事前学習を導入する。
この手順は、特定のタスクのモデル理解能力を高めるために、元の2つのステージの間に置かれる。
論文 参考訳(メタデータ) (2020-09-10T16:46:46Z) - Don't Stop Pretraining: Adapt Language Models to Domains and Tasks [81.99843216550306]
バイオメディカルおよびコンピュータサイエンスの出版物、ニュース、レビュー)と8つの分類タスクについて調査する。
ドメイン内の事前トレーニング(ドメイン適応型事前トレーニング)の第2フェーズでは、パフォーマンスが向上する。
タスクの未ラベルデータ(タスク適応事前トレーニング)に適応することで、ドメイン適応事前トレーニング後のパフォーマンスが向上する。
論文 参考訳(メタデータ) (2020-04-23T04:21:19Z) - Unsupervised Domain Clusters in Pretrained Language Models [61.832234606157286]
大規模事前学習型言語モデルでは,教師なしのドメインによってクラスタ化される文表現を暗黙的に学習する。
このようなモデルに基づくドメインデータ選択手法を提案する。
我々は5つの異なる領域にわたるニューラルネットワーク翻訳のためのデータ選択手法を評価する。
論文 参考訳(メタデータ) (2020-04-05T06:22:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。