論文の概要: Controllable and Diverse Text Generation in E-commerce
- arxiv url: http://arxiv.org/abs/2102.11497v1
- Date: Tue, 23 Feb 2021 05:16:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-24 13:55:25.374583
- Title: Controllable and Diverse Text Generation in E-commerce
- Title(参考訳): eコマースにおける制御可能で多様なテキスト生成
- Authors: Huajie Shao, Jun Wang, Haohong Lin, Xuezhou Zhang, Aston Zhang, Heng
Ji, Tarek Abdelzaher
- Abstract要約: Eコマースにおいて重要な課題は、単語の多様性と正確さ(関連性)の間に良いトレードオフを見つけ、生成されたテキストをより自然で人間らしく見せることである。
生成したテキストの多様性/精度のトレードオフを正確に操作する,制御可能な細粒度生成モデルtextitApex を提案する。
apexは現在、中国で最大のeコマースプラットフォームであるtaobaoで製品説明とアイテム推奨理由を生成するためにデプロイされている。
- 参考スコア(独自算出の注目度): 32.23811244808172
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In E-commerce, a key challenge in text generation is to find a good trade-off
between word diversity and accuracy (relevance) in order to make generated text
appear more natural and human-like. In order to improve the relevance of
generated results, conditional text generators were developed that use input
keywords or attributes to produce the corresponding text. Prior work, however,
do not finely control the diversity of automatically generated sentences. For
example, it does not control the order of keywords to put more relevant ones
first. Moreover, it does not explicitly control the balance between diversity
and accuracy. To remedy these problems, we propose a fine-grained controllable
generative model, called~\textit{Apex}, that uses an algorithm borrowed from
automatic control (namely, a variant of the \textit{proportional, integral, and
derivative (PID) controller}) to precisely manipulate the diversity/accuracy
trade-off of generated text. The algorithm is injected into a Conditional
Variational Autoencoder (CVAE), allowing \textit{Apex} to control both (i) the
order of keywords in the generated sentences (conditioned on the input keywords
and their order), and (ii) the trade-off between diversity and accuracy.
Evaluation results on real-world datasets show that the proposed method
outperforms existing generative models in terms of diversity and relevance.
Apex is currently deployed to generate production descriptions and item
recommendation reasons in Taobao owned by Alibaba, the largest E-commerce
platform in China. The A/B production test results show that our method
improves click-through rate (CTR) by 13.17\% compared to the existing method
for production descriptions. For item recommendation reason, it is able to
increase CTR by 6.89\% and 1.42\% compared to user reviews and top-K item
recommendation without reviews, respectively.
- Abstract(参考訳): eコマースにおいて、テキスト生成の重要な課題は、単語の多様性と正確さ(関連)の間の良いトレードオフを見つけ、生成したテキストをより自然で人間らしく見せることである。
結果の関連性を向上させるために,入力キーワードや属性を用いて対応するテキストを生成する条件付きテキスト生成装置を開発した。
しかし、以前の作業は、自動生成された文の多様性を細かく制御しません。
たとえば、より関連性の高いキーワードを優先するキーワードの順序を制御しません。
さらに、多様性と正確さのバランスを明示的に制御しない。
そこで本研究では,自動制御(すなわち, \textit{proportional, integral, and derivative (PID) controller} の変種)から借りたアルゴリズムを用いて,生成テキストの多様性と精度のトレードオフを高精度に操作する,きめ細かい制御可能な生成モデル~\textit{Apex}を提案する。
このアルゴリズムは条件付き可変オートエンコーダ(CVAE)に注入され、 \textit{Apex} は (i) 生成された文中のキーワードの順序 (入力キーワードとその順序で条件付き) と (ii) 多様性と精度のトレードオフの両方を制御することができる。
実世界データセットの評価結果から,提案手法は多様性と関連性の観点から既存の生成モデルよりも優れていることが示された。
apexは現在、中国最大のeコマースプラットフォームであるalibabaが所有するtaobaoで生産説明とアイテム推奨理由を生成するためにデプロイされている。
A/B 生産試験の結果,既存の生産記述法と比較してクリックスルー率 (CTR) は 13.17 % 向上した。
アイテムレコメンデーションの理由から、ユーザレビューとトップKアイテムレコメンデーションのそれぞれに対して、CTRを6.89倍と1.42倍に増やすことができる。
関連論文リスト
- JPAVE: A Generation and Classification-based Model for Joint Product
Attribute Prediction and Value Extraction [59.94977231327573]
JPAVEと呼ばれる値生成/分類と属性予測を備えたマルチタスク学習モデルを提案する。
我々のモデルの2つの変種は、オープンワールドとクローズドワールドのシナリオのために設計されている。
公開データセットにおける実験結果は,強いベースラインと比較して,我々のモデルが優れていることを示す。
論文 参考訳(メタデータ) (2023-11-07T18:36:16Z) - Optimizing Factual Accuracy in Text Generation through Dynamic Knowledge
Selection [71.20871905457174]
言語モデル(LM)は、私たちが情報と対話する方法に革命をもたらしたが、しばしば非現実的なテキストを生成する。
従来の手法では、外部知識をテキスト生成の参照として使用して事実性を高めるが、無関係な参照の知識の混在に苦慮することが多い。
本稿では,テキスト生成プロセスを反復処理に分割するDKGenを提案する。
論文 参考訳(メタデータ) (2023-08-30T02:22:40Z) - Product Information Extraction using ChatGPT [69.12244027050454]
本稿では,製品記述から属性/値対を抽出するChatGPTの可能性について検討する。
以上の結果から,ChatGPTは事前学習した言語モデルに類似した性能を達成できるが,微調整を行うにはトレーニングデータや計算処理がはるかに少ないことが示唆された。
論文 参考訳(メタデータ) (2023-06-23T09:30:01Z) - Continuous Prompt Tuning Based Textual Entailment Model for E-commerce
Entity Typing [12.77583836715184]
電子商取引における急速な活動は、一般的なエンティティタイピングによって解決が難しい新しいエンティティの急速な台頭につながっている。
本稿では,eコマースエンティティタイピングのための連続的なプロンプトチューニングに基づく仮説と融合埋め込みを用いたテキストエンテーメントモデルを提案する。
提案モデルでは,ベースラインのBERTエンティティタイピングモデルと比較して平均F1スコアが約2%向上することを示した。
論文 参考訳(メタデータ) (2022-11-04T14:20:40Z) - DisCup: Discriminator Cooperative Unlikelihood Prompt-tuning for
Controllable Text Generation [6.844825905212349]
本稿では,識別器の属性知識を取り入れた新しいCTG手法であるDisCupを提案する。
DisCupは、約10の仮想トークンに頼るだけで、効率的で高品質なテキスト生成を維持しながら、新しい最先端の制御性能を実現することができる。
論文 参考訳(メタデータ) (2022-10-18T02:59:06Z) - Using Interventions to Improve Out-of-Distribution Generalization of
Text-Matching Recommendation Systems [14.363532867533012]
ペア化アイテム関連データに基づく大規模ベース言語モデルの微調整は、一般化には非生産的である。
製品レコメンデーションタスクでは、新しいカテゴリや将来的な期間の項目を推薦する場合、ファインチューニングはベースモデルよりも精度が低い。
本稿では,モデルの関連性スコアに対するトークンの因果的影響を制限する介入ベース正規化器を提案する。
論文 参考訳(メタデータ) (2022-10-07T11:16:45Z) - FAST: Improving Controllability for Text Generation with Feedback Aware
Self-Training [25.75982440355576]
制御可能なテキスト生成システムは、しばしば制御コードを利用して、スタイルや長さといった出力の様々な特性を指示する。
NLPの因果推論に関する最近の研究に触発された本論文は、これらの制御符号に基づく条件付きテキスト生成アルゴリズムにおいて、これまで見過ごされていた欠陥を明らかにする。
トレーニングセットにおけるこれらの相関を減少させるための2つの簡単な手法を提案する。
論文 参考訳(メタデータ) (2022-10-06T19:00:51Z) - Classifiers are Better Experts for Controllable Text Generation [63.17266060165098]
提案手法は, PPLにおける最近のPPLM, GeDi, DExpertsよりも有意に優れており, 生成したテキストの外部分類器に基づく感情の精度が高いことを示す。
同時に、実装やチューニングも簡単で、制限や要件も大幅に少なくなります。
論文 参考訳(メタデータ) (2022-05-15T12:58:35Z) - Conditioned Text Generation with Transfer for Closed-Domain Dialogue
Systems [65.48663492703557]
条件付き変分オートエンコーダを用いて,意図特化文の生成を最適に学習し,制御する方法を示す。
クエリ転送と呼ばれる新しいプロトコルを導入し、大規模で遅延のないデータセットを活用できるようにします。
論文 参考訳(メタデータ) (2020-11-03T14:06:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。