論文の概要: Towards Attribute-Entangled Controllable Text Generation: A Pilot Study
of Blessing Generation
- arxiv url: http://arxiv.org/abs/2210.16557v1
- Date: Sat, 29 Oct 2022 10:19:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-01 17:01:03.917235
- Title: Towards Attribute-Entangled Controllable Text Generation: A Pilot Study
of Blessing Generation
- Title(参考訳): 属性型制御可能なテキスト生成に向けて:Blessing生成の試行的研究
- Authors: Shulin Huang, Shirong Ma, Yinghui Li, Yangning Li, Shiyang Lin,
Hai-Tao Zheng and Ying Shen
- Abstract要約: 制御可能なテキスト生成(CTG)は,複数の属性に着目した微細な生成能力によって大きな成功を収めている。
高品質な祝福テキストは、複数の属性間の絡み合いを包括的に考慮するために、CTGモデルを必要とするため、新しいCTGシナリオ、すなわち、祝福生成に重点を置いている。
本稿では,複数の属性を付加した293Kの英文を含む大規模エンタングル・ブレッディングテキストデータセットであるEBleTを提案する。
- 参考スコア(独自算出の注目度): 24.921292269906175
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Controllable Text Generation (CTG) has obtained great success due to its
fine-grained generation ability obtained by focusing on multiple attributes.
However, most existing CTG researches overlook how to utilize the attribute
entanglement to enhance the diversity of the controlled generated texts. Facing
this dilemma, we focus on a novel CTG scenario, i.e., blessing generation which
is challenging because high-quality blessing texts require CTG models to
comprehensively consider the entanglement between multiple attributes (e.g.,
objects and occasions). To promote the research on blessing generation, we
present EBleT, a large-scale Entangled Blessing Text dataset containing 293K
English sentences annotated with multiple attributes. Furthermore, we propose
novel evaluation metrics to measure the quality of the blessing texts generated
by the baseline models we designed. Our study opens a new research direction
for controllable text generation and enables the development of
attribute-entangled CTG models. Our dataset and source codes are available at
\url{https://github.com/huangshulin123/Blessing-Generation}.
- Abstract(参考訳): 制御可能なテキスト生成(CTG)は,複数の属性に着目した微細な生成能力によって大きな成功を収めている。
しかし、既存のCTG研究の多くは、制御されたテキストの多様性を高めるために属性の絡み合いを利用する方法を見落としている。
このジレンマに直面して、我々は新しいCTGシナリオ、すなわち、高品質な祝福テキストが複数の属性(オブジェクトやイベントなど)間の絡み合いを包括的に考慮する必要があるため、困難である。
祝福生成の研究を促進するために,複数の属性を付加した293Kの英語文を含む大規模エンタングル・祝福テキストデータセットであるEBleTを提案する。
さらに,我々はベースラインモデルによって生成された祝福文の品質を測定するための新しい評価指標を提案する。
本研究は,制御可能なテキスト生成のための新たな研究方向を開き,属性に絡み合ったctgモデルの開発を可能にする。
私たちのデータセットとソースコードは、 \url{https://github.com/huangshulin123/blessing-generation}で利用可能です。
関連論文リスト
- Controllable Text Generation for Large Language Models: A Survey [27.110528099257156]
本稿では,大規模言語モデルにおける制御可能なテキスト生成の最近の進歩を体系的にレビューする。
我々はCTGタスクをコンテンツ制御と制御の2つの主要なタイプに分類する。
現在の研究における重要な課題には、流用率の低減や実用性といった課題に対処する。
論文 参考訳(メタデータ) (2024-08-22T17:59:04Z) - Retrieval is Accurate Generation [99.24267226311157]
本稿では,支援文書の集合からコンテキスト認識句を選択する新しい手法を提案する。
本モデルでは,検索対象のベースラインの中で,最高の性能と低レイテンシを実現する。
論文 参考訳(メタデータ) (2024-02-27T14:16:19Z) - Personalized Text Generation with Fine-Grained Linguistic Control [9.668216418094316]
複数の言語的次元にまたがる微粒な属性の制御に焦点をあてる。
生成モデルを訓練するための新しいベンチマークを導入し、パーソナライズされたテキストを生成する能力を評価する。
論文 参考訳(メタデータ) (2024-02-07T14:41:08Z) - Successor Features for Efficient Multisubject Controlled Text Generation [48.37713738712319]
本稿では,後継機能 (SF) と言語モデル修正の2つの基本概念を基礎とするSF-GENを紹介する。
SF-GENはこの2つをシームレスに統合し、LCMのパラメータを変更することなくテキスト生成の動的ステアリングを可能にする。
我々の知る限り、本研究はテキスト生成における後継機能の最初の応用である。
論文 参考訳(メタデータ) (2023-11-03T00:17:08Z) - Deliberate then Generate: Enhanced Prompting Framework for Text
Generation [70.10319005141888]
Deliberate then Generate (DTG) プロンプトフレームワークはエラー検出命令とエラーを含む可能性のある候補で構成されている。
我々は、要約、翻訳、対話など、7つのテキスト生成タスクにまたがる20以上のデータセットに関する広範な実験を行う。
本稿では,DTGが既存のプロンプト手法を一貫して上回り,複数のテキスト生成タスクにおける最先端性能を実現することを示す。
論文 参考訳(メタデータ) (2023-05-31T13:23:04Z) - Learning to Transfer Prompts for Text Generation [97.64625999380425]
転送可能なテキスト生成のための新しいプロンプトベース手法(PTG)を提案する。
まず、PTGは、様々なソース生成タスクの一連のソースプロンプトを学習し、ターゲット生成タスクを実行するためのターゲットプロンプトとしてこれらのプロンプトを転送する。
広範な実験では、PTGは微調整法よりも競争力または優れた結果が得られる。
論文 参考訳(メタデータ) (2022-05-03T14:53:48Z) - A Survey on Retrieval-Augmented Text Generation [53.04991859796971]
Retrieval-augmented text generationは顕著な利点があり、多くのNLPタスクで最先端のパフォーマンスを実現している。
まず、検索拡張生成の一般的なパラダイムを強調し、異なるタスクに応じて注目すべきアプローチをレビューする。
論文 参考訳(メタデータ) (2022-02-02T16:18:41Z) - Outline to Story: Fine-grained Controllable Story Generation from
Cascaded Events [39.577220559911055]
長文のきめ細かい制御が可能な生成のためのテストベッドとして,"Outline to Story" (O2S) という新しいタスクを提案する。
次に、最新のキーワード抽出技術で構築された将来のベンチマーク用のデータセットを作成します。
論文 参考訳(メタデータ) (2021-01-04T08:16:21Z) - GenAug: Data Augmentation for Finetuning Text Generators [21.96895115572357]
本稿では,Yelp Reviews のサブセット上で GPT-2 を微調整するための外部知識を含む様々な拡張手法を提案し,評価する。
実験により,文字レベルの合成ノイズの挿入とハイパーネムのキーワード置換が効果的な拡張法であることを実証した。
論文 参考訳(メタデータ) (2020-10-05T05:46:39Z) - Controllable Text Generation with Focused Variation [71.07811310799664]
Focused-Variation Network (FVN) は言語生成を制御する新しいモデルである。
FVNは、コードブック内の各属性に対する非結合なラテント空間を学習し、制御性と多様性の両方を可能にする。
我々は、注釈付きコンテンツとスタイルを持つ2つのテキスト生成データセット上でFVNを評価し、自動評価と人的評価により、最先端のパフォーマンスを示す。
論文 参考訳(メタデータ) (2020-09-25T06:31:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。