論文の概要: MReD: A Meta-Review Dataset for Controllable Text Generation
- arxiv url: http://arxiv.org/abs/2110.07474v1
- Date: Thu, 14 Oct 2021 15:48:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-15 13:54:00.183421
- Title: MReD: A Meta-Review Dataset for Controllable Text Generation
- Title(参考訳): MReD:制御可能なテキスト生成のためのメタレビューデータセット
- Authors: Chenhui Shen, Liying Cheng, Ran Zhou, Lidong Bing, Yang You, Luo Si
- Abstract要約: 本稿では,抽出モデルと抽象モデルの両方を用いた制御手法を提案する。
MReDにより、メタレビューコーパスをよりよく理解し、制御可能なテキスト生成のための研究室を拡大できる。
- 参考スコア(独自算出の注目度): 38.430158309441495
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: When directly using existing text generation datasets for controllable
generation, we are facing the problem of not having the domain knowledge and
thus the aspects that could be controlled are limited.A typical example is when
using CNN/Daily Mail dataset for controllable text summarization, there is no
guided information on the emphasis of summary sentences. A more useful text
generator should leverage both the input text and control variables to guide
the generation, which can only be built with deep understanding of the domain
knowledge. Motivated by this vi-sion, our paper introduces a new text
generation dataset, named MReD. Our new dataset consists of 7,089 meta-reviews
and all its 45k meta-review sentences are manually annotated as one of the
carefully defined 9 categories, including abstract, strength, decision, etc. We
present experimental results on start-of-the-art summarization models, and
propose methods for controlled generation on both extractive and abstractive
models using our annotated data. By exploring various settings and analaysing
the model behavior with respect to the control inputs, we demonstrate the
challenges and values of our dataset. MReD allows us to have a better
understanding of the meta-review corpora and enlarge the research room for
controllable text generation.
- Abstract(参考訳): 制御可能なテキスト要約のために既存のテキスト生成データセットを直接使用する場合、ドメイン知識がないという問題に直面しており、制御可能なアスペクトは限られている。典型例は、制御可能なテキスト要約のためにCNN/Daily Mailデータセットを使用する場合、要約文の強調に関するガイド付き情報は存在しない。
より有用なテキストジェネレータは、入力テキストと制御変数の両方を利用して生成をガイドする必要がある。
このvi-sionに動機づけられて,本稿ではmredという新しいテキスト生成データセットを紹介する。
新しいデータセットは7,089のメタレビューで構成され、45kのメタレビュー文はすべて、抽象、強度、決定などを含む慎重に定義された9つのカテゴリの1つとして手動で注釈付けされる。
そこで本研究では,本手法を用いた抽出モデルと抽象モデルの両方における制御生成手法を提案する。
様々な設定を探索し、制御入力に関してモデルの振る舞いをアナライズすることで、データセットの課題と価値を実証する。
MReDにより、メタレビューコーパスをよりよく理解し、制御可能なテキスト生成のための研究室を拡大できる。
関連論文リスト
- Controllable Text Generation in the Instruction-Tuning Era [3.310278632293704]
プロンプトベースのアプローチは,ほとんどのデータセットやタスクにおいて,制御可能なテキスト生成方法よりも優れていることがわかった。
制約データセットを自動的に生成するために,タスクデータセットとコンテキスト内機能を備えた大規模言語モデルのみを使用するアルゴリズムを提供する。
論文 参考訳(メタデータ) (2024-05-02T17:24:30Z) - Text2Data: Low-Resource Data Generation with Textual Control [104.38011760992637]
自然言語は、人間が機械とシームレスに対話するための共通かつ直接的な制御信号として機能する。
ラベルのないデータを用いて教師なし拡散モデルを用いて基礎となるデータ分布を理解する新しいアプローチであるText2Dataを提案する。
制御性を確保し、破滅的な忘れを効果的に防止する、新しい制約最適化ベースの学習目標を通じて制御可能な微調整を行う。
論文 参考訳(メタデータ) (2024-02-08T03:41:39Z) - Grounded Keys-to-Text Generation: Towards Factual Open-Ended Generation [92.1582872870226]
そこで我々は,新しい接地型キー・ツー・テキスト生成タスクを提案する。
タスクは、ガイドキーと接地パスのセットが与えられたエンティティに関する事実記述を生成することである。
近年のQAに基づく評価手法に着想を得て,生成した記述の事実的正当性を示す自動計量MAFEを提案する。
論文 参考訳(メタデータ) (2022-12-04T23:59:41Z) - MACSum: Controllable Summarization with Mixed Attributes [56.685735509260276]
MACSumは、混合属性を制御するための最初の人間アノテーションによる要約データセットである。
混合制御可能な要約の新しいタスクに対する2つの単純かつ効果的なパラメータ効率のアプローチを提案する。
論文 参考訳(メタデータ) (2022-11-09T17:17:37Z) - DSGPT: Domain-Specific Generative Pre-Training of Transformers for Text
Generation in E-commerce Title and Review Summarization [14.414693156937782]
テキスト生成のための新しいドメイン固有生成事前学習法(DS-GPT)を提案する。
電子商取引モバイルディスプレイにおける製品タイトルと要約問題に応用する。
論文 参考訳(メタデータ) (2021-12-15T19:02:49Z) - Control Prefixes for Text Generation [17.682443394199375]
本稿では,各プロンプトに条件付き入力依存情報を組み込む動的手法である制御プリフィックスを提案する。
我々は、WebNLGを含むいくつかのデータからテキストへのデータセットに対して、最先端の結果を提示する。
論文 参考訳(メタデータ) (2021-10-15T19:32:17Z) - Outline to Story: Fine-grained Controllable Story Generation from
Cascaded Events [39.577220559911055]
長文のきめ細かい制御が可能な生成のためのテストベッドとして,"Outline to Story" (O2S) という新しいタスクを提案する。
次に、最新のキーワード抽出技術で構築された将来のベンチマーク用のデータセットを作成します。
論文 参考訳(メタデータ) (2021-01-04T08:16:21Z) - Few-Shot Learning for Opinion Summarization [117.70510762845338]
オピニオン要約は、複数の文書で表現された主観的な情報を反映したテキストの自動生成である。
本研究では,要約テキストの生成をブートストラップするのには,少数の要約でも十分であることを示す。
提案手法は, 従来の抽出法および抽象法を, 自動的, 人的評価において大きく上回っている。
論文 参考訳(メタデータ) (2020-04-30T15:37:38Z) - Learning to Select Bi-Aspect Information for Document-Scale Text Content
Manipulation [50.01708049531156]
我々は、テキストスタイルの転送とは逆の文書スケールのテキストコンテンツ操作という、新しい実践的なタスクに焦点を当てる。
詳細は、入力は構造化されたレコードと、別のレコードセットを記述するための参照テキストのセットである。
出力は、ソースレコードセットの部分的内容と参照の書き込みスタイルを正確に記述した要約である。
論文 参考訳(メタデータ) (2020-02-24T12:52:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。