論文の概要: Studying the role of named entities for content preservation in text
style transfer
- arxiv url: http://arxiv.org/abs/2206.09676v1
- Date: Mon, 20 Jun 2022 09:31:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-25 12:08:48.534987
- Title: Studying the role of named entities for content preservation in text
style transfer
- Title(参考訳): テキストスタイル転送におけるコンテンツ保存における名前付きエンティティの役割の研究
- Authors: Nikolay Babakov, David Dale, Varvara Logacheva, Irina Krotova,
Alexander Panchenko
- Abstract要約: フォーマルなテキストスタイル転送のためのコンテンツ保存における名前付きエンティティの役割に焦点をあてる。
テキストスタイル転送におけるコンテンツ類似度評価のための新しいデータセットを収集する。
本稿では,事前学習された形式性伝達モデルの誤り解析を行い,テキストスタイルの転送に使用されるベースラインコンテンツ類似度尺度の性能を高めるために,名前付きエンティティに関する情報を利用する簡単な手法を提案する。
- 参考スコア(独自算出の注目度): 65.40394342240558
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Text style transfer techniques are gaining popularity in Natural Language
Processing, finding various applications such as text detoxification,
sentiment, or formality transfer. However, the majority of the existing
approaches were tested on such domains as online communications on public
platforms, music, or entertainment yet none of them were applied to the domains
which are typical for task-oriented production systems, such as personal plans
arrangements (e.g. booking of flights or reserving a table in a restaurant). We
fill this gap by studying formality transfer in this domain.
We noted that the texts in this domain are full of named entities, which are
very important for keeping the original sense of the text. Indeed, if for
example, someone communicates the destination city of a flight it must not be
altered. Thus, we concentrate on the role of named entities in content
preservation for formality text style transfer.
We collect a new dataset for the evaluation of content similarity measures in
text style transfer. It is taken from a corpus of task-oriented dialogues and
contains many important entities related to realistic requests that make this
dataset particularly useful for testing style transfer models before using them
in production. Besides, we perform an error analysis of a pre-trained formality
transfer model and introduce a simple technique to use information about named
entities to enhance the performance of baseline content similarity measures
used in text style transfer.
- Abstract(参考訳): テキストスタイル転送技術は自然言語処理で人気を博し、テキストのデトキシフィケーション、感傷、形式的転送といった様々な応用方法を見つけている。
しかし、既存のアプローチの大部分は、公共プラットフォーム、音楽、娯楽におけるオンラインコミュニケーションのようなドメインでテストされたが、個人的な計画の手配(例えば、フライトの予約やレストランのテーブルの予約など)のようなタスク指向生産システムで典型的なドメインには適用されなかった。
このギャップを埋めるために、この領域で形式性転移を研究します。
我々は、このドメインのテキストは名前付きエンティティでいっぱいであり、テキストの本来の感覚を維持するために非常に重要であることに注意した。
実際、例えば、誰かがフライトの目的地都市を通信する場合は、変更するべきではない。
そこで我々は,形式的テキストスタイル転送のためのコンテンツ保存における名前付きエンティティの役割に集中する。
テキストスタイル転送におけるコンテンツ類似度評価のための新しいデータセットを収集する。
これはタスク指向の対話のコーパスから取られ、本番環境で使用する前にスタイル転送モデルをテストするのに特に役立つ、現実的な要求に関連する多くの重要なエンティティを含んでいる。
また,事前学習した形式伝達モデルの誤り解析を行い,テキストスタイル転送におけるベースラインコンテンツ類似度尺度の性能向上のために名前付きエンティティに関する情報を用いた簡易手法を提案する。
関連論文リスト
- ParaGuide: Guided Diffusion Paraphrasers for Plug-and-Play Textual Style
Transfer [57.6482608202409]
テキストスタイル転送は、意味を保ちながらテキストのスタイル特性を変換するタスクである。
任意のスタイルに柔軟に適応できる汎用型転送のための新しい拡散型フレームワークを提案する。
本研究では,人的評価と自動評価の両面から,Enron Email Corpusの手法を検証するとともに,形式性,感情,さらにはオーサシップスタイルの伝達にも優れることを示す。
論文 参考訳(メタデータ) (2023-08-29T17:36:02Z) - Don't lose the message while paraphrasing: A study on content preserving
style transfer [61.38460184163704]
スタイル伝達研究の現実的な応用には,コンテンツ保存が不可欠である。
形式性伝達領域の例において、様々なスタイル転送モデルを比較する。
我々は,スタイル伝達のための最先端技術について,精密な比較研究を行っている。
論文 参考訳(メタデータ) (2023-08-17T15:41:08Z) - Generalized One-shot Domain Adaption of Generative Adversarial Networks [72.84435077616135]
GAN(Generative Adversarial Network)の適応は、事前訓練されたGANを、限られたトレーニングデータを持つ特定のドメインに転送することを目的としている。
我々は、ソースドメインからターゲットドメインへの適応を、テクスチャや色といったグローバルなスタイルの移行と、ソースドメインに属さない新しいエンティティの出現の2つの部分に分離できると考えている。
我々の中核的な目的は、参照と合成の内部分布のギャップをワッサーシュタイン距離によって制限することである。
論文 参考訳(メタデータ) (2022-09-08T09:24:44Z) - StoryTrans: Non-Parallel Story Author-Style Transfer with Discourse
Representations and Content Enhancing [73.81778485157234]
長文は通常、文よりも談話構造のような複雑な著者の言語的嗜好を含んでいる。
我々は、入力されたストーリーを特定の著者スタイルに転送する必要があるノン並列ストーリー作者スタイル転送のタスクを定式化する。
モデルが自動エンコーダに退化することを防ぐために,学習した談話表現からスタイル的特徴を引き離すための追加の学習目標を用いる。
論文 参考訳(メタデータ) (2022-08-29T08:47:49Z) - DSGPT: Domain-Specific Generative Pre-Training of Transformers for Text
Generation in E-commerce Title and Review Summarization [14.414693156937782]
テキスト生成のための新しいドメイン固有生成事前学習法(DS-GPT)を提案する。
電子商取引モバイルディスプレイにおける製品タイトルと要約問題に応用する。
論文 参考訳(メタデータ) (2021-12-15T19:02:49Z) - Reinforced Rewards Framework for Text Style Transfer [11.49063129923684]
スタイル転送は、コアコンテンツが保存されていることを保証しながら、あるテキストのスタイル特性を別のテキストに転送するアルゴリズムを扱う。
既存の作品では、コンテンツ保存と転送強度に基づいて、スタイル転送モデルを評価している。
本稿では,これらの指標のフレームワークを直接報酬する強化学習ベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2020-05-11T16:54:28Z) - Exploring the Limits of Transfer Learning with a Unified Text-to-Text
Transformer [64.22926988297685]
下流タスクで微調整される前に、まずデータリッチタスクでモデルが事前訓練されるトランスファーラーニングは、自然言語処理(NLP)において強力な手法として登場した。
本稿では,すべてのテキストベースの言語問題をテキスト・トゥ・テキスト・フォーマットに変換する統一フレームワークにより,NLPのためのトランスファー学習手法を導入する状況について検討する。
論文 参考訳(メタデータ) (2019-10-23T17:37:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。