論文の概要: Generating Syntactically Controlled Paraphrases without Using Annotated
Parallel Pairs
- arxiv url: http://arxiv.org/abs/2101.10579v1
- Date: Tue, 26 Jan 2021 06:13:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-13 19:57:54.725776
- Title: Generating Syntactically Controlled Paraphrases without Using Annotated
Parallel Pairs
- Title(参考訳): 注釈付き並列ペアを使わずに構文制御されたパラフレーズを生成する
- Authors: Kuan-Hao Huang, Kai-Wei Chang
- Abstract要約: 注釈付きパラフレーズペアを必要とせずに,構文的に様々なパラフレーズを生成できることが示唆された。
構文制御パラフレーズ生成(SynPG: Syntactically Control Paraphrase Generator)は,文の意味と構文を解読するエンコーダデコーダベースのモデルである。
- 参考スコア(独自算出の注目度): 37.808235216195484
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Paraphrase generation plays an essential role in natural language process
(NLP), and it has many downstream applications. However, training supervised
paraphrase models requires many annotated paraphrase pairs, which are usually
costly to obtain. On the other hand, the paraphrases generated by existing
unsupervised approaches are usually syntactically similar to the source
sentences and are limited in diversity. In this paper, we demonstrate that it
is possible to generate syntactically various paraphrases without the need for
annotated paraphrase pairs. We propose Syntactically controlled Paraphrase
Generator (SynPG), an encoder-decoder based model that learns to disentangle
the semantics and the syntax of a sentence from a collection of unannotated
texts. The disentanglement enables SynPG to control the syntax of output
paraphrases by manipulating the embedding in the syntactic space. Extensive
experiments using automatic metrics and human evaluation show that SynPG
performs better syntactic control than unsupervised baselines, while the
quality of the generated paraphrases is competitive. We also demonstrate that
the performance of SynPG is competitive or even better than supervised models
when the unannotated data is large. Finally, we show that the syntactically
controlled paraphrases generated by SynPG can be utilized for data augmentation
to improve the robustness of NLP models.
- Abstract(参考訳): パラフレーズ生成は自然言語プロセス(NLP)において重要な役割を果たし、多くの下流アプリケーションがあります。
しかし、教師付き言い換えモデルの訓練には多くの注釈付き言い換えペアが必要である。
一方、既存の教師なしアプローチによって生じるパラフレーズは、通常、ソース文と構文的に類似しており、多様性に制限がある。
本稿では,アノテーション付きパラフローゼペアを必要とせずに,構文的に様々なパラフレーズを生成できることを実証する。
本稿では,意味論と文の構文を非注釈テキストの集合から切り離すことを学習するエンコーダ-デコーダモデルである構文制御パラフレーズ生成(SynPG)を提案する。
アンタングル化により、SynPGは構文空間への埋め込みを操作することで出力パラフレーズの構文を制御することができる。
自動測定と人間評価を用いた広範な実験では、SynPGは教師なしのベースラインよりも優れた構文制御を実行し、生成されたパラフレーズの品質は競争的である。
また、非注釈データが大きい場合、SynPGの性能が監視モデルよりも競争力が高いか、さらに優れていることを実証します。
最後に,SynPGが生成する構文制御パラフレーズをデータ拡張に利用することにより,NLPモデルのロバスト性を向上させることができることを示す。
関連論文リスト
- A Quality-based Syntactic Template Retriever for
Syntactically-controlled Paraphrase Generation [67.98367574025797]
既存の構文制御されたパラフレーズ生成モデルは、人間の注釈付きまたはよく書かれた構文テンプレートで有望に機能する。
禁止コストにより、ソース文ごとに適切なテンプレートを手作業で設計することは不可能になります。
本稿では,QSTR(Quality-based Syntactic Template Retriever)を提案する。
論文 参考訳(メタデータ) (2023-10-20T03:55:39Z) - ParaAMR: A Large-Scale Syntactically Diverse Paraphrase Dataset by AMR
Back-Translation [59.91139600152296]
ParaAMRは、抽象的な表現のバックトランスレーションによって生成される、大規模な構文的に多様なパラフレーズデータセットである。
そこで本研究では,ParaAMRを用いて文の埋め込み学習,構文的に制御されたパラフレーズ生成,数ショット学習のためのデータ拡張という,3つのNLPタスクを改善することができることを示す。
論文 参考訳(メタデータ) (2023-05-26T02:27:33Z) - Unsupervised Syntactically Controlled Paraphrase Generation with
Abstract Meaning Representations [59.10748929158525]
抽象表現(AMR)は、教師なし構文制御されたパラフレーズ生成の性能を大幅に向上させることができる。
提案モデルであるAMRPGは,AMRグラフを符号化し,入力文を2つの非絡み合った意味的および構文的埋め込みに解析する。
実験により、AMRPGは既存の教師なしアプローチと比較して、定量的かつ質的に、より正確な構文制御されたパラフレーズを生成することが示された。
論文 参考訳(メタデータ) (2022-11-02T04:58:38Z) - Hierarchical Sketch Induction for Paraphrase Generation [79.87892048285819]
本稿では、高密度符号化の分解を学習するHRQ-VAE(Hierarchical Refinement Quantized Variational Autoencoders)を紹介する。
HRQ-VAEを用いて、入力文の構文形式を階層化の経路としてエンコードすることで、テスト時の構文スケッチをより容易に予測できる。
論文 参考訳(メタデータ) (2022-03-07T15:28:36Z) - Syntax-guided Controlled Generation of Paraphrases [3.4129083593356433]
構文的パラフレーズ生成のためのエンドツーエンドフレームワークであるSGCP(Syntax Guided Controlled Paraphraser)を提案する。
SGCPは、関連性に不満を抱きながら、構文適合文を生成できることが判明した。
今後の研究を進めるため、私たちはSGCPのソースコードを利用可能にしました。
論文 参考訳(メタデータ) (2020-05-18T01:31:28Z) - Neural Syntactic Preordering for Controlled Paraphrase Generation [57.5316011554622]
私たちの研究は、構文変換を使用して、ソース文をソフトに"リオーダー"し、神経パラフレージングモデルをガイドします。
まず、入力文が与えられた場合、エンコーダ・デコーダモデルを用いて、実行可能な構文再構成のセットを導出する。
次に、提案した各再構成を用いて位置埋め込みのシーケンスを生成し、最終的なエンコーダ-デコーダパラフレーズモデルが特定の順序でソース語に従属することを奨励する。
論文 参考訳(メタデータ) (2020-05-05T09:02:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。