論文の概要: Unsupervised Syntactically Controlled Paraphrase Generation with
Abstract Meaning Representations
- arxiv url: http://arxiv.org/abs/2211.00881v1
- Date: Wed, 2 Nov 2022 04:58:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-03 13:10:43.291432
- Title: Unsupervised Syntactically Controlled Paraphrase Generation with
Abstract Meaning Representations
- Title(参考訳): 抽象的意味表現を用いた教師なし構文制御パラフラーゼ生成
- Authors: Kuan-Hao Huang, Varun Iyer, Anoop Kumar, Sriram Venkatapathy, Kai-Wei
Chang, Aram Galstyan
- Abstract要約: 抽象表現(AMR)は、教師なし構文制御されたパラフレーズ生成の性能を大幅に向上させることができる。
提案モデルであるAMRPGは,AMRグラフを符号化し,入力文を2つの非絡み合った意味的および構文的埋め込みに解析する。
実験により、AMRPGは既存の教師なしアプローチと比較して、定量的かつ質的に、より正確な構文制御されたパラフレーズを生成することが示された。
- 参考スコア(独自算出の注目度): 59.10748929158525
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Syntactically controlled paraphrase generation has become an emerging
research direction in recent years. Most existing approaches require annotated
paraphrase pairs for training and are thus costly to extend to new domains.
Unsupervised approaches, on the other hand, do not need paraphrase pairs but
suffer from relatively poor performance in terms of syntactic control and
quality of generated paraphrases. In this paper, we demonstrate that leveraging
Abstract Meaning Representations (AMR) can greatly improve the performance of
unsupervised syntactically controlled paraphrase generation. Our proposed
model, AMR-enhanced Paraphrase Generator (AMRPG), separately encodes the AMR
graph and the constituency parse of the input sentence into two disentangled
semantic and syntactic embeddings. A decoder is then learned to reconstruct the
input sentence from the semantic and syntactic embeddings. Our experiments show
that AMRPG generates more accurate syntactically controlled paraphrases, both
quantitatively and qualitatively, compared to the existing unsupervised
approaches. We also demonstrate that the paraphrases generated by AMRPG can be
used for data augmentation to improve the robustness of NLP models.
- Abstract(参考訳): 近年, 構文制御型パラフレーズ生成が研究の方向になりつつある。
既存のほとんどのアプローチでは、トレーニングには注釈付きパラフレーズペアが必要であり、新しいドメインに拡張するのにコストがかかる。
一方、教師なしのアプローチでは、パラフレーズペアは必要ないが、構文制御や生成されたパラフレーズの品質の観点からは比較的性能が劣っている。
本稿では,抽象的意味表現(AMR)を活用することで,教師なし構文制御パラフレーズ生成の性能を大幅に向上させることができることを示す。
提案するモデルであるAMR拡張パラフレーズ生成器(AMRPG)は,AMRグラフと入力文の領域パースを2つの非絡み合った意味的および構文的埋め込みに符号化する。
その後、デコーダが学習され、意味的および構文的埋め込みから入力文を再構築する。
実験の結果,AMRPGは,既存の教師なしアプローチと比較して,定量的かつ質的に,より正確な構文制御パラフレーズを生成することがわかった。
また,AMRPGが生成したパラフレーズをデータ拡張に使用することにより,NLPモデルの堅牢性を向上させることも実証した。
関連論文リスト
- A Quality-based Syntactic Template Retriever for
Syntactically-controlled Paraphrase Generation [67.98367574025797]
既存の構文制御されたパラフレーズ生成モデルは、人間の注釈付きまたはよく書かれた構文テンプレートで有望に機能する。
禁止コストにより、ソース文ごとに適切なテンプレートを手作業で設計することは不可能になります。
本稿では,QSTR(Quality-based Syntactic Template Retriever)を提案する。
論文 参考訳(メタデータ) (2023-10-20T03:55:39Z) - ParaAMR: A Large-Scale Syntactically Diverse Paraphrase Dataset by AMR
Back-Translation [59.91139600152296]
ParaAMRは、抽象的な表現のバックトランスレーションによって生成される、大規模な構文的に多様なパラフレーズデータセットである。
そこで本研究では,ParaAMRを用いて文の埋め込み学習,構文的に制御されたパラフレーズ生成,数ショット学習のためのデータ拡張という,3つのNLPタスクを改善することができることを示す。
論文 参考訳(メタデータ) (2023-05-26T02:27:33Z) - Entailment Relation Aware Paraphrase Generation [17.6146622291895]
本稿では、既存のパラフレーズと自然言語推論コーパスを用いて学習できる強化学習に基づく弱教師付きパラフレーズシステムERAPを提案する。
自動評価と人的評価の組み合わせは、ERAPが特定の包含関係に従ってパラフレーズを生成することを示している。
論文 参考訳(メタデータ) (2022-03-20T08:02:09Z) - Hierarchical Sketch Induction for Paraphrase Generation [79.87892048285819]
本稿では、高密度符号化の分解を学習するHRQ-VAE(Hierarchical Refinement Quantized Variational Autoencoders)を紹介する。
HRQ-VAEを用いて、入力文の構文形式を階層化の経路としてエンコードすることで、テスト時の構文スケッチをより容易に予測できる。
論文 参考訳(メタデータ) (2022-03-07T15:28:36Z) - Learning to Selectively Learn for Weakly-supervised Paraphrase
Generation [81.65399115750054]
弱監督データを用いた高品質なパラフレーズを生成するための新しい手法を提案する。
具体的には、弱制御されたパラフレーズ生成問題に以下のように取り組む。
検索に基づく擬似パラフレーズ展開により、豊富なラベル付き並列文を得る。
提案手法は,既存の教師なしアプローチよりも大幅に改善され,教師付き最先端技術と同等の性能を示す。
論文 参考訳(メタデータ) (2021-09-25T23:31:13Z) - Generating Syntactically Controlled Paraphrases without Using Annotated
Parallel Pairs [37.808235216195484]
注釈付きパラフレーズペアを必要とせずに,構文的に様々なパラフレーズを生成できることが示唆された。
構文制御パラフレーズ生成(SynPG: Syntactically Control Paraphrase Generator)は,文の意味と構文を解読するエンコーダデコーダベースのモデルである。
論文 参考訳(メタデータ) (2021-01-26T06:13:52Z) - A Correspondence Variational Autoencoder for Unsupervised Acoustic Word
Embeddings [50.524054820564395]
そこで本稿では,変数分割音声セグメントを固定次元表現にマッピングするための教師なしモデルを提案する。
結果として得られる音響単語の埋め込みは、低リソース言語とゼロリソース言語のための検索、発見、インデックスシステムの基礎を形成することができる。
論文 参考訳(メタデータ) (2020-12-03T19:24:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。