論文の概要: Quality Controlled Paraphrase Generation
- arxiv url: http://arxiv.org/abs/2203.10940v1
- Date: Mon, 21 Mar 2022 13:09:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-22 15:54:08.429272
- Title: Quality Controlled Paraphrase Generation
- Title(参考訳): 品質制御パラフレーズ生成
- Authors: Elron Bandel, Ranit Aharonov, Michal Shmueli-Scheuer, Ilya
Shnayderman, Noam Slonim, Liat Ein-Dor
- Abstract要約: 品質誘導制御パラフレーズ生成モデルを提案する。
本手法は,制御されていないベースラインよりも多様性を保ちつつ,本来の意味を保ったパラフレーズを生成することができることを示す。
- 参考スコア(独自算出の注目度): 13.796053459460207
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Paraphrase generation has been widely used in various downstream tasks. Most
tasks benefit mainly from high quality paraphrases, namely those that are
semantically similar to, yet linguistically diverse from, the original
sentence. Generating high-quality paraphrases is challenging as it becomes
increasingly hard to preserve meaning as linguistic diversity increases. Recent
works achieve nice results by controlling specific aspects of the paraphrase,
such as its syntactic tree. However, they do not allow to directly control the
quality of the generated paraphrase, and suffer from low flexibility and
scalability. Here we propose $QCPG$, a quality-guided controlled paraphrase
generation model, that allows directly controlling the quality dimensions.
Furthermore, we suggest a method that given a sentence, identifies points in
the quality control space that are expected to yield optimal generated
paraphrases. We show that our method is able to generate paraphrases which
maintain the original meaning while achieving higher diversity than the
uncontrolled baseline. The models, the code, and the data can be found in
https://github.com/IBM/quality-controlled-paraphrase-generation.
- Abstract(参考訳): パラフレーズ生成は様々な下流タスクで広く使われている。
ほとんどのタスクは、主に高品質のパラフレーズ、すなわち、意味的に似ているが言語的にも元の文から多様である。
言語多様性が増大するにつれて、意味の保存がますます困難になるため、高品質なパラフレーズの生成は困難である。
最近の研究は、構文木のようなパラフレーズの特定の側面を制御することで良い結果を得る。
しかし、生成したパラフレーズの品質を直接制御することはできず、柔軟性とスケーラビリティの低下に苦しむ。
ここでは,品質次元を直接制御できる品質誘導制御パラフレーズ生成モデルである$QCPG$を提案する。
さらに,文を与えられた場合,最適なパラフレーズを生成することが期待される品質制御空間の点を特定する手法を提案する。
本手法は,制御されていないベースラインよりも多様性を保ちつつ,本来の意味を保ったパラフレーズを生成することができることを示す。
モデル、コード、データはhttps://github.com/IBM/quality- controlled-paraphrase-generationで確認できる。
関連論文リスト
- Enforcing Paraphrase Generation via Controllable Latent Diffusion [60.82512050963046]
textitLatent textitDiffusion textitParaphraser(LDP)を提案する。
実験により, LDPはベースラインに比べて改良され, 多様なパラフレーズ生成を達成できることが示された。
論文 参考訳(メタデータ) (2024-04-13T09:24:32Z) - ParaAMR: A Large-Scale Syntactically Diverse Paraphrase Dataset by AMR
Back-Translation [59.91139600152296]
ParaAMRは、抽象的な表現のバックトランスレーションによって生成される、大規模な構文的に多様なパラフレーズデータセットである。
そこで本研究では,ParaAMRを用いて文の埋め込み学習,構文的に制御されたパラフレーズ生成,数ショット学習のためのデータ拡張という,3つのNLPタスクを改善することができることを示す。
論文 参考訳(メタデータ) (2023-05-26T02:27:33Z) - Unsupervised Syntactically Controlled Paraphrase Generation with
Abstract Meaning Representations [59.10748929158525]
抽象表現(AMR)は、教師なし構文制御されたパラフレーズ生成の性能を大幅に向上させることができる。
提案モデルであるAMRPGは,AMRグラフを符号化し,入力文を2つの非絡み合った意味的および構文的埋め込みに解析する。
実験により、AMRPGは既存の教師なしアプローチと比較して、定量的かつ質的に、より正確な構文制御されたパラフレーズを生成することが示された。
論文 参考訳(メタデータ) (2022-11-02T04:58:38Z) - Learning to Selectively Learn for Weakly-supervised Paraphrase
Generation [81.65399115750054]
弱監督データを用いた高品質なパラフレーズを生成するための新しい手法を提案する。
具体的には、弱制御されたパラフレーズ生成問題に以下のように取り組む。
検索に基づく擬似パラフレーズ展開により、豊富なラベル付き並列文を得る。
提案手法は,既存の教師なしアプローチよりも大幅に改善され,教師付き最先端技術と同等の性能を示す。
論文 参考訳(メタデータ) (2021-09-25T23:31:13Z) - Towards Document-Level Paraphrase Generation with Sentence Rewriting and
Reordering [88.08581016329398]
文書レベルのパラフレーズ生成のためのCoRPG(Coherence Relation Guided Paraphrase Generation)を提案する。
グラフGRUを用いて、コヒーレンス関係グラフを符号化し、各文のコヒーレンス対応表現を得る。
我々のモデルは、より多様性とセマンティックな保存を伴う文書パラフレーズを生成することができる。
論文 参考訳(メタデータ) (2021-09-15T05:53:40Z) - Pushing Paraphrase Away from Original Sentence: A Multi-Round Paraphrase
Generation Approach [97.38622477085188]
パラフレーズの多様性を向上させるためにBTmPG(Back-Translation Guided Multi-round Paraphrase Generation)を提案する。
2つのベンチマークデータセット上でBTmPGを評価する。
論文 参考訳(メタデータ) (2021-09-04T13:12:01Z) - SGG: Learning to Select, Guide, and Generate for Keyphrase Generation [38.351526320316786]
キーフレーズは、文書で議論されたハイレベルなトピックを簡潔に要約します。
ほとんどの既存のキーフレーズ生成アプローチは、現在および不在のキーフレーズを同期的に生成する。
本稿では,現在および欠落したキーフレーズ生成を別々に扱うSelect-Guide-Generate(SGG)アプローチを提案する。
論文 参考訳(メタデータ) (2021-05-06T09:43:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。