論文の概要: Coherence and Diversity through Noise: Self-Supervised Paraphrase
Generation via Structure-Aware Denoising
- arxiv url: http://arxiv.org/abs/2302.02780v1
- Date: Mon, 6 Feb 2023 13:50:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-07 16:37:46.136627
- Title: Coherence and Diversity through Noise: Self-Supervised Paraphrase
Generation via Structure-Aware Denoising
- Title(参考訳): 騒音によるコヒーレンスと多様性:構造認識による自己改善パラフレーズ生成
- Authors: Rishabh Gupta, Venktesh V., Mukesh Mohania, Vikram Goyal
- Abstract要約: 制御ノイズ注入によるパラフレーズ処理のための教師なしフレームワークであるSCANINGを提案する。
本稿では,オンライン教育に実践的な応用を持つ代数的単語問題を言い換える新しい課題に焦点をあてる。
我々はSCANingが意味保存と多種多様なパラフレーズの生成の両方の観点から性能を著しく向上させることを示した。
- 参考スコア(独自算出の注目度): 5.682665111938764
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose SCANING, an unsupervised framework for paraphrasing
via controlled noise injection. We focus on the novel task of paraphrasing
algebraic word problems having practical applications in online pedagogy as a
means to reduce plagiarism as well as ensure understanding on the part of the
student instead of rote memorization. This task is more complex than
paraphrasing general-domain corpora due to the difficulty in preserving
critical information for solution consistency of the paraphrased word problem,
managing the increased length of the text and ensuring diversity in the
generated paraphrase. Existing approaches fail to demonstrate adequate
performance on at least one, if not all, of these facets, necessitating the
need for a more comprehensive solution. To this end, we model the noising
search space as a composition of contextual and syntactic aspects and sample
noising functions consisting of either one or both aspects. This allows for
learning a denoising function that operates over both aspects and produces
semantically equivalent and syntactically diverse outputs through grounded
noise injection. The denoising function serves as a foundation for learning a
paraphrasing function which operates solely in the input-paraphrase space
without carrying any direct dependency on noise. We demonstrate SCANING
considerably improves performance in terms of both semantic preservation and
producing diverse paraphrases through extensive automated and manual evaluation
across 4 datasets.
- Abstract(参考訳): 本稿では,制御ノイズ注入によるパラフレーズ処理のための教師なしフレームワークであるSCANINGを提案する。
本稿では,オンライン教育に実践的な応用を持つ代数的単語問題を,ロテ記憶の代わりに生徒の理解を確実にするための新しい課題に焦点をあてる。
このタスクは、パラフレーズ付き単語問題の解の整合性、テキストの長さの増大の管理、生成したパラフレーズの多様性を保証することの難しさから、一般ドメインコーパスのパラフレーズよりも複雑である。
既存のアプローチでは、これらすべての面において、少なくとも1つの面において適切なパフォーマンスを示すことができず、より包括的なソリューションを必要とします。
この目的のために, 探索空間を, 文脈的および構文的側面と, 1 つの側面と2つの側面からなるサンプルノージング関数の合成としてモデル化する。
これにより、両方の側面で動作し、グラウンドドノイズインジェクションを通じて意味論的に等価で構文的に多様なアウトプットを生成するデノゲーション関数を学習することができる。
雑音化関数は、ノイズに直接依存することなく、入力-パラフレア空間でのみ動作するパラフレージング関数を学習するための基礎として機能する。
SCANingは4つのデータセットにまたがる広範囲な自動的および手動による評価を通じて,意味保存と多種多様なパラフレーズの生成の両方の観点から,パフォーマンスを著しく向上させる。
関連論文リスト
- DenoSent: A Denoising Objective for Self-Supervised Sentence
Representation Learning [59.4644086610381]
本稿では,他の視点,すなわち文内視点から継承する新たな認知的目的を提案する。
離散ノイズと連続ノイズの両方を導入することで、ノイズの多い文を生成し、モデルを元の形式に復元するように訓練する。
我々の経験的評価は,本手法が意味的テキスト類似性(STS)と幅広い伝達タスクの両面で競合する結果をもたらすことを示した。
論文 参考訳(メタデータ) (2024-01-24T17:48:45Z) - Learning Disentangled Speech Representations [0.412484724941528]
SynSpeechは、非絡み合った音声表現の研究を可能にするために設計された、新しい大規模合成音声データセットである。
本稿では, 線形探索と教師付きアンタングル化指標を併用して, アンタングル化表現学習手法を評価する枠組みを提案する。
SynSpeechは、さまざまな要因のベンチマークを促進し、ジェンダーや話し方のようなより単純な機能の切り離しを期待できると同時に、話者アイデンティティのような複雑な属性を分離する際の課題を強調します。
論文 参考訳(メタデータ) (2023-11-04T04:54:17Z) - Improving the Robustness of Summarization Systems with Dual Augmentation [68.53139002203118]
頑健な要約システムは、入力中の特定の単語の選択やノイズに関わらず、文書のギストをキャプチャできるべきである。
まず,単語レベルの同義語置換や雑音を含む摂動に対する要約モデルの頑健性について検討する。
SummAttackerを提案する。これは言語モデルに基づく対数サンプルを生成するための効率的な手法である。
論文 参考訳(メタデータ) (2023-06-01T19:04:17Z) - Learning Semantic Correspondence with Sparse Annotations [66.37298464505261]
密接な意味的対応を見つけることは、コンピュータビジョンの基本的な問題である。
本研究では,高密度な擬似ラベルを生成するための教師学習パラダイムを提案する。
また、擬似ラベルを識別するための2つの新しい戦略も開発している。
論文 参考訳(メタデータ) (2022-08-15T02:24:18Z) - Keywords and Instances: A Hierarchical Contrastive Learning Framework
Unifying Hybrid Granularities for Text Generation [59.01297461453444]
入力テキスト中のハイブリッドな粒度意味を統一する階層的コントラスト学習機構を提案する。
実験により,本モデルがパラフレージング,対話生成,ストーリーテリングタスクにおいて,競争ベースラインより優れていることが示された。
論文 参考訳(メタデータ) (2022-05-26T13:26:03Z) - Analysis of Joint Speech-Text Embeddings for Semantic Matching [3.6423306784901235]
ペア音声と書き起こし入力の距離を最小化することにより,セマンティックマッチングのために訓練された共同音声テキスト埋め込み空間について検討する。
我々は,事前学習とマルチタスクの両方のシナリオを通じて,音声認識を組み込む方法を拡張した。
論文 参考訳(メタデータ) (2022-04-04T04:50:32Z) - Co-Grounding Networks with Semantic Attention for Referring Expression
Comprehension in Videos [96.85840365678649]
エレガントなワンステージの枠組みで動画の表現理解を参照する問題に取り組みます。
意味的注意学習により単フレーム接地精度を高め、クロスフレーム接地一貫性を向上させます。
私たちのモデルは、RefCOCOデータセットのパフォーマンス改善によって示される、画像の表現理解の参照にも適用できます。
論文 参考訳(メタデータ) (2021-03-23T06:42:49Z) - Pareto Probing: Trading Off Accuracy for Complexity [87.09294772742737]
我々は,プローブの複雑性と性能の基本的なトレードオフを反映したプローブ計量について論じる。
係り受け解析による実験により,文脈表現と非文脈表現の統語的知識の幅広いギャップが明らかとなった。
論文 参考訳(メタデータ) (2020-10-05T17:27:31Z) - Noise Pollution in Hospital Readmission Prediction: Long Document
Classification with Reinforcement Learning [15.476161876559074]
本稿では,腎移植後の可読性予測のための長期臨床文書中のノイズ抽出のための強化学習手法を提案する。
まず、4種類のエンコーダを実験して、最適な文書表現を実証的に決定し、さらに長い文書からノイズの多いテキストを除去するために強化学習を適用する。
論文 参考訳(メタデータ) (2020-05-04T04:06:53Z) - Adversarial Feature Learning and Unsupervised Clustering based Speech
Synthesis for Found Data with Acoustic and Textual Noise [18.135965605011105]
注意に基づくシーケンス・ツー・シーケンス(seq2seq)音声合成は、異常な性能を達成している。
このようなSeq2seqシステムをトレーニングするには、手書きによるスタジオ品質のコーパスが必要である。
本稿では,高品質で安定したSeq2seqに基づく音声合成システムの構築手法を提案する。
論文 参考訳(メタデータ) (2020-04-28T15:32:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。