論文の概要: SE-DAE: Style-Enhanced Denoising Auto-Encoder for Unsupervised Text
Style Transfer
- arxiv url: http://arxiv.org/abs/2104.12977v1
- Date: Tue, 27 Apr 2021 04:41:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-28 22:24:29.665192
- Title: SE-DAE: Style-Enhanced Denoising Auto-Encoder for Unsupervised Text
Style Transfer
- Title(参考訳): SE-DAE:教師なしテキストスタイル転送のためのスタイル強化型自動エンコーダ
- Authors: Jicheng Li, Yang Feng, Jiao Ou
- Abstract要約: テキストスタイル転送タスク用に特別に設計されたスタイル拡張DAE(SE-DAE)。
従来の複雑なスタイル転送モデルと比較すると、このモデルは複雑な教師なしネットワークで構成されていない。
そこで我々は,スタイル伝達タスクのターゲットとより互換性のある,新しいスタイル記述機構を提案する。
- 参考スコア(独自算出の注目度): 5.491716953613854
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Text style transfer aims to change the style of sentences while preserving
the semantic meanings. Due to the lack of parallel data, the Denoising
Auto-Encoder (DAE) is widely used in this task to model distributions of
different sentence styles. However, because of the conflict between the target
of the conventional denoising procedure and the target of style transfer task,
the vanilla DAE can not produce satisfying enough results. To improve the
transferability of the model, most of the existing works combine DAE with
various complicated unsupervised networks, which makes the whole system become
over-complex. In this work, we design a novel DAE model named Style-Enhanced
DAE (SE-DAE), which is specifically designed for the text style transfer task.
Compared with previous complicated style-transfer models, our model do not
consist of any complicated unsupervised networks, but only relies on the
high-quality pseudo-parallel data generated by a novel data refinement
mechanism. Moreover, to alleviate the conflict between the targets of the
conventional denoising procedure and the style transfer task, we propose
another novel style denoising mechanism, which is more compatible with the
target of the style transfer task. We validate the effectiveness of our model
on two style benchmark datasets. Both automatic evaluation and human evaluation
show that our proposed model is highly competitive compared with previous
strong the state of the art (SOTA) approaches and greatly outperforms the
vanilla DAE.
- Abstract(参考訳): テキストスタイル転送は意味を保ちながら文のスタイルを変更することを目的としている。
並列データがないため、DAE(Denoising Auto-Encoder)は様々な文スタイルの分布をモデル化するために広く使われている。
しかし,従来のデノナイズドプロシージャの目標とスタイル伝達タスクの目標との間には矛盾があるため,バニラDAEでは十分な結果が得られなかった。
モデルの転送性を改善するため、既存の作業の多くはDAEと様々な複雑な教師なしネットワークを組み合わせることで、システム全体が複雑になる。
本研究では,テキストスタイル転送タスク用に特別に設計された新しいDAEモデルであるスタイル拡張DAE(SE-DAE)を設計する。
従来の複雑なスタイル転送モデルと比較すると、このモデルは複雑な教師なしネットワークで構成されていないが、新しいデータリファインメントメカニズムによって生成される高品質な擬似並列データのみに依存している。
さらに,従来の分極手順とスタイル伝達タスクの目標との衝突を軽減するため,本手法では,スタイル伝達タスクの目標とより互換性のある,新しいスタイルの分極機構を提案する。
モデルの有効性を2つのスタイルのベンチマークデータセットで検証する。
自動評価と人的評価の両方により,提案モデルが従来のsof(the state of the art, sota)アプローチに比べて高い競争力を持ち,バニラデーを大きく上回っていることが示された。
関連論文リスト
- Enhancing Adversarial Transferability with Adversarial Weight Tuning [36.09966860069978]
敵対的な例(AE)は、人間の観察者に対して良心を抱きながらモデルを誤解させた。
AWTは、勾配に基づく攻撃法とモデルに基づく攻撃法を組み合わせて、AEの転送可能性を高めるデータフリーチューニング手法である。
論文 参考訳(メタデータ) (2024-08-18T13:31:26Z) - Style Transfer with Multi-iteration Preference Optimization [27.5647739554034]
強化学習と選好最適化の関係を考察する。
これらの手法に触発されて、我々は確立された嗜好最適化アプローチを改善した。
2つの一般的なテキストスタイル転送データセットを用いて,本モデルの評価を行った。
論文 参考訳(メタデータ) (2024-06-17T14:20:53Z) - Conditional Denoising Diffusion for Sequential Recommendation [62.127862728308045]
GAN(Generative Adversarial Networks)とVAE(VAE)の2つの顕著な生成モデル
GANは不安定な最適化に苦しむ一方、VAEは後続の崩壊と過度に平らな世代である。
本稿では,シーケンスエンコーダ,クロスアテンティブデノナイジングデコーダ,ステップワイズディフューザを含む条件付きデノナイジング拡散モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T15:32:59Z) - DiffusER: Discrete Diffusion via Edit-based Reconstruction [88.62707047517914]
DiffusERは、拡散モデルに基づくテキストの編集ベースの生成モデルである。
機械翻訳、要約、スタイル転送にまたがるいくつかのタスクにおいて、自動回帰モデルと競合する可能性がある。
また、標準的な自己回帰モデルに適さないような、他の種類の世代も実行することができる。
論文 参考訳(メタデータ) (2022-10-30T16:55:23Z) - Multi-Modal Experience Inspired AI Creation [33.34566822058209]
シーケンシャルなマルチモーダル情報に基づいてテキストを生成する方法について検討する。
まず,マルチモーダルアテンションネットワークを備えたマルチチャネルシーケンス・ツー・シーケンスアーキテクチャを設計する。
次に、逐次入力に適したカリキュラム負サンプリング戦略を提案する。
論文 参考訳(メタデータ) (2022-09-02T11:50:41Z) - Non-Parallel Text Style Transfer with Self-Parallel Supervision [19.441780035577352]
大規模言語モデルに基づく新しいテキストスタイル転送フレームワークであるLaMerを提案する。
LaMerはまず、シーングラフで非並列データセットのほぼ並列表現をマイニングし、続いてMLEトレーニングを使用し、続いて模倣学習の改良を行い、データ内の本質的な並列性を活用する。
2つのベンチマークタスク(センチメントとフォーマル性転送)と、新たに提案された課題タスク(政治的スタンス転送)において、我々のモデルは、転送精度、コンテンツ保存および流速の質的な進歩を達成する。
論文 参考訳(メタデータ) (2022-04-18T01:38:35Z) - DST: Dynamic Substitute Training for Data-free Black-box Attack [79.61601742693713]
そこで本研究では,対象モデルからより高速に学習するための代用モデルの促進を目的とした,新しい動的代用トレーニング攻撃手法を提案する。
タスク駆動型グラフに基づく構造情報学習の制約を導入し、生成したトレーニングデータの質を向上させる。
論文 参考訳(メタデータ) (2022-04-03T02:29:11Z) - Recent Developments Combining Ensemble Smoother and Deep Generative
Networks for Facies History Matching [58.720142291102135]
本研究は、ファシズムモデルのための連続パラメータ化を構築するためのオートエンコーダネットワークの利用に焦点を当てる。
本稿では,VAE,GAN,Wasserstein GAN,変分自動符号化GAN,サイクルGANの主成分分析(PCA),転送スタイルネットワークのPCA,スタイル損失のVAEの7種類の定式化をベンチマークする。
論文 参考訳(メタデータ) (2020-05-08T21:32:42Z) - Aligned Cross Entropy for Non-Autoregressive Machine Translation [120.15069387374717]
非自己回帰モデルの学習における代替的損失関数としてアライメントクロスエントロピー(AXE)を提案する。
AXEに基づく条件付きマスキング言語モデル(CMLM)のトレーニングは、主要なWMTベンチマークの性能を大幅に向上させる。
論文 参考訳(メタデータ) (2020-04-03T16:24:47Z) - A Probabilistic Formulation of Unsupervised Text Style Transfer [128.80213211598752]
従来提案されていた非生成的手法を統一した教師なしテキストスタイル転送のための深層生成モデルを提案する。
観測された各シーケンスを生成する並列潜時シーケンスを仮定することにより、我々のモデルは、完全に教師なしの方法で、あるドメインから別のドメインへシーケンスを変換することを学ぶ。
論文 参考訳(メタデータ) (2020-02-10T16:20:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。