論文の概要: Non-autoregressive Text Editing with Copy-aware Latent Alignments
- arxiv url: http://arxiv.org/abs/2310.07821v1
- Date: Wed, 11 Oct 2023 19:02:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-14 14:15:40.108296
- Title: Non-autoregressive Text Editing with Copy-aware Latent Alignments
- Title(参考訳): コピー対応潜在アライメントを用いた非自己回帰テキスト編集
- Authors: Yu Zhang, Yue Zhang, Leyang Cui, Guohong Fu
- Abstract要約: 遅延CTCアライメントによる編集プロセスをモデル化し,非自己回帰テキスト編集手法を提案する。
提案手法は既存のSeq2Editモデルよりも優れており,Seq2Seqと同等あるいはそれ以上の精度で4時間以上の高速化を実現している。
In-deepth Analysisでは,様々なシナリオ下での堅牢性と,流動的で柔軟な出力を生成する手法の強みを明らかにしている。
- 参考スコア(独自算出の注目度): 31.756401120004977
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent work has witnessed a paradigm shift from Seq2Seq to Seq2Edit in the
field of text editing, with the aim of addressing the slow autoregressive
inference problem posed by the former. Despite promising results, Seq2Edit
approaches still face several challenges such as inflexibility in generation
and difficulty in generalizing to other languages. In this work, we propose a
novel non-autoregressive text editing method to circumvent the above issues, by
modeling the edit process with latent CTC alignments. We make a crucial
extension to CTC by introducing the copy operation into the edit space, thus
enabling more efficient management of textual overlap in editing. We conduct
extensive experiments on GEC and sentence fusion tasks, showing that our
proposed method significantly outperforms existing Seq2Edit models and achieves
similar or even better results than Seq2Seq with over $4\times$ speedup.
Moreover, it demonstrates good generalizability on German and Russian. In-depth
analyses reveal the strengths of our method in terms of the robustness under
various scenarios and generating fluent and flexible outputs.
- Abstract(参考訳): 最近の研究では、テキスト編集の分野でseq2seqからseq2editへのパラダイムシフトが見られ、前者による遅い自己回帰的推論問題に対処することを目的としている。
有望な結果にもかかわらず、Seq2Editアプローチは、生成の柔軟性や他の言語への一般化の難しさなど、いくつかの課題に直面している。
本研究では,CTCアライメントによる編集プロセスのモデル化により,上記の問題を回避するための非自己回帰テキスト編集手法を提案する。
編集空間にコピー操作を導入してCTCに重要な拡張を行い、編集におけるテキスト重複の管理をより効率的にする。
提案手法が既存のseq2editモデルを大幅に上回り,4\times$速度アップのseq2seqと同等あるいはそれ以上の結果が得られることを示した。
さらに、ドイツ語とロシア語に優れた一般化性を示す。
In-deepth Analysisでは,様々なシナリオ下での頑健さと,流動的で柔軟な出力を生成する手法の強みを明らかにしている。
関連論文リスト
- Cross-Modal Contextualized Diffusion Models for Text-Guided Visual
Generation and Editing [71.08616120359348]
条件拡散モデルは高忠実度テキスト誘導視覚生成および編集において優れた性能を示した。
本研究では,テキスト条件と視覚的サンプル間の相互作用とアライメントを包含するクロスモーダルコンテキストを組み込むことにより,コンテキスト拡散モデル(ContextDiff)を提案する。
理論的導出を伴うDDPMとDDIMの両方にモデルを一般化し、テキスト・ツー・イメージ生成とテキスト・ツー・ビデオ編集という2つの課題を伴う評価において、モデルの有効性を実証する。
論文 参考訳(メタデータ) (2024-02-26T15:01:16Z) - DiffEditor: Boosting Accuracy and Flexibility on Diffusion-based Image
Editing [66.43179841884098]
大規模テキスト・ツー・イメージ(T2I)拡散モデルは、ここ数年で画像生成に革命をもたらした。
既存の拡散型画像編集における2つの弱点を正すためにDiffEditorを提案する。
本手法は,様々な精細な画像編集タスクにおいて,最先端の性能を効率的に達成することができる。
論文 参考訳(メタデータ) (2024-02-04T18:50:29Z) - Unified Diffusion-Based Rigid and Non-Rigid Editing with Text and Image
Guidance [15.130419159003816]
本稿では,厳密な編集と非厳密な編集の両方を実行できる多用途画像編集フレームワークを提案する。
我々は、多種多様な編集シナリオを扱うために、デュアルパスインジェクション方式を利用する。
外観と構造情報の融合のための統合自己認識機構を導入する。
論文 参考訳(メタデータ) (2024-01-04T08:21:30Z) - Text Editing as Imitation Game [33.418628166176234]
動作クローンを用いた模倣ゲームとしてテキスト編集を再構成する。
我々は、アクショントークン間の依存関係を保持しながら、デコーディングを並列化するデュアルデコーダ構造を導入する。
私たちのモデルは、パフォーマンス、効率、堅牢性の点で、自己回帰ベースラインを一貫して上回ります。
論文 参考訳(メタデータ) (2022-10-21T22:07:04Z) - Text Generation with Text-Editing Models [78.03750739936956]
このチュートリアルは、テキスト編集モデルと最先端のアプローチの概要を提供する。
生産化に関わる課題と、これらのモデルが幻覚や偏見を軽減するためにどのように使用できるかについて議論する。
論文 参考訳(メタデータ) (2022-06-14T17:58:17Z) - Text Revision by On-the-Fly Representation Optimization [76.11035270753757]
現在の最先端手法は、これらのタスクをシーケンスからシーケンスまでの学習問題として定式化している。
並列データを必要としないテキストリビジョンのための反復的なインプレース編集手法を提案する。
テキストの単純化に関する最先端の教師付き手法よりも、競争力があり、パフォーマンスも向上する。
論文 参考訳(メタデータ) (2022-04-15T07:38:08Z) - TransEditor: Transformer-Based Dual-Space GAN for Highly Controllable
Facial Editing [110.82128064489237]
本稿では、より制御しやすい編集を実現するために、デュアルスペースGANにおけるインタラクションを強化する新しいトランスフォーマーベースのフレームワークであるTransEditorを提案する。
画像品質と編集能力において提案するフレームワークの優位性を示す実験により,高い制御性を有する顔編集におけるTransEditorの有効性が示唆された。
論文 参考訳(メタデータ) (2022-03-31T17:58:13Z) - Text Editing by Command [82.50904226312451]
ニューラルテキスト生成における一般的なパラダイムは、単一のステップでテキストを生成するワンショット生成である。
この制限をユーザが既存のテキストを編集するコマンドを発行することでシステムと対話するインタラクティブテキスト生成設定で解決する。
このデータセットに基づいてトレーニングされたトランスフォーマーベースモデルであるInteractive Editorは,ベースラインを上回り,自動評価と人的評価の両方において肯定的な結果が得られることを示す。
論文 参考訳(メタデータ) (2020-10-24T08:00:30Z) - Recurrent Inference in Text Editing [6.4689151804633775]
本稿では,反復的に編集動作を行う新しい推論手法Recurrenceを提案する。
各イテレーションにおいて、部分的に編集されたテキストをエンコードするRecurrenceは、潜在表現をデコードし、短い、固定長のアクションを生成し、そのアクションを適用して単一の編集を完了させる。
総合的な比較として、算術演算子復元(AOR)、算術演算子単純化(AES)、算術演算子補正(AEC)の3種類のテキスト編集タスクを紹介する。
論文 参考訳(メタデータ) (2020-09-26T17:06:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。