論文の概要: Towards Making the Most of Dialogue Characteristics for Neural Chat
Translation
- arxiv url: http://arxiv.org/abs/2109.00668v1
- Date: Thu, 2 Sep 2021 02:04:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-03 13:56:42.499252
- Title: Towards Making the Most of Dialogue Characteristics for Neural Chat
Translation
- Title(参考訳): ニューラルチャット翻訳における対話特性の活用に向けて
- Authors: Yunlong Liang, Chulun Zhou, Fandong Meng, Jinan Xu, Yufeng Chen,
Jinsong Su and Jie Zhou
- Abstract要約: NCTモデルへの対話特性のモデリングによるチャット翻訳の促進を提案する。
これらすべてのタスクのトレーニング目標を通じて,NCTモデルを最適化する。
4つの言語方向に関する総合的な実験により,提案手法の有効性と優位性を検証した。
- 参考スコア(独自算出の注目度): 39.995680617671184
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Neural Chat Translation (NCT) aims to translate conversational text between
speakers of different languages. Despite the promising performance of
sentence-level and context-aware neural machine translation models, there still
remain limitations in current NCT models because the inherent dialogue
characteristics of chat, such as dialogue coherence and speaker personality,
are neglected. In this paper, we propose to promote the chat translation by
introducing the modeling of dialogue characteristics into the NCT model. To
this end, we design four auxiliary tasks including monolingual response
generation, cross-lingual response generation, next utterance discrimination,
and speaker identification. Together with the main chat translation task, we
optimize the NCT model through the training objectives of all these tasks. By
this means, the NCT model can be enhanced by capturing the inherent dialogue
characteristics, thus generating more coherent and speaker-relevant
translations. Comprehensive experiments on four language directions
(English-German and English-Chinese) verify the effectiveness and superiority
of the proposed approach.
- Abstract(参考訳): neural chat translation (nct)は、異なる言語の話者間で会話テキストを翻訳することを目的としている。
文レベルおよび文脈対応ニューラルマシン翻訳モデルの有望な性能にもかかわらず、対話コヒーレンスや話者パーソナリティといったチャット固有の対話特性が無視されるため、現在のnctモデルにはまだ限界がある。
本稿では,NCTモデルに対話特性のモデル化を導入することにより,チャット翻訳を促進することを提案する。
この目的のために, 単言語応答生成, 言語間応答生成, 次の発話識別, 話者識別の4つの補助タスクを設計する。
主チャット翻訳タスクと合わせて,これらのタスクのトレーニング目標を通じてnctモデルを最適化する。
これにより、固有の対話特性を捉えて、よりコヒーレントで話者関係の翻訳を生成することで、nctモデルを強化することができる。
4つの言語方向(ドイツ語と中国語)に関する総合実験により,提案手法の有効性と優位性を検証した。
関連論文リスト
- FutureTOD: Teaching Future Knowledge to Pre-trained Language Model for
Task-Oriented Dialogue [20.79359173822053]
本稿では,対話前学習モデルFutureTODを提案する。
我々の直感は、良い対話表現はどちらも局所的な文脈情報を学び、将来の情報を予測することである。
論文 参考訳(メタデータ) (2023-06-17T10:40:07Z) - A Multi-task Multi-stage Transitional Training Framework for Neural Chat
Translation [84.59697583372888]
ニューラルチャット翻訳(NCT)は、異なる言語の話者間の言語間チャットを翻訳することを目的としている。
既存の文脈対応NMTモデルは、注釈付きバイリンガル対話のリソースが限られているため、満足な性能を達成できない。
NCTモデルをバイリンガルチャット翻訳データセットと追加の単言語対話を用いて訓練するマルチタスク・マルチステージ・トランザクショナル(MMT)トレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2023-01-27T14:41:16Z) - STRUDEL: Structured Dialogue Summarization for Dialogue Comprehension [42.57581945778631]
抽象的な対話要約は、自然言語処理における重要なスタンドアロンタスクとみなされてきた。
本稿では,新たな対話要約タスクであるSTRUctured DiaLoguE Summarizationを提案する。
変換器エンコーダ言語モデルの対話理解性能を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2022-12-24T04:39:54Z) - Scheduled Multi-task Learning for Neural Chat Translation [66.81525961469494]
ニューラルチャット翻訳(NCT)のためのマルチタスク学習フレームワークを提案する。
具体的には、大規模なドメイン内チャット翻訳データをトレーニングに組み込むための3段階のトレーニングフレームワークを考案する。
提案手法の有効性と優越性を検証するために, 4言語方向の広範囲な実験を行った。
論文 参考訳(メタデータ) (2022-05-08T02:57:28Z) - Back to the Future: Bidirectional Information Decoupling Network for
Multi-turn Dialogue Modeling [80.51094098799736]
ユニバーサル対話エンコーダとして双方向情報デカップリングネットワーク(BiDeN)を提案する。
BiDeNは過去と将来の両方のコンテキストを明示的に取り入れており、幅広い対話関連のタスクに一般化することができる。
異なる下流タスクのデータセットに対する実験結果は、我々のBiDeNの普遍性と有効性を示している。
論文 参考訳(メタデータ) (2022-04-18T03:51:46Z) - Modeling Bilingual Conversational Characteristics for Neural Chat
Translation [24.94474722693084]
上記の特性をモデル化して会話テキストの翻訳品質を高めることを目的としている。
我々は、ベンチマークデータセットBConTrasT(英語-ドイツ語)と、BMELD(英語-中国語)という自己コンパイルバイリンガル対話コーパスに対するアプローチを評価した。
我々のアプローチは,強いベースラインよりも高いマージンで性能を向上し,BLEUとTERの観点から,最先端のコンテキスト対応NMTモデルを大幅に上回っている。
論文 参考訳(メタデータ) (2021-07-23T12:23:34Z) - Structured Attention for Unsupervised Dialogue Structure Induction [110.12561786644122]
本稿では、構造化された注意層を離散潜在状態を持つ変化型リカレントニューラルネットワーク(VRNN)モデルに組み込んで、教師なしの方法で対話構造を学ぶことを提案する。
バニラVRNNと比較して、構造化された注意は、構造的帰納バイアスを強制しながら、ソース文の埋め込みの異なる部分にフォーカスすることができる。
論文 参考訳(メタデータ) (2020-09-17T23:07:03Z) - TOD-BERT: Pre-trained Natural Language Understanding for Task-Oriented
Dialogue [113.45485470103762]
本研究では,言語モデリングのためのタスク指向対話データセットを,人間とマルチターンの9つに統合する。
事前学習時の対話動作をモデル化するために,ユーザトークンとシステムトークンをマスク付き言語モデルに組み込む。
論文 参考訳(メタデータ) (2020-04-15T04:09:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。