論文の概要: Towards Personalised and Document-level Machine Translation of Dialogue
- arxiv url: http://arxiv.org/abs/2102.10979v1
- Date: Thu, 11 Feb 2021 09:18:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2021-04-05 00:37:45.876635
- Title: Towards Personalised and Document-level Machine Translation of Dialogue
- Title(参考訳): 対話のパーソナライズと文書レベルの機械翻訳に向けて
- Authors: Sebastian T. Vincent
- Abstract要約: 本論文では,5言語でテレビ字幕から抽出した対話領域について,PersNMTとDocNMTに焦点を当てた。
1)NMTシステムに直接テキスト情報を導入すること,(2)凝集装置の機械翻訳を改善すること,(3)PersNMTとDocNMTの信頼性を評価すること,の3つの課題に対処する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: State-of-the-art (SOTA) neural machine translation (NMT) systems translate
texts at sentence level, ignoring context: intra-textual information, like the
previous sentence, and extra-textual information, like the gender of the
speaker. Because of that, some sentences are translated incorrectly.
Personalised NMT (PersNMT) and document-level NMT (DocNMT) incorporate this
information into the translation process. Both fields are relatively new and
previous work within them is limited. Moreover, there are no readily available
robust evaluation metrics for them, which makes it difficult to develop better
systems, as well as track global progress and compare different methods. This
thesis proposal focuses on PersNMT and DocNMT for the domain of dialogue
extracted from TV subtitles in five languages: English, Brazilian Portuguese,
German, French and Polish. Three main challenges are addressed: (1)
incorporating extra-textual information directly into NMT systems; (2)
improving the machine translation of cohesion devices; (3) reliable evaluation
for PersNMT and DocNMT.
- Abstract(参考訳): State-of-the-art(SOTA)ニューラルマシン翻訳(NMT)システムは、テキストを文レベルで翻訳し、文脈を無視する:前文のようなテキスト内情報、話者の性別のようなテキスト外情報である。
そのため、いくつかの文は誤って翻訳される。
パーソナライズされたNMT(PersNMT)とドキュメントレベルのNMT(DocNMT)は、この情報を翻訳プロセスに組み込む。
どちらの分野も比較的新しいもので、それ以前の作業は限られている。
さらに、簡単に利用できるロバストな評価指標は存在せず、より良いシステムを開発することや、グローバルな進捗を追跡し、異なる方法を比較することが困難になる。
この論文は、英語、ブラジルポルトガル語、ドイツ語、フランス語、ポーランド語のテレビ字幕から抽出された対話領域のPersNMTとDocNMTに焦点を当てている。
1)NMTシステムに直接テキスト情報を導入すること,(2)凝集装置の機械翻訳を改善すること,(3)PersNMTとDocNMTの信頼性を評価すること,の3つの課題に対処する。
関連論文リスト
- Importance-Aware Data Augmentation for Document-Level Neural Machine
Translation [51.74178767827934]
ドキュメントレベルのニューラルマシン翻訳(DocNMT)は、一貫性と結合性の両方を持つ翻訳を生成することを目的としている。
長い入力長とトレーニングデータの可用性が限られているため、DocNMTはデータスパシティーの課題に直面していることが多い。
本稿では,隠れ状態のノルムとトレーニング勾配から推定したトークン重要度情報に基づいてトレーニングデータを拡張するDocNMTのための新しいIADAアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-01-27T09:27:47Z) - Improving Long Context Document-Level Machine Translation [51.359400776242786]
翻訳の一貫性と凝集性を改善するために、ニューラルネットワーク翻訳(NMT)のための文書レベルのコンテキストが不可欠である。
文書レベルのNMTに関する多くの著作が出版されているが、ほとんどの作品では局所的な文脈に制限されている。
本稿では、メモリ消費を同時に低減しつつ、シーケンスの最も関連性の高い部分に注意を集中させる制約付注意変種を提案する。
論文 参考訳(メタデータ) (2023-06-08T13:28:48Z) - Discourse Centric Evaluation of Machine Translation with a Densely
Annotated Parallel Corpus [82.07304301996562]
本稿では,江らが導入した大規模並列コーパスBWBに基づいて,リッチな談話アノテーションを用いた新しいデータセットを提案する。
ソース言語とターゲット言語の談話構造と類似点と相違点について検討する。
我々はMT出力が人間の翻訳と基本的に異なることを発見した。
論文 参考訳(メタデータ) (2023-05-18T17:36:41Z) - Phrase-level Active Learning for Neural Machine Translation [107.28450614074002]
ドメイン内データの翻訳に所定の予算を費やすことのできる,アクティブな学習環境を提案する。
我々は、人間の翻訳者へのルーティングのために、新しいドメインの未ラベルデータから全文と個々の句を選択する。
ドイツ語と英語の翻訳タスクでは,不確実性に基づく文選択法に対して,能動的学習手法が一貫した改善を実現している。
論文 参考訳(メタデータ) (2021-06-21T19:20:42Z) - Diving Deep into Context-Aware Neural Machine Translation [36.17847243492193]
本稿では,4つの領域における文書レベルのNMTモデルの性能を解析する。
ドキュメントレベルのNMTに最適なアプローチはひとつもありません。
論文 参考訳(メタデータ) (2020-10-19T13:23:12Z) - SJTU-NICT's Supervised and Unsupervised Neural Machine Translation
Systems for the WMT20 News Translation Task [111.91077204077817]
我々は英語・中国語・英語・ポーランド語・ドイツ語・アッパー・ソルビアンという3つの言語対の4つの翻訳指導に参加した。
言語ペアの異なる条件に基づいて、我々は多様なニューラルネットワーク翻訳(NMT)技術の実験を行った。
私たちの提出書では、主要なシステムは英語、中国語、ポーランド語、英語、ドイツ語から上セルビア語への翻訳の道順で第一位を獲得しました。
論文 参考訳(メタデータ) (2020-10-11T00:40:05Z) - Neural Machine Translation: Challenges, Progress and Future [62.75523637241876]
機械翻訳(英: Machine translation, MT)は、コンピュータを利用して人間の言語を自動翻訳する技術である。
ニューラルマシン翻訳(NMT)は、ディープニューラルネットワークを用いたソース言語とターゲット言語間の直接マッピングをモデル化する。
この記事では、NMTフレームワークをレビューし、NMTの課題について論じ、最近のエキサイティングな進歩を紹介します。
論文 参考訳(メタデータ) (2020-04-13T07:53:57Z) - A Comprehensive Survey of Multilingual Neural Machine Translation [22.96845346423759]
我々は多言語ニューラルマシン翻訳(MNMT)について調査する。
MNMTは、機械翻訳の研究のために、エンドツーエンドのモデリングと分散表現が新しい道を開くため、統計機械翻訳よりも有望である。
まず、その中心となるユースケースに基づいて様々なアプローチを分類し、さらにリソースシナリオ、基礎となるモデリング原則、コアイシュー、課題に基づいてそれらを分類します。
論文 参考訳(メタデータ) (2020-01-04T19:38:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。