Fugu-MT 論文翻訳(概要): Context-Aware Machine Translation with Source Coreference Explanation

論文の概要: Context-Aware Machine Translation with Source Coreference Explanation

arxiv url: http://arxiv.org/abs/2404.19505v1
Date: Tue, 30 Apr 2024 12:41:00 GMT
ステータス: 翻訳完了
システム内更新日: 2024-05-01 14:15:27.642548
Title: Context-Aware Machine Translation with Source Coreference Explanation
Title（参考訳）: ソース参照記述を用いた文脈対応機械翻訳
Authors: Huy Hien Vu, Hidetaka Kamigaito, Taro Watanabe,
Abstract要約: 本稿では,入力中のコア参照の特徴を予測し,翻訳のための意思決定を説明するモデルを提案する。我々は、WMT文書レベルの翻訳タスクにおいて、英語-ドイツ語データセット、英語-ロシア語データセット、多言語TEDトークデータセットの評価を行った。
参考スコア（独自算出の注目度）: 26.336947440529713
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Despite significant improvements in enhancing the quality of translation, context-aware machine translation (MT) models underperform in many cases. One of the main reasons is that they fail to utilize the correct features from context when the context is too long or their models are overly complex. This can lead to the explain-away effect, wherein the models only consider features easier to explain predictions, resulting in inaccurate translations. To address this issue, we propose a model that explains the decisions made for translation by predicting coreference features in the input. We construct a model for input coreference by exploiting contextual features from both the input and translation output representations on top of an existing MT model. We evaluate and analyze our method in the WMT document-level translation task of English-German dataset, the English-Russian dataset, and the multilingual TED talk dataset, demonstrating an improvement of over 1.0 BLEU score when compared with other context-aware models.
Abstract（参考訳）: 翻訳の質が大幅に向上したにもかかわらず、文脈対応機械翻訳(MT)モデルは多くの場合性能が劣る。主な理由の1つは、コンテキストが長すぎる場合やモデルが複雑すぎる場合、コンテキストから正しい機能を利用することができないことである。モデルでは、予測をより簡単に説明できる機能しか考慮せず、結果として不正確な翻訳が行われる。この問題に対処するために,入力中のコア参照の特徴を予測し,翻訳のための決定を記述したモデルを提案する。本稿では,既存のMTモデル上での入力と変換の両方の出力表現からコンテキスト特徴を活用することで,入力コア参照のためのモデルを構築する。我々は、WMT文書レベル翻訳タスクにおいて、英語-ドイツ語データセット、英語-ロシア語データセット、多言語TEDトークデータセットの評価と分析を行い、他の文脈認識モデルと比較して1.0BLEUスコアの改善を実証した。

関連論文リスト

Unlocking Reasoning Capability on Machine Translation in Large Language Models [57.60641851466707]
推論指向の大規模言語モデル(RLM)は、明示的な中間推論を生成することにより、数学やコーディングといったタスクに強い利益をもたらす。 WMT24++ベンチマークを用いて,オープンおよびクローズドヘビー級のRCMを系統的に評価した。明示的な推論を可能にすることは、言語やモデル間の翻訳品質を一貫して低下させる。
論文参考訳（メタデータ） (2026-02-16T14:05:59Z)
ConECT Dataset: Overcoming Data Scarcity in Context-Aware E-Commerce MT [1.5546909030871632]
本研究は,電子商取引データの文脈において,モデルに情報を加えることによって翻訳を改善する方法について検討する。チェコ語からポーランド語への新しいeコマース製品翻訳データセットであるConECTを作成します。我々は視覚言語モデル(VLM)を検証し、視覚コンテキストが翻訳品質に役立つことを発見した。
論文参考訳（メタデータ） (2025-06-05T12:02:01Z)
Efficient Machine Translation with a BiLSTM-Attention Approach [0.0]
本稿では,翻訳品質の向上を目的とした新しいSeq2Seqモデルを提案する。このモデルでは、双方向長短期記憶ネットワーク(Bidirectional Long Short-Term Memory Network, Bi-LSTM)をエンコーダとして使用し、入力シーケンスのコンテキスト情報をキャプチャする。現在の主流トランスフォーマーモデルと比較して,本モデルはWMT14機械翻訳データセットにおいて優れた性能を発揮する。
論文参考訳（メタデータ） (2024-10-29T01:12:50Z)
Improving Language Models Trained on Translated Data with Continual Pre-Training and Dictionary Learning Analysis [3.16714407449467]
学習言語モデルにおける翻訳と合成データの役割について検討する。 NLLB-3B MTモデルを用いて英語からアラビア語に翻訳した。これらの問題を是正するために、我々は、合成された高品質のアラビア物語の小さなデータセットでモデルを事前訓練する。
論文参考訳（メタデータ） (2024-05-23T07:53:04Z)
The Devil is in the Errors: Leveraging Large Language Models for Fine-grained Machine Translation Evaluation [93.01964988474755]
AutoMQMは,大規模な言語モデルに対して,翻訳におけるエラーの識別と分類を求めるプロンプト技術である。テキスト内学習と微調整によるラベル付きデータの影響について検討する。次に, PaLM-2モデルを用いてAutoMQMを評価し, スコアのプロンプトよりも性能が向上することがわかった。
論文参考訳（メタデータ） (2023-08-14T17:17:21Z)
Unified Model Learning for Various Neural Machine Translation [63.320005222549646]
既存の機械翻訳(NMT)研究は主にデータセット固有のモデルの開発に焦点を当てている。我々は,NMT(UMLNMT)のための統一モデル学習モデル(Unified Model Learning for NMT)を提案する。 OurNMTは、データセット固有のモデルよりも大幅に改善され、モデルデプロイメントコストが大幅に削減される。
論文参考訳（メタデータ） (2023-05-04T12:21:52Z)
Reference-less Analysis of Context Specificity in Translation with Personalised Language Models [3.527589066359829]
本研究は、リッチキャラクタとフィルムアノテーションがいかにパーソナライズ言語モデル(LM)に活用できるかを考察する。非文脈モデルと比較して、難易度を最大6.5%削減するために、リッチな文脈情報を活用するLMを構築している。我々の領域における専門翻訳の文脈特化度は、文脈機械翻訳モデルによりよりよく保存できることを示す。
論文参考訳（メタデータ） (2023-03-29T12:19:23Z)
Towards Fine-Grained Information: Identifying the Type and Location of Translation Errors [80.22825549235556]
既存のアプローチでは、エラーの位置と型を同期的に考慮することはできない。我々はtextbf の追加と textbfomission エラーを予測するために FG-TED モデルを構築した。実験により,本モデルではエラータイプと位置の同時同定が可能であり,最先端の結果が得られた。
論文参考訳（メタデータ） (2023-02-17T16:20:33Z)
Evaluating and Improving the Coreference Capabilities of Machine Translation Models [30.60934078720647]
機械翻訳は幅広い言語能力を必要とする。現在のエンドツーエンドモデルは、バイリンガルコーパスで一致した文を観察することで暗黙的に学習することが期待されている。
論文参考訳（メタデータ） (2023-02-16T18:16:09Z)
HanoiT: Enhancing Context-aware Translation via Selective Context [95.93730812799798]
コンテキスト対応ニューラルネットワーク翻訳は、文書レベルのコンテキストを使用して翻訳品質を改善することを目的としている。無関係または自明な単語は、いくつかのノイズをもたらし、モデルが現在の文と補助的な文脈の関係を学ぶのを邪魔する可能性がある。そこで本稿では,階層的選択機構を備えたエンド・ツー・エンドのエンコーダ・デコーダモデルを提案する。
論文参考訳（メタデータ） (2023-01-17T12:07:13Z)
When Does Translation Require Context? A Data-driven, Multilingual Exploration [71.43817945875433]
談話の適切な処理は機械翻訳(MT)の品質に大きく貢献する文脈認識型MTにおける最近の研究は、評価中に少量の談話現象を標的にしようとしている。談話現象のモデル性能を識別・評価するタグの集合である,多言語談話認識ベンチマークを開発した。
論文参考訳（メタデータ） (2021-09-15T17:29:30Z)
Contrastive Learning for Context-aware Neural Machine TranslationUsing Coreference Information [14.671424999873812]
ソース文と文脈文のコア参照に基づく新しいデータ拡張とコントラスト学習方式であるCorefCLを提案する。コンテキスト文で検出されたコア参照の言及を自動的に破損させることで、CorefCLはコア参照の不整合に敏感なモデルをトレーニングすることができる。実験では,英語・ドイツ語・韓国語タスクの比較モデルのBLEUを一貫して改善した。
論文参考訳（メタデータ） (2021-09-13T05:18:47Z)
ChrEnTranslate: Cherokee-English Machine Translation Demo with Quality Estimation and Corrective Feedback [70.5469946314539]
ChrEnTranslateは、英語と絶滅危惧言語チェロキーとの翻訳のためのオンライン機械翻訳デモシステムである。統計モデルとニューラルネットワークモデルの両方をサポートし、信頼性をユーザに通知するための品質評価を提供する。
論文参考訳（メタデータ） (2021-07-30T17:58:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。