論文の概要: Towards Tailored Recovery of Lexical Diversity in Literary Machine Translation
- arxiv url: http://arxiv.org/abs/2408.17308v1
- Date: Fri, 30 Aug 2024 14:12:04 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-02 15:08:40.268564
- Title: Towards Tailored Recovery of Lexical Diversity in Literary Machine Translation
- Title(参考訳): 文学機械翻訳における語彙の多様性回復に向けて
- Authors: Esther Ploeger, Huiyuan Lai, Rik van Noord, Antonio Toral,
- Abstract要約: 機械翻訳は人間翻訳よりも語彙的に劣っている。
本稿では,原文と翻訳文を区別する分類器を用いて,翻訳候補を再ランク付けする手法を提案する。
我々は,31の英蘭本翻訳に対するアプローチを評価し,ある書籍について,人間の翻訳に近い語彙的多様性のスコアを抽出することを発見した。
- 参考スコア(独自算出の注目度): 11.875491080062233
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Machine translations are found to be lexically poorer than human translations. The loss of lexical diversity through MT poses an issue in the automatic translation of literature, where it matters not only what is written, but also how it is written. Current methods for increasing lexical diversity in MT are rigid. Yet, as we demonstrate, the degree of lexical diversity can vary considerably across different novels. Thus, rather than aiming for the rigid increase of lexical diversity, we reframe the task as recovering what is lost in the machine translation process. We propose a novel approach that consists of reranking translation candidates with a classifier that distinguishes between original and translated text. We evaluate our approach on 31 English-to-Dutch book translations, and find that, for certain books, our approach retrieves lexical diversity scores that are close to human translation.
- Abstract(参考訳): 機械翻訳は人間翻訳よりも語彙的に劣っている。
MTによる語彙の多様性の喪失は、文学の自動翻訳において問題となる。
MTの語彙多様性を高めるための現在の手法は厳密である。
しかし、我々が示したように、語彙の多様性の程度は小説によって大きく異なる可能性がある。
したがって、語彙多様性の厳密な増加を目指すのではなく、機械翻訳プロセスで失ったものを復元するタスクを再構成する。
本稿では,原文と翻訳文を区別する分類器を用いて,翻訳候補を再ランク付けする手法を提案する。
我々は,31の英蘭本翻訳に対するアプローチを評価し,ある書籍について,人間の翻訳に近い語彙的多様性のスコアを抽出することを発見した。
関連論文リスト
- (Perhaps) Beyond Human Translation: Harnessing Multi-Agent Collaboration for Translating Ultra-Long Literary Texts [52.18246881218829]
本稿では,大言語モデル(LLM)をベースとした多エージェントフレームワークを,TransAgentsという企業として実装した。
本システムの有効性を評価するため,モノリンガル・ヒューマン・プライス(MHP)とバイリンガル・LLM・プライス(BLP)の2つの革新的な評価戦略を提案する。
論文 参考訳(メタデータ) (2024-05-20T05:55:08Z) - Crossing the Threshold: Idiomatic Machine Translation through Retrieval
Augmentation and Loss Weighting [66.02718577386426]
慣用的な翻訳と関連する問題を簡易に評価する。
我々は,変圧器をベースとした機械翻訳モデルが慣用的な翻訳に対して正しくデフォルトとなる点を明らかにするための合成実験を行った。
自然慣用句の翻訳を改善するために, 単純かつ効果的な2つの手法を導入する。
論文 参考訳(メタデータ) (2023-10-10T23:47:25Z) - The Best of Both Worlds: Combining Human and Machine Translations for
Multilingual Semantic Parsing with Active Learning [50.320178219081484]
人文翻訳と機械翻訳の両方の長所を生かした能動的学習手法を提案する。
理想的な発話選択は、翻訳されたデータの誤りとバイアスを著しく低減することができる。
論文 参考訳(メタデータ) (2023-05-22T05:57:47Z) - Lost in Translationese? Reducing Translation Effect Using Abstract
Meaning Representation [11.358350306918027]
抽象的意味表現(AMR)は、翻訳文中の翻訳文の量を減らし、インターリンガとして使用できると論じる。
英語の翻訳をAMRに解析し、そのAMRからテキストを生成することで、その結果は元々の英語のテキストとよりよく似ている。
この研究は、テキストの翻訳を減らし、言語間言語としてのAMRの有用性を強調している。
論文 参考訳(メタデータ) (2023-04-23T00:04:14Z) - Exploring Document-Level Literary Machine Translation with Parallel
Paragraphs from World Literature [35.1398797683712]
文献翻訳者は, 機械翻訳段落よりも, 84%の割合で人文翻訳を好んでいる。
我々は、通常のMT出力よりも出力が好ましい後編集モデルを専門家によって69%の速度で訓練する。
論文 参考訳(メタデータ) (2022-10-25T18:03:34Z) - Exploring Diversity in Back Translation for Low-Resource Machine
Translation [85.03257601325183]
バックトランスフォーメーションは、ニューラルマシントランスフォーメーションシステムの性能を改善するために最も広く使われている手法の1つである。
近年の研究では、生成された翻訳の「多様性」を増大させることにより、この手法の有効性を高めることを目指している。
この研究は、トレーニングデータの多様性を理解し、それを語彙的多様性と構文的多様性に分割する、より微妙なフレームワークを推し進めている。
論文 参考訳(メタデータ) (2022-06-01T15:21:16Z) - Quantitative Evaluation of Alternative Translations in a Corpus of
Highly Dissimilar Finnish Paraphrases [1.8748036062767652]
本稿では,最近リリースされたフィンランド語パラフレーズコーパスにおける代替翻訳の違いを定量的に評価する。
体系的な変動を検出する一連の自動ステップと手動分析を組み合わせることで、規則性を明らかにし、翻訳の違いのカテゴリを識別する。
論文 参考訳(メタデータ) (2021-05-06T07:22:16Z) - Decoding and Diversity in Machine Translation [90.33636694717954]
NMTが楽しむBLEUスコアに対して支払う費用の多様性の違いを特徴付ける。
本研究は,ジェンダー代名詞を翻訳する際に,検索が既知バイアスの正解源となることを示唆する。
論文 参考訳(メタデータ) (2020-11-26T21:09:38Z) - Translation Artifacts in Cross-lingual Transfer Learning [51.66536640084888]
機械翻訳は、既存の言語間モデルに顕著な影響を与える微妙なアーティファクトを導入することができることを示す。
自然言語の推論では、前提と仮説を独立に翻訳することで、それらの間の語彙的重複を減らすことができる。
また、XNLIでは、それぞれ4.3点と2.8点の翻訳とゼロショットのアプローチを改善している。
論文 参考訳(メタデータ) (2020-04-09T17:54:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。