論文の概要: Testing the Deliteralization Hypothesis in Human and Machine Translation
- arxiv url: http://arxiv.org/abs/2605.25686v1
- Date: Mon, 25 May 2026 10:40:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:19.744824
- Title: Testing the Deliteralization Hypothesis in Human and Machine Translation
- Title(参考訳): 人・機械翻訳における脱リテラル化仮説の検証
- Authors: Malik Marmonier, Rachel Bawden, Benoît Sagot,
- Abstract要約: 我々は、翻訳が起草され、改訂されるにつれて、徐々にリテラルが減っていくという主張をテストする。
人間の翻訳と後編集のリテラリティを,54言語対にわたる2つのNMTシステムと6つのLLMシステムと比較した。
近年のLLMでは差が狭まっているものの, (i) 人間の翻訳は試験されたMTシステムに比べてはるかに少ないことが判明した。
- 参考スコア(独自算出の注目度): 23.7663178803576
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The recent shift from dedicated NMT systems to general-purpose LLMs has reshaped machine translation, with LLMs reported to produce more fluent, less literal output than their predecessors. We test whether this shift extends to the deliteralization hypothesis, the long-standing claim from translation studies that translations become progressively less literal as they are drafted and revised. Using the WMT24++ dataset, we compare the literality of human translations and post-editions to that of two NMT systems and six LLMs across 54 language pairs and three tasks: direct translation, iterative self-revision, and post-editing of human drafts. Literality is measured via a validated Synthetic Literality Index built from six heuristics. We find that (i) human translations remain significantly less literal than those of all tested MT systems, though recent LLMs narrow the gap; (ii) when prompted to iteratively revise their own output, LLMs deliteralize monotonically, providing the first evidence that the hypothesis applies natively to LLM generation; and (iii) as post-editors, LLMs invert the revision triggers of human post-editors, tolerating literal drafts and targeting idiomatic human formulations for revision.
- Abstract(参考訳): 近年、専用のNMTシステムから汎用LLMへのシフトにより機械翻訳が作り直され、LLMは前者よりもより流動的でリテラルの少ない出力を生み出すと報告されている。
このシフトが、翻訳研究からの長年の主張である、翻訳が起草され、改訂されるにつれて、徐々にリテラルが減っていくという脱リテラル化仮説(deliteralization hypothesis)にまで及んでいるかどうかを検証する。
WMT24++データセットを用いて、人間の翻訳と後編集のリテラリティを、54の言語対にまたがる2つのNMTシステムと6つのLLMのリテラルと、直接翻訳、反復的自己修正、人間のドラフトのポスト編集の3つのタスクと比較する。
リテラリティは、6つのヒューリスティックから構築された検証済みの合成リテラリティ指数によって測定される。
私たちはそれを見つける。
(i)最近のLLMはギャップを狭めているが、ヒト翻訳は試験されたMTシステムよりもはるかに少ないリテラルを維持している。
(二)自己の出力を反復的に修正するよう促された場合、LLMは単調に復刻し、この仮説がLLM生成にネイティブに適用されるという最初の証拠を与える。
三 後編集員として、後編集員のリビジョントリガーを逆転させ、リテラル草案を許容し、改訂のための慣用的な人間定式化を目標とする。
関連論文リスト
- Lost in Literalism: How Supervised Training Shapes Translationese in LLMs [51.04435855143767]
大規模言語モデル(LLM)は機械翻訳において顕著な成功を収めた。
しかし、過度にリテラルと不自然な翻訳を特徴とする翻訳は、依然として永続的な課題である。
我々は、黄金の基準を磨き、不自然なトレーニングインスタンスをフィルタリングするなど、これらのバイアスを軽減する方法を導入する。
論文 参考訳(メタデータ) (2025-03-06T12:14:45Z) - Language Models and Cycle Consistency for Self-Reflective Machine Translation [1.79487674052027]
我々は、ソース言語Aからターゲット言語Bへの複数の翻訳候補を生成し、その後、これらの候補を元の言語Aに翻訳する。
トークンレベルの精度や精度などの指標を用いて、原文と裏文の周期一貫性を評価することにより、言語Bの翻訳品質を暗黙的に推定する。
各原文に対して、翻訳候補を、原文と最適なサイクル整合性で同定し、最終回答とする。
論文 参考訳(メタデータ) (2024-11-05T04:01:41Z) - (Perhaps) Beyond Human Translation: Harnessing Multi-Agent Collaboration for Translating Ultra-Long Literary Texts [56.7988577327046]
翻訳企業の役割と協調の実践をシミュレートする,新しいマルチエージェントフレームワークであるTransAgentsを紹介する。
本研究は,翻訳品質の向上,特にテキストの長文化におけるマルチエージェント協調の可能性を明らかにするものである。
論文 参考訳(メタデータ) (2024-05-20T05:55:08Z) - Building Accurate Translation-Tailored LLMs with Language Aware Instruction Tuning [57.323716555996114]
オフターゲット翻訳は、特に低リソース言語では未解決の問題である。
最近の研究は、翻訳命令の機能を強調するために高度なプロンプト戦略を設計するか、LLMの文脈内学習能力を活用している。
本研究では,LLMの命令追従能力(特に翻訳方向)を向上させるために,2段階の微調整アルゴリズムを設計する。
論文 参考訳(メタデータ) (2024-03-21T13:47:40Z) - TEaR: Improving LLM-based Machine Translation with Systematic Self-Refinement [26.26493253161022]
大規模言語モデル(LLM)は機械翻訳(MT)において印象的な結果を得た
我々は,体系的LLMに基づく自己精製翻訳フレームワーク,textbfTEaRを紹介する。
論文 参考訳(メタデータ) (2024-02-26T07:58:12Z) - Adapting Large Language Models for Document-Level Machine Translation [46.370862171452444]
大規模言語モデル(LLM)は、様々な自然言語処理(NLP)タスクを大幅に進歩させた。
近年の研究では、中程度のLLMはタスク固有の微調整後、より大きなLLMよりも優れていることが示されている。
本研究では,特定の言語対に対する文書レベルの機械翻訳(DocMT)にLLMを適用することに焦点を当てた。
論文 参考訳(メタデータ) (2024-01-12T09:29:13Z) - Multilingual Machine Translation with Large Language Models: Empirical Results and Analysis [103.89753784762445]
大規模言語モデル(LLM)は多言語機械翻訳(MMT)の処理において顕著な可能性を示した。
本稿では, MMT における LLM の利点と課題を体系的に検討する。
また,ChatGPTとGPT-4を含む8つのLLMを徹底的に評価した。
論文 参考訳(メタデータ) (2023-04-10T15:51:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。