論文の概要: Beyond "To whom it may concern": Tailoring Machine Translation to Audience and Intent
- arxiv url: http://arxiv.org/abs/2606.03259v1
- Date: Tue, 02 Jun 2026 07:23:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-03 22:00:04.833376
- Title: Beyond "To whom it may concern": Tailoring Machine Translation to Audience and Intent
- Title(参考訳): 「誰に関係あるか」を超えて--機械翻訳から聴衆・インテントへ
- Authors: Raphael Merx, Ekaterina Vylomova, Trevor Cohn,
- Abstract要約: 目的駆動型MTを50言語、5モデルサイズ、8テキストドメインで体系的に評価する。
明示的な指示は翻訳適応性を著しく改善し、非公式なドメイン(会話、ソーシャルメディア)に大きな利益をもたらすことがわかった。
目的適応型MTはLLMの実用的で測定可能な能力であり,目的対応のメトリクスの必要性を強調した。
- 参考スコア(独自算出の注目度): 24.00322671813583
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Translation quality depends on purpose: the same source text demands different translations depending on audience, tone, and communicative intent. Yet MT models and metrics treat translation as a fixed mapping from source to target. LLMs enable users to explicitly specify purpose alongside source text, yet this capability has not been evaluated at scale. We introduce a systematic evaluation of purpose-driven MT across 50 languages, 5 model sizes and 8 text domains. We find that (1) explicit instructions substantially improve translation adaptedness, with larger gains on informal domains (conversation, social media), for larger model sizes and for higher-resource languages; (2) instructions outperform semantically-matched few-shot examples and paragraph-level context; (3) traditional MT metrics fail to capture adaptation quality, often penalizing adapted translations; (4) when curated instructions are unavailable, models can self-generate them from surrounding document context, closing up to 80% of the adaptedness gap to curated instructions. Our results establish that purpose-adapted MT is a viable and measurable capability of LLMs, while highlighting the need for purpose-aware metrics.
- Abstract(参考訳): 翻訳の質は目的によって異なり、同じソーステキストは聴衆、トーン、コミュニケーション意図によって異なる翻訳を要求する。
しかし、MTモデルとメトリクスは、翻訳をソースからターゲットへの固定マッピングとして扱う。
LLMは、ユーザがソーステキストと並行して目的を明示的に指定することを可能にするが、この機能は大規模に評価されていない。
目的駆動型MTを50言語、5モデルサイズ、8テキストドメインで体系的に評価する。
その結果,(1) 形式的ドメイン(会話,ソーシャルメディア),(2) より大規模なモデルサイズや高ソース言語,(2) 意味論的に整合した少数ショットの例や段落レベルの文脈,(3) 従来のMTメトリクスは適応品質を達成できないこと,(4) キュレートされた命令が利用できない場合,モデルは周囲の文書コンテキストから自己生成し,キュレートされた命令に対する適応性ギャップの最大80%を閉じることができることがわかった。
目的適応型MTはLLMの実用的で測定可能な能力であり,目的対応のメトリクスの必要性を強調した。
関連論文リスト
- Beyond Literal Mapping: Benchmarking and Improving Non-Literal Translation Evaluation [57.11989521509119]
本稿では,特殊なサブエージェントを起動するリフレクティブコアエージェントを中心に,エージェント翻訳評価フレームワークを提案する。
実験の結果、RATEの有効性が示され、現在の測定値と比較して少なくとも3.2メタスコアの改善が達成された。
論文 参考訳(メタデータ) (2026-01-12T09:03:42Z) - Shortcomings of LLMs for Low-Resource Translation: Retrieval and Understanding are Both the Problem [4.830018386227]
本研究では,機械翻訳パイプラインの自動化の一環として,事前学習された大言語モデル(LLM)が低リソース言語から高リソース言語への翻訳を指示する際の文脈内学習能力について検討する。
我々は南ケチュアをスペイン語に翻訳する一連の実験を行い、デジタル化された教育材料と平行コーパスの制約されたデータベースから得られた様々な種類の文脈の情報量について検討する。
論文 参考訳(メタデータ) (2024-06-21T20:02:22Z) - Machine Translation Meta Evaluation through Translation Accuracy
Challenge Sets [92.38654521870444]
ACESは146の言語ペアにまたがる対照的な課題セットです。
このデータセットは、メトリクスが68の翻訳精度の誤差を識別できるかどうかを調べることを目的としている。
我々は、WMT2022および2023のメトリクス共有タスクに提出された50のメトリクスに対して、ACESをベンチマークすることで、大規模な研究を行う。
論文 参考訳(メタデータ) (2024-01-29T17:17:42Z) - Contextual Refinement of Translations: Large Language Models for Sentence and Document-Level Post-Editing [12.843274390224853]
大規模言語モデル(LLM)は、様々な自然言語処理タスクでかなりの成功を収めている。
ニューラルネットワーク翻訳における最先端性能は,まだ達成できていない。
直接翻訳者ではなく,自動編集者 (APE) としてLLMを適用することを提案する。
論文 参考訳(メタデータ) (2023-10-23T12:22:15Z) - The Devil is in the Errors: Leveraging Large Language Models for
Fine-grained Machine Translation Evaluation [93.01964988474755]
AutoMQMは,大規模な言語モデルに対して,翻訳におけるエラーの識別と分類を求めるプロンプト技術である。
テキスト内学習と微調整によるラベル付きデータの影響について検討する。
次に, PaLM-2モデルを用いてAutoMQMを評価し, スコアのプロンプトよりも性能が向上することがわかった。
論文 参考訳(メタデータ) (2023-08-14T17:17:21Z) - Document-Level Machine Translation with Large Language Models [91.03359121149595]
大規模言語モデル(LLM)は、様々な自然言語処理(NLP)タスクに対して、一貫性、凝集性、関連性、流動性のある回答を生成することができる。
本稿では,LLMの談話モデルにおける能力について詳細に評価する。
論文 参考訳(メタデータ) (2023-04-05T03:49:06Z) - When Does Translation Require Context? A Data-driven, Multilingual
Exploration [71.43817945875433]
談話の適切な処理は機械翻訳(MT)の品質に大きく貢献する
文脈認識型MTにおける最近の研究は、評価中に少量の談話現象を標的にしようとしている。
談話現象のモデル性能を識別・評価するタグの集合である,多言語談話認識ベンチマークを開発した。
論文 参考訳(メタデータ) (2021-09-15T17:29:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。