論文の概要: TranslationCorrect: A Unified Framework for Machine Translation Post-Editing with Predictive Error Assistance
- arxiv url: http://arxiv.org/abs/2506.18337v1
- Date: Mon, 23 Jun 2025 06:38:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-24 19:06:36.886631
- Title: TranslationCorrect: A Unified Framework for Machine Translation Post-Editing with Predictive Error Assistance
- Title(参考訳): TranslationCorrect: 予測エラー支援を備えた機械翻訳後編集のための統一フレームワーク
- Authors: Syed Mekael Wasti, Shou-Yi Hung, Christopher Collins, En-Shiun Annie Lee,
- Abstract要約: 機械翻訳(MT)後編集と研究データ収集は、しばしば非効率な翻訳に頼っている。
本稿ではこれらのタスクを合理化するための統合フレームワークであるTranslationCorrectを紹介する。
NLLBのようなモデルを使ったMT生成、XCOMETやLLM APIのようなモデルを使った自動エラー予測(詳細な推論を提供する)、単一環境における直感的な後編集インターフェースを組み合わせたものだ。
- 参考スコア(独自算出の注目度): 5.306276499628096
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine translation (MT) post-editing and research data collection often rely on inefficient, disconnected workflows. We introduce TranslationCorrect, an integrated framework designed to streamline these tasks. TranslationCorrect combines MT generation using models like NLLB, automated error prediction using models like XCOMET or LLM APIs (providing detailed reasoning), and an intuitive post-editing interface within a single environment. Built with human-computer interaction (HCI) principles in mind to minimize cognitive load, as confirmed by a user study. For translators, it enables them to correct errors and batch translate efficiently. For researchers, TranslationCorrect exports high-quality span-based annotations in the Error Span Annotation (ESA) format, using an error taxonomy inspired by Multidimensional Quality Metrics (MQM). These outputs are compatible with state-of-the-art error detection models and suitable for training MT or post-editing systems. Our user study confirms that TranslationCorrect significantly improves translation efficiency and user satisfaction over traditional annotation methods.
- Abstract(参考訳): 機械翻訳(MT)後編集と研究データ収集は、しばしば非効率で非接続のワークフローに依存している。
本稿ではこれらのタスクを合理化するための統合フレームワークであるTranslationCorrectを紹介する。
TranslationCorrectは、NLLBのようなモデルを使ったMT生成、XCOMETやLLM APIのようなモデルを使った自動エラー予測(詳細な推論を提供する)、単一環境における直感的な後編集インターフェースを組み合わせたものだ。
ユーザ調査で確認されたように、認知負荷を最小限に抑えるために、ヒューマンコンピュータインタラクション(HCI)の原則を念頭に構築されている。
トランスレータの場合、エラーを訂正し、バッチ変換を効率的に行うことができる。
研究者にとって、TranslationCorrectは、多次元品質メトリクス(MQM)にインスパイアされたエラー分類を用いて、Error Span Annotation (ESA)フォーマットで高品質なスパンベースのアノテーションをエクスポートする。
これらの出力は最先端のエラー検出モデルと互換性があり、MTや後処理システムのトレーニングに適している。
本研究は,従来のアノテーション手法よりも翻訳効率とユーザ満足度を大幅に向上させることを確認した。
関連論文リスト
- Design of intelligent proofreading system for English translation based on CNN and BERT [5.498056383808144]
本稿では,ロバストな証明読解のための新しいハイブリッド手法を提案する。
畳み込みニューラルネットワーク(CNN)と変換器からの双方向表現(BERT)を組み合わせる。
実験は90%の精度、89.37%のF1、および16.24%のMSEを達成し、最近の証明読解技術を10%以上上回った。
論文 参考訳(メタデータ) (2025-06-05T09:34:42Z) - Towards Zero-Shot Multimodal Machine Translation [64.9141931372384]
本稿では,マルチモーダル機械翻訳システムの学習において,完全教師付きデータの必要性を回避する手法を提案する。
我々の手法はZeroMMTと呼ばれ、2つの目的の混合で学習することで、強いテキストのみの機械翻訳(MT)モデルを適応させることである。
本手法が完全に教師付きトレーニングデータを持たない言語に一般化されることを証明するため,CoMMuTE評価データセットをアラビア語,ロシア語,中国語の3言語に拡張した。
論文 参考訳(メタデータ) (2024-07-18T15:20:31Z) - Context-Aware Machine Translation with Source Coreference Explanation [26.336947440529713]
本稿では,入力中のコア参照の特徴を予測し,翻訳のための意思決定を説明するモデルを提案する。
我々は、WMT文書レベルの翻訳タスクにおいて、英語-ドイツ語データセット、英語-ロシア語データセット、多言語TEDトークデータセットの評価を行った。
論文 参考訳(メタデータ) (2024-04-30T12:41:00Z) - The Devil is in the Errors: Leveraging Large Language Models for
Fine-grained Machine Translation Evaluation [93.01964988474755]
AutoMQMは,大規模な言語モデルに対して,翻訳におけるエラーの識別と分類を求めるプロンプト技術である。
テキスト内学習と微調整によるラベル付きデータの影響について検討する。
次に, PaLM-2モデルを用いてAutoMQMを評価し, スコアのプロンプトよりも性能が向上することがわかった。
論文 参考訳(メタデータ) (2023-08-14T17:17:21Z) - Towards Fine-Grained Information: Identifying the Type and Location of
Translation Errors [80.22825549235556]
既存のアプローチでは、エラーの位置と型を同期的に考慮することはできない。
我々はtextbf の追加と textbfomission エラーを予測するために FG-TED モデルを構築した。
実験により,本モデルではエラータイプと位置の同時同定が可能であり,最先端の結果が得られた。
論文 参考訳(メタデータ) (2023-02-17T16:20:33Z) - Easy Guided Decoding in Providing Suggestions for Interactive Machine
Translation [14.615314828955288]
我々は、新しい制約付きデコーディングアルゴリズム、すなわちPrefix Suffix Guided Decoding (PSGD)を提案する。
PSGDは平均で10.87ドルのBLEUと8.62ドルのBLEUをWeTSとWMT 2022のTranslation Suggestionデータセットで改善している。
論文 参考訳(メタデータ) (2022-11-14T03:40:02Z) - Computer Assisted Translation with Neural Quality Estimation and
Automatic Post-Editing [18.192546537421673]
本稿では,機械翻訳出力の品質推定と自動編集のためのエンドツーエンドのディープラーニングフレームワークを提案する。
我々のゴールは、誤り訂正の提案を提供することであり、解釈可能なモデルにより、人間の翻訳者の負担を軽減することである。
論文 参考訳(メタデータ) (2020-09-19T00:29:00Z) - On the Inference Calibration of Neural Machine Translation [54.48932804996506]
校正と翻訳性能と誤校正の言語特性の相関について検討した。
そこで本研究では,推論キャリブレーションと翻訳性能を両立できる新しいラベル平滑化手法を提案する。
論文 参考訳(メタデータ) (2020-05-03T02:03:56Z) - Towards Minimal Supervision BERT-based Grammar Error Correction [81.90356787324481]
我々は、事前訓練された言語モデルからコンテキスト情報を取り入れて、アノテーションを活用し、多言語シナリオの恩恵を得ようとしている。
その結果、文法的誤り訂正タスクにおいて、変換器(BERT)からの双方向表現の強い可能性を示す。
論文 参考訳(メタデータ) (2020-01-10T15:45:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。