論文の概要: Towards Debiasing Translation Artifacts
- arxiv url: http://arxiv.org/abs/2205.08001v1
- Date: Mon, 16 May 2022 21:46:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-19 00:05:31.548153
- Title: Towards Debiasing Translation Artifacts
- Title(参考訳): 翻訳アーティファクトの脱バイアス化に向けて
- Authors: Koel Dutta Chowdhury, Rricha Jalota, Cristina Espa\~na-Bonet, and
Josef van Genabith
- Abstract要約: 確立されたバイアス除去手法を拡張して,翻訳文の削減のための新しい手法を提案する。
我々は、反復的ヌル空間投影(INLP)アルゴリズムを用いて、デバイアス前後の分類精度を計測することにより、文レベルと単語レベルの両方で翻訳文が削減されることを示す。
我々の知る限りでは、これは潜伏埋め込み空間で表現される翻訳語をデビアスする最初の研究である。
- 参考スコア(独自算出の注目度): 15.991970288297443
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cross-lingual natural language processing relies on translation, either by
humans or machines, at different levels, from translating training data to
translating test sets. However, compared to original texts in the same
language, translations possess distinct qualities referred to as
translationese. Previous research has shown that these translation artifacts
influence the performance of a variety of cross-lingual tasks. In this work, we
propose a novel approach to reducing translationese by extending an established
bias-removal technique. We use the Iterative Null-space Projection (INLP)
algorithm, and show by measuring classification accuracy before and after
debiasing, that translationese is reduced at both sentence and word level. We
evaluate the utility of debiasing translationese on a natural language
inference (NLI) task, and show that by reducing this bias, NLI accuracy
improves. To the best of our knowledge, this is the first study to debias
translationese as represented in latent embedding space.
- Abstract(参考訳): 言語間自然言語処理は、トレーニングデータの翻訳からテストセットの翻訳に至るまで、人間か機械によって異なるレベルで翻訳に依存する。
しかし、同じ言語の原文と比較すると、翻訳は翻訳語と呼ばれる特徴を持っている。
これまでの研究では、これらの翻訳成果物が様々な言語横断タスクのパフォーマンスに影響を与えることが示されている。
そこで本研究では,確立されたバイアス除去手法を拡張し,翻訳文の削減手法を提案する。
反復的ヌル空間投影 (inlp) アルゴリズムを用い, デバイアス処理前後の分類精度を計測することにより, 文と単語レベルでの翻訳量が減少することを示す。
自然言語推論(nli)タスクにおける翻訳文のデバイアスの有効性を評価し,このバイアスの低減によりnli精度が向上することを示す。
我々の知る限りでは、これは潜伏埋め込み空間で表現される翻訳語をデビアスする最初の研究である。
関連論文リスト
- Mitigating Translationese in Low-resource Languages: The Storyboard Approach [9.676710061071809]
本稿では,より流動的で自然な文を引き出すために,ストーリーボードを活用した新しいデータ収集手法を提案する。
提案手法では,視覚刺激のあるネイティブ話者をストーリーボード形式で提示し,その記述を原文に直接露出することなく収集する。
従来のテキスト翻訳手法とストーリーボードによるアプローチを,精度と流布率の観点から総合評価した。
論文 参考訳(メタデータ) (2024-07-14T10:47:03Z) - Crossing the Threshold: Idiomatic Machine Translation through Retrieval
Augmentation and Loss Weighting [66.02718577386426]
慣用的な翻訳と関連する問題を簡易に評価する。
我々は,変圧器をベースとした機械翻訳モデルが慣用的な翻訳に対して正しくデフォルトとなる点を明らかにするための合成実験を行った。
自然慣用句の翻訳を改善するために, 単純かつ効果的な2つの手法を導入する。
論文 参考訳(メタデータ) (2023-10-10T23:47:25Z) - Extract and Attend: Improving Entity Translation in Neural Machine
Translation [141.7840980565706]
NMTにおけるエンティティ翻訳を強化するための抽出・アテンド手法を提案する。
提案手法は,エンティティの翻訳精度と全体的な翻訳品質の向上に有効である。
論文 参考訳(メタデータ) (2023-06-04T03:05:25Z) - The Best of Both Worlds: Combining Human and Machine Translations for
Multilingual Semantic Parsing with Active Learning [50.320178219081484]
人文翻訳と機械翻訳の両方の長所を生かした能動的学習手法を提案する。
理想的な発話選択は、翻訳されたデータの誤りとバイアスを著しく低減することができる。
論文 参考訳(メタデータ) (2023-05-22T05:57:47Z) - DEEP: DEnoising Entity Pre-training for Neural Machine Translation [123.6686940355937]
機械翻訳モデルは通常、トレーニングコーパスで稀な名前付きエンティティの翻訳を貧弱に生成することが示されている。
文中の名前付きエンティティ翻訳精度を向上させるために,大量のモノリンガルデータと知識ベースを利用するDenoising Entity Pre-training法であるDEEPを提案する。
論文 参考訳(メタデータ) (2021-11-14T17:28:09Z) - Time-Aware Ancient Chinese Text Translation and Inference [6.787414471399024]
我々は、古代漢文の翻訳をめぐる課題に対処することを目指している。
時代の違いによる言語的なギャップは、質の悪い翻訳をもたらす。
ほとんどの翻訳は、しばしばテキストを理解するのに非常に重要な文脈情報を欠いている。
論文 参考訳(メタデータ) (2021-07-07T12:23:52Z) - On the Language Coverage Bias for Neural Machine Translation [81.81456880770762]
言語カバレッジバイアスは、ニューラルネットワーク翻訳(NMT)において重要である。
実験を慎重に設計することにより、トレーニングデータにおける言語カバレッジバイアスの包括的分析を行う。
本稿では,言語カバレッジバイアス問題を軽減するための,シンプルで効果的な2つのアプローチを提案する。
論文 参考訳(メタデータ) (2021-06-07T01:55:34Z) - Translation Artifacts in Cross-lingual Transfer Learning [51.66536640084888]
機械翻訳は、既存の言語間モデルに顕著な影響を与える微妙なアーティファクトを導入することができることを示す。
自然言語の推論では、前提と仮説を独立に翻訳することで、それらの間の語彙的重複を減らすことができる。
また、XNLIでは、それぞれ4.3点と2.8点の翻訳とゼロショットのアプローチを改善している。
論文 参考訳(メタデータ) (2020-04-09T17:54:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。