論文の概要: Towards Debiasing Translation Artifacts
- arxiv url: http://arxiv.org/abs/2205.08001v1
- Date: Mon, 16 May 2022 21:46:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-19 00:05:31.548153
- Title: Towards Debiasing Translation Artifacts
- Title(参考訳): 翻訳アーティファクトの脱バイアス化に向けて
- Authors: Koel Dutta Chowdhury, Rricha Jalota, Cristina Espa\~na-Bonet, and
Josef van Genabith
- Abstract要約: 確立されたバイアス除去手法を拡張して,翻訳文の削減のための新しい手法を提案する。
我々は、反復的ヌル空間投影(INLP)アルゴリズムを用いて、デバイアス前後の分類精度を計測することにより、文レベルと単語レベルの両方で翻訳文が削減されることを示す。
我々の知る限りでは、これは潜伏埋め込み空間で表現される翻訳語をデビアスする最初の研究である。
- 参考スコア(独自算出の注目度): 15.991970288297443
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cross-lingual natural language processing relies on translation, either by
humans or machines, at different levels, from translating training data to
translating test sets. However, compared to original texts in the same
language, translations possess distinct qualities referred to as
translationese. Previous research has shown that these translation artifacts
influence the performance of a variety of cross-lingual tasks. In this work, we
propose a novel approach to reducing translationese by extending an established
bias-removal technique. We use the Iterative Null-space Projection (INLP)
algorithm, and show by measuring classification accuracy before and after
debiasing, that translationese is reduced at both sentence and word level. We
evaluate the utility of debiasing translationese on a natural language
inference (NLI) task, and show that by reducing this bias, NLI accuracy
improves. To the best of our knowledge, this is the first study to debias
translationese as represented in latent embedding space.
- Abstract(参考訳): 言語間自然言語処理は、トレーニングデータの翻訳からテストセットの翻訳に至るまで、人間か機械によって異なるレベルで翻訳に依存する。
しかし、同じ言語の原文と比較すると、翻訳は翻訳語と呼ばれる特徴を持っている。
これまでの研究では、これらの翻訳成果物が様々な言語横断タスクのパフォーマンスに影響を与えることが示されている。
そこで本研究では,確立されたバイアス除去手法を拡張し,翻訳文の削減手法を提案する。
反復的ヌル空間投影 (inlp) アルゴリズムを用い, デバイアス処理前後の分類精度を計測することにより, 文と単語レベルでの翻訳量が減少することを示す。
自然言語推論(nli)タスクにおける翻訳文のデバイアスの有効性を評価し,このバイアスの低減によりnli精度が向上することを示す。
我々の知る限りでは、これは潜伏埋め込み空間で表現される翻訳語をデビアスする最初の研究である。
関連論文リスト
- Machine Translation Models are Zero-Shot Detectors of Translation
Direction [52.1701152610258]
平行テキストの翻訳方向を検出することは、機械翻訳訓練や評価に応用できるが、盗作や偽造の主張を解消するといった法医学的応用もある。
本研究では,翻訳文や機械翻訳文でよく知られた単純化効果によって動機付けられた,$p(texttranslation|text Origin)>p(textgenic|texttranslation)$という単純な仮説に基づいて,翻訳方向検出のための教師なしアプローチを検討する。
論文 参考訳(メタデータ) (2024-01-12T18:59:02Z) - Crossing the Threshold: Idiomatic Machine Translation through Retrieval
Augmentation and Loss Weighting [66.02718577386426]
慣用的な翻訳と関連する問題を簡易に評価する。
我々は,変圧器をベースとした機械翻訳モデルが慣用的な翻訳に対して正しくデフォルトとなる点を明らかにするための合成実験を行った。
自然慣用句の翻訳を改善するために, 単純かつ効果的な2つの手法を導入する。
論文 参考訳(メタデータ) (2023-10-10T23:47:25Z) - The Best of Both Worlds: Combining Human and Machine Translations for
Multilingual Semantic Parsing with Active Learning [50.320178219081484]
人文翻訳と機械翻訳の両方の長所を生かした能動的学習手法を提案する。
理想的な発話選択は、翻訳されたデータの誤りとバイアスを著しく低減することができる。
論文 参考訳(メタデータ) (2023-05-22T05:57:47Z) - DEEP: DEnoising Entity Pre-training for Neural Machine Translation [123.6686940355937]
機械翻訳モデルは通常、トレーニングコーパスで稀な名前付きエンティティの翻訳を貧弱に生成することが示されている。
文中の名前付きエンティティ翻訳精度を向上させるために,大量のモノリンガルデータと知識ベースを利用するDenoising Entity Pre-training法であるDEEPを提案する。
論文 参考訳(メタデータ) (2021-11-14T17:28:09Z) - Time-Aware Ancient Chinese Text Translation and Inference [6.787414471399024]
我々は、古代漢文の翻訳をめぐる課題に対処することを目指している。
時代の違いによる言語的なギャップは、質の悪い翻訳をもたらす。
ほとんどの翻訳は、しばしばテキストを理解するのに非常に重要な文脈情報を欠いている。
論文 参考訳(メタデータ) (2021-07-07T12:23:52Z) - On the Language Coverage Bias for Neural Machine Translation [81.81456880770762]
言語カバレッジバイアスは、ニューラルネットワーク翻訳(NMT)において重要である。
実験を慎重に設計することにより、トレーニングデータにおける言語カバレッジバイアスの包括的分析を行う。
本稿では,言語カバレッジバイアス問題を軽減するための,シンプルで効果的な2つのアプローチを提案する。
論文 参考訳(メタデータ) (2021-06-07T01:55:34Z) - Translation Artifacts in Cross-lingual Transfer Learning [51.66536640084888]
機械翻訳は、既存の言語間モデルに顕著な影響を与える微妙なアーティファクトを導入することができることを示す。
自然言語の推論では、前提と仮説を独立に翻訳することで、それらの間の語彙的重複を減らすことができる。
また、XNLIでは、それぞれ4.3点と2.8点の翻訳とゼロショットのアプローチを改善している。
論文 参考訳(メタデータ) (2020-04-09T17:54:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。