論文の概要: On the Integration of LinguisticFeatures into Statistical and Neural
Machine Translation
- arxiv url: http://arxiv.org/abs/2003.14324v1
- Date: Tue, 31 Mar 2020 16:03:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-18 00:02:22.921421
- Title: On the Integration of LinguisticFeatures into Statistical and Neural
Machine Translation
- Title(参考訳): 統計的・神経機械翻訳への言語的特徴の統合について
- Authors: Eva Vanmassenhove
- Abstract要約: 機械翻訳に対する統計的アプローチの強みと人間の翻訳方法の相違について検討する。
自動翻訳システムがより正確な翻訳を行うために欠落している言語情報を同定する。
我々は、過一般化または「アルゴミックバイアス」をニューラルMTの潜在的な欠点として認識し、残りの言語問題の多くにリンクする。
- 参考スコア(独自算出の注目度): 2.132096006921048
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: New machine translations (MT) technologies are emerging rapidly and with
them, bold claims of achieving human parity such as: (i) the results produced
approach "accuracy achieved by average bilingual human translators" (Wu et al.,
2017b) or (ii) the "translation quality is at human parity when compared to
professional human translators" (Hassan et al., 2018) have seen the light of
day (Laubli et al., 2018). Aside from the fact that many of these papers craft
their own definition of human parity, these sensational claims are often not
supported by a complete analysis of all aspects involved in translation.
Establishing the discrepancies between the strengths of statistical approaches
to MT and the way humans translate has been the starting point of our research.
By looking at MT output and linguistic theory, we were able to identify some
remaining issues. The problems range from simple number and gender agreement
errors to more complex phenomena such as the correct translation of aspectual
values and tenses. Our experiments confirm, along with other studies
(Bentivogli et al., 2016), that neural MT has surpassed statistical MT in many
aspects. However, some problems remain and others have emerged. We cover a
series of problems related to the integration of specific linguistic features
into statistical and neural MT, aiming to analyse and provide a solution to
some of them. Our work focuses on addressing three main research questions that
revolve around the complex relationship between linguistics and MT in general.
We identify linguistic information that is lacking in order for automatic
translation systems to produce more accurate translations and integrate
additional features into the existing pipelines. We identify overgeneralization
or 'algorithmic bias' as a potential drawback of neural MT and link it to many
of the remaining linguistic issues.
- Abstract(参考訳): 新しい機械翻訳(MT)技術は急速に発展し、それとともに、次のような大胆な主張がなされている。
(i)「平均的バイリンガル人訳者によって達成された正確性」(Wu et al., 2017b)又は
(ii)「翻訳の質は、専門家の翻訳者と比較して人間と同等である」(Hassan et al., 2018)は、日の光を見た(Laubli et al., 2018)。
これらの論文の多くは、人間のパリティの定義を独自に作っているが、これらのセンセーショナルな主張は翻訳に関わるすべての側面の完全な分析によっては支持されないことが多い。
MTに対する統計的アプローチの強みと人間が翻訳する方法の相違が、我々の研究の出発点となっている。
MTのアウトプットと言語理論を調べた結果,残りの課題が判明した。
問題は、単純な数と性別の一致誤差から、アスペクト値や時制の正しい翻訳のようなより複雑な現象まで様々である。
我々の実験は、他の研究(Bentivogli et al., 2016)とともに、多くの点で統計的MTを上回っていることを確認した。
しかし、問題がいくつか残っており、他の問題も発生している。
本稿では,特定の言語的特徴の統計的および神経的MTへの統合に関する一連の問題を取り上げ,その分析と解決を目的とした。
本研究は,言語学とmtの複雑な関係を中心に,3つの研究課題を提起する。
自動翻訳システムがより正確な翻訳を生成するために不足している言語情報を識別し、既存のパイプラインに機能を追加する。
我々は,神経mtの潜在的な欠点として,超一般化や「言語バイアス」を同定し,残りの言語問題と関連付ける。
関連論文リスト
- Thesis proposal: Are We Losing Textual Diversity to Natural Language Processing? [3.8073142980733]
ニューラルネットワーク翻訳で使用されるアルゴリズムは、ほとんどの入力タイプに有益であるが、非典型的テキストの処理に有害な帰納的バイアスを持つかどうかを問う。
我々は,NMTシステムがこのようなテキストの多様性を維持するのに苦戦しているかどうかを調べるために,一連の実験を行った。
我々の最終的な目標は、出力の統計特性の分布に一様性を課さない代替手段を開発することである。
論文 参考訳(メタデータ) (2024-09-15T01:06:07Z) - Predicting Human Translation Difficulty with Neural Machine Translation [30.036747251603668]
ニューラルネットワーク翻訳(NMT)モデルから得られた素因的特徴と注意的特徴が,人間の翻訳者の読解および生産時間に与える影響を評価する。
また,NMTモデルから得られた推定値が,生産期間の予測値として唯一成功したものであることも確認した。
論文 参考訳(メタデータ) (2023-12-19T04:42:56Z) - Distinguishing Translations by Human, NMT, and ChatGPT: A Linguistic and Statistical Approach [1.6982207802596105]
本研究では,(1)NMTとヒト翻訳(HT)からのChatGPT生成翻訳の識別可能性,(2)翻訳タイプの言語的特徴,(3)ChatGPT生成翻訳とHT,あるいはNMTとの類似度について検討する。
論文 参考訳(メタデータ) (2023-12-17T15:56:05Z) - Revisiting Machine Translation for Cross-lingual Classification [91.43729067874503]
この分野のほとんどの研究は、機械翻訳コンポーネントではなく多言語モデルに焦点を当てている。
より強力なMTシステムを用いて、原文のトレーニングと機械翻訳テキストの推論のミスマッチを緩和することにより、翻訳テストは以前想定していたよりも大幅に優れていることを示す。
論文 参考訳(メタデータ) (2023-05-23T16:56:10Z) - Mitigating Data Imbalance and Representation Degeneration in
Multilingual Machine Translation [103.90963418039473]
Bi-ACLは、MNMTモデルの性能を向上させるために、ターゲット側モノリンガルデータとバイリンガル辞書のみを使用するフレームワークである。
Bi-ACLは、長い尾の言語でも、高リソースの言語でも、より効果的であることを示す。
論文 参考訳(メタデータ) (2023-05-22T07:31:08Z) - The Best of Both Worlds: Combining Human and Machine Translations for
Multilingual Semantic Parsing with Active Learning [50.320178219081484]
人文翻訳と機械翻訳の両方の長所を生かした能動的学習手法を提案する。
理想的な発話選択は、翻訳されたデータの誤りとバイアスを著しく低減することができる。
論文 参考訳(メタデータ) (2023-05-22T05:57:47Z) - Discourse Centric Evaluation of Machine Translation with a Densely
Annotated Parallel Corpus [82.07304301996562]
本稿では,江らが導入した大規模並列コーパスBWBに基づいて,リッチな談話アノテーションを用いた新しいデータセットを提案する。
ソース言語とターゲット言語の談話構造と類似点と相違点について検討する。
我々はMT出力が人間の翻訳と基本的に異なることを発見した。
論文 参考訳(メタデータ) (2023-05-18T17:36:41Z) - Machine Translationese: Effects of Algorithmic Bias on Linguistic
Complexity in Machine Translation [2.0625936401496237]
我々は、機械翻訳におけるジェンダーの研究を超えて、偏見の増幅がより広い意味で言語に与える影響を調査する。
我々は、異なるデータ駆動MTパラダイムによって生成された翻訳の言語的豊かさ(語彙的および形態学的レベルで)を評価する。
論文 参考訳(メタデータ) (2021-01-30T18:49:11Z) - Decoding and Diversity in Machine Translation [90.33636694717954]
NMTが楽しむBLEUスコアに対して支払う費用の多様性の違いを特徴付ける。
本研究は,ジェンダー代名詞を翻訳する際に,検索が既知バイアスの正解源となることを示唆する。
論文 参考訳(メタデータ) (2020-11-26T21:09:38Z) - Towards Multimodal Simultaneous Neural Machine Translation [28.536262015508722]
同時翻訳では、リアルタイム理解を実現するために、話者の発話が完了する前に文章を翻訳する。
このタスクは、復号時に入力情報が不足しているため、一般的な全文翻訳よりもはるかに難しい。
視覚情報を付加的なモダリティとして活用するマルチモーダル同時ニューラルネットワーク翻訳(MSNMT)を提案する。
論文 参考訳(メタデータ) (2020-04-07T08:02:21Z) - Bootstrapping a Crosslingual Semantic Parser [74.99223099702157]
我々は、英語のような単一の言語で訓練された意味を、最小限のアノテーションで新しい言語や複数のドメインに適用する。
我々は、機械翻訳がトレーニングデータの適切な代用であるかどうかを問うとともに、英語、パラフレーズ、多言語事前学習モデルとの併用トレーニングを用いて、ブートストラップを調査するように拡張する。
論文 参考訳(メタデータ) (2020-04-06T12:05:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。