論文の概要: That was the last straw, we need more: Are Translation Systems Sensitive
to Disambiguating Context?
- arxiv url: http://arxiv.org/abs/2310.14610v1
- Date: Mon, 23 Oct 2023 06:38:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-24 22:09:58.696817
- Title: That was the last straw, we need more: Are Translation Systems Sensitive
to Disambiguating Context?
- Title(参考訳): 翻訳システムはコンテキストの曖昧さに敏感か?
- Authors: Jaechan Lee, Alisa Liu, Orevaoghene Ahia, Hila Gonen, Noah A. Smith
- Abstract要約: 我々は、源泉に存在している意味的あいまいさ(本研究における英語)について研究する。
我々は、リテラルと図形の両方にオープンなイディオムに焦点を当てている。
現在のMTモデルは、たとえ文脈が比喩的解釈を示しているとしても、英語のイディオムを文字通りに翻訳する。
- 参考スコア(独自算出の注目度): 64.38544995251642
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The translation of ambiguous text presents a challenge for translation
systems, as it requires using the surrounding context to disambiguate the
intended meaning as much as possible. While prior work has studied ambiguities
that result from different grammatical features of the source and target
language, we study semantic ambiguities that exist in the source (English in
this work) itself. In particular, we focus on idioms that are open to both
literal and figurative interpretations (e.g., goose egg), and collect TIDE, a
dataset of 512 pairs of English sentences containing idioms with disambiguating
context such that one is literal (it laid a goose egg) and another is
figurative (they scored a goose egg, as in a score of zero). In experiments, we
compare MT-specific models and language models for (i) their preference when
given an ambiguous subsentence, (ii) their sensitivity to disambiguating
context, and (iii) the performance disparity between figurative and literal
source sentences. We find that current MT models consistently translate English
idioms literally, even when the context suggests a figurative interpretation.
On the other hand, LMs are far more context-aware, although there remain
disparities across target languages. Our findings underline the potential of
LMs as a strong backbone for context-aware translation.
- Abstract(参考訳): 曖昧なテキストの翻訳は、意図された意味をできるだけ曖昧にするために周囲の文脈を使う必要があるため、翻訳システムにとって困難である。
先行研究は、ソース言語とターゲット言語の文法的特徴から生じる曖昧さを研究してきたが、ソース自体に存在する意味的曖昧さについて研究している。
特に、リテラルとフィギュラティブな解釈(ガチョウ卵など)の両方にオープンなイディオムに注目し、リテラル(ガチョウ卵を産む)とフィギュラティブ(ガチョウ卵をスコア0のように得点する)という曖昧な文脈でイディオムを含む512対の英語文のデータセットであるTIDEを収集する。
実験では,MT特化モデルと言語モデルの比較を行った。
(i)あいまいな文が与えられたときの好み
(二)曖昧な文脈に対する感受性、及び
(iii)形容詞とリテラル語源文のパフォーマンス格差。
現在のmtモデルでは常に英語のイディオムを文字通り翻訳していることがわかった。
一方、lmsは、ターゲット言語間の差異はあるものの、はるかにコンテキスト対応である。
本研究は,文脈認識翻訳のバックボーンとしてのlmsの可能性を示す。
関連論文リスト
- Crossing the Threshold: Idiomatic Machine Translation through Retrieval
Augmentation and Loss Weighting [66.02718577386426]
慣用的な翻訳と関連する問題を簡易に評価する。
我々は,変圧器をベースとした機械翻訳モデルが慣用的な翻訳に対して正しくデフォルトとなる点を明らかにするための合成実験を行った。
自然慣用句の翻訳を改善するために, 単純かつ効果的な2つの手法を導入する。
論文 参考訳(メタデータ) (2023-10-10T23:47:25Z) - Can Transformer be Too Compositional? Analysing Idiom Processing in
Neural Machine Translation [55.52888815590317]
リテラル表現とは異なり、イディオムの意味はその部分から直接従わない。
NMTモデルは、しばしばイディオムを正確に、過剰に生成し、文字通り翻訳することができない。
支配的なNMTモデルであるTransformerの力学において,イディオムの非合成性が反映されているかを検討する。
論文 参考訳(メタデータ) (2022-05-30T17:59:32Z) - Semantically Informed Slang Interpretation [2.9097456604613745]
本稿では,クエリスラングに対する候補解釈の文脈的,意味的適切性を考慮した意味情報付きスラング解釈(SSI)フレームワークを提案する。
我々は、スラングの機械翻訳を英語から他の言語に拡張するために、同じフレームワークをいかに適用できるかを示す。
論文 参考訳(メタデータ) (2022-05-02T01:51:49Z) - It's not Rocket Science : Interpreting Figurative Language in Narratives [48.84507467131819]
我々は2つの非構成的図形言語(イディオムとシミュラ)の解釈を研究する。
実験の結果、事前学習された言語モデルのみに基づくモデルは、これらのタスクにおいて人間よりもはるかにひどい性能を示すことがわかった。
また, 知識強化モデルを提案し, 具体的言語を解釈するための人的戦略を採用した。
論文 参考訳(メタデータ) (2021-08-31T21:46:35Z) - Do Context-Aware Translation Models Pay the Right Attention? [61.25804242929533]
コンテキスト対応機械翻訳モデルは文脈情報を活用するように設計されているが、しばしば失敗する。
本稿では,人間の翻訳者が曖昧な単語を解くために使用する文脈について述べる。
SCAT(Supporting Context for Ambiguous Translations)は、14K翻訳のコンテキストワードをサポートする新しい英仏データセットです。
SCATを用いて,支援語の位置的特徴と語彙的特徴をあいまいにするために使用される文脈を詳細に分析する。
論文 参考訳(メタデータ) (2021-05-14T17:32:24Z) - Speakers Fill Lexical Semantic Gaps with Context [65.08205006886591]
我々は単語の語彙的あいまいさを意味のエントロピーとして運用する。
単語のあいまいさの推定値と,WordNetにおける単語の同義語数との間には,有意な相関関係が認められた。
これは、あいまいさの存在下では、話者が文脈をより情報的にすることで補うことを示唆している。
論文 参考訳(メタデータ) (2020-10-05T17:19:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。