論文の概要: Bridging Background Knowledge Gaps in Translation with Automatic
Explicitation
- arxiv url: http://arxiv.org/abs/2312.01308v1
- Date: Sun, 3 Dec 2023 07:24:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-05 18:09:44.861560
- Title: Bridging Background Knowledge Gaps in Translation with Automatic
Explicitation
- Title(参考訳): 自動明示による翻訳における背景知識ギャップの橋渡し
- Authors: HyoJung Han, Jordan Lee Boyd-Graber, Marine Carpuat
- Abstract要約: 専門家の翻訳者は、欠落した状況を説明するために明示を取り入れている。
本研究はWikiExplによって動機付けられた明示を自動生成する技術を紹介する。
結果の明示は、多言語質問応答フレームワークにおいて、より正確に質問に答えるのに役立つ。
- 参考スコア(独自算出の注目度): 13.862753200823242
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Translations help people understand content written in another language.
However, even correct literal translations do not fulfill that goal when people
lack the necessary background to understand them. Professional translators
incorporate explicitations to explain the missing context by considering
cultural differences between source and target audiences. Despite its potential
to help users, NLP research on explicitation is limited because of the dearth
of adequate evaluation methods. This work introduces techniques for
automatically generating explicitations, motivated by WikiExpl: a dataset that
we collect from Wikipedia and annotate with human translators. The resulting
explicitations are useful as they help answer questions more accurately in a
multilingual question answering framework.
- Abstract(参考訳): 翻訳は、他の言語で書かれたコンテンツを理解するのに役立つ。
しかし、正しいリテラル翻訳でさえ、人々が理解するために必要な背景が欠けている場合には、その目標を達成できない。
プロの翻訳者は、ソースとターゲットのオーディエンス間の文化的差異を考慮し、欠落したコンテキストを説明するために明示を取り入れている。
ユーザを支援する可能性にもかかわらず、適切な評価方法の欠如により、NLPによる明示化の研究は限られている。
WikiExplは、ウィキペディアから収集し、人間の翻訳者と注釈を付けるデータセットである。
結果の明示は、多言語質問応答フレームワークにおいて、より正確に質問に答えるのに役立つ。
関連論文リスト
- Evaluating LLMs for Targeted Concept Simplification for Domain-Specific Texts [53.421616210871704]
コンテクストの欠如と難解な概念に対する不慣れさは、大人の読者がドメイン固有のテキストに難渋する大きな理由である。
テキストの書き直しを簡略化し,不慣れな概念を含むテキストの理解を支援する「目標概念の簡略化」を提案する。
本研究は,オープンソースおよび商用LLMの性能と,この課題に対する簡単な辞書ベースラインのベンチマークを行う。
論文 参考訳(メタデータ) (2024-10-28T05:56:51Z) - Aligning Translation-Specific Understanding to General Understanding in Large Language Models [32.0119328710383]
大規模言語モデル(LLM)は、複雑なテキストを理解する際、顕著な能力を示した。
本研究は,LLMにおける翻訳固有の理解と一般理解の相違を明らかにする。
本稿では, 難解な翻訳過程である DUAT (Difficult words Understanding Aligned Translation) を提案する。
論文 参考訳(メタデータ) (2024-01-10T11:03:53Z) - Crossing the Threshold: Idiomatic Machine Translation through Retrieval
Augmentation and Loss Weighting [66.02718577386426]
慣用的な翻訳と関連する問題を簡易に評価する。
我々は,変圧器をベースとした機械翻訳モデルが慣用的な翻訳に対して正しくデフォルトとなる点を明らかにするための合成実験を行った。
自然慣用句の翻訳を改善するために, 単純かつ効果的な2つの手法を導入する。
論文 参考訳(メタデータ) (2023-10-10T23:47:25Z) - Audience-specific Explanations for Machine Translation [17.166908218991225]
機械翻訳において一般的な問題は、翻訳しても特定の単語の翻訳が、異なる文化的背景から対象言語オーディエンスの理解を損なう可能性があることである。
本研究では,並列コーパスからサンプル説明を抽出する手法について検討する。
大規模並列コーパスからこれらの説明を抽出する半自動手法を提案する。
論文 参考訳(メタデータ) (2023-09-22T17:00:45Z) - X-PARADE: Cross-Lingual Textual Entailment and Information Divergence across Paragraphs [55.80189506270598]
X-PARADEは、段落レベルの情報の分岐の最初の言語間データセットである。
アノテーションは、対象言語における段落をスパンレベルでラベル付けし、ソース言語における対応する段落に対して評価する。
アライメントされた段落は、異なる言語のウィキペディアページから引用される。
論文 参考訳(メタデータ) (2023-09-16T04:34:55Z) - The Best of Both Worlds: Combining Human and Machine Translations for
Multilingual Semantic Parsing with Active Learning [50.320178219081484]
人文翻訳と機械翻訳の両方の長所を生かした能動的学習手法を提案する。
理想的な発話選択は、翻訳されたデータの誤りとバイアスを著しく低減することができる。
論文 参考訳(メタデータ) (2023-05-22T05:57:47Z) - Interactive-Chain-Prompting: Ambiguity Resolution for Crosslingual
Conditional Generation with Interaction [38.73550742775257]
ある言語のソースクエリは、追加のコンテキストなしで、別の言語でいくつかの翻訳オプションを生成することができる。
あいまいさに対処するサブプロブレムのリストに変換を還元する対話型チェーンプロンプトを提案する。
異なる言語現象を示すデータセットを作成し、4つの言語の推論におけるあいまいさを導く。
論文 参考訳(メタデータ) (2023-01-24T21:08:13Z) - Human Interpretation of Saliency-based Explanation Over Text [65.29015910991261]
テキストデータ上でのサリエンシに基づく説明について検討する。
人はしばしば説明を誤って解釈する。
本稿では,過度知覚と過小認識のモデル推定に基づいて,サリエンシを調整する手法を提案する。
論文 参考訳(メタデータ) (2022-01-27T15:20:32Z) - Prosody-Aware Neural Machine Translation for Dubbing [9.49303003480503]
本稿では, ダビングに適した翻訳文を生成することを目的とした韻律対応機械翻訳の課題について紹介する。
音声文のダビングには、タイミング情報を保持するために、ソースの韻律構造だけでなく、コンテンツも対象言語に転送する必要がある。
本稿では,ニューラルマシン翻訳に韻律情報を統合する暗黙的かつ明示的なモデリング手法を提案する。
論文 参考訳(メタデータ) (2021-12-16T01:11:08Z) - Do Context-Aware Translation Models Pay the Right Attention? [61.25804242929533]
コンテキスト対応機械翻訳モデルは文脈情報を活用するように設計されているが、しばしば失敗する。
本稿では,人間の翻訳者が曖昧な単語を解くために使用する文脈について述べる。
SCAT(Supporting Context for Ambiguous Translations)は、14K翻訳のコンテキストワードをサポートする新しい英仏データセットです。
SCATを用いて,支援語の位置的特徴と語彙的特徴をあいまいにするために使用される文脈を詳細に分析する。
論文 参考訳(メタデータ) (2021-05-14T17:32:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。