論文の概要: A Prompt Response to the Demand for Automatic Gender-Neutral Translation
- arxiv url: http://arxiv.org/abs/2402.06041v1
- Date: Thu, 8 Feb 2024 20:24:44 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-12 18:40:33.853895
- Title: A Prompt Response to the Demand for Automatic Gender-Neutral Translation
- Title(参考訳): ジェンダーニュートラル自動翻訳の需要に対する応答
- Authors: Beatrice Savoldi and Andrea Piergentili and Dennis Fucci and Matteo
Negri and Luisa Bentivogli
- Abstract要約: バイアスや冗長な二項仮定を避けるジェンダーニュートラル翻訳(GNT)は、より包括的な翻訳技術を作成する上で重要な課題である。
機械翻訳(MT)におけるこのタスクの進歩は、専用並列データの欠如によって妨げられている。
- 参考スコア(独自算出の注目度): 15.388894407006852
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Gender-neutral translation (GNT) that avoids biased and undue binary
assumptions is a pivotal challenge for the creation of more inclusive
translation technologies. Advancements for this task in Machine Translation
(MT), however, are hindered by the lack of dedicated parallel data, which are
necessary to adapt MT systems to satisfy neutral constraints. For such a
scenario, large language models offer hitherto unforeseen possibilities, as
they come with the distinct advantage of being versatile in various (sub)tasks
when provided with explicit instructions. In this paper, we explore this
potential to automate GNT by comparing MT with the popular GPT-4 model. Through
extensive manual analyses, our study empirically reveals the inherent
limitations of current MT systems in generating GNTs and provides valuable
insights into the potential and challenges associated with prompting for
neutrality.
- Abstract(参考訳): バイアスや冗長な二項仮定を避けるジェンダーニュートラル翻訳(GNT)は、より包括的な翻訳技術を作成する上で重要な課題である。
しかし、機械翻訳(MT)におけるこの課題の進展は、中立的な制約を満たすためにMTシステムを適用するために必要な専用並列データ不足によって妨げられている。
このようなシナリオのために、大きな言語モデルでは、明示的な命令が与えられた場合、様々な(サブ)タスクで多用できるという明確な利点があるため、予期せぬ可能性を秘めている。
本稿では,MTと一般的なGPT-4モデルを比較することで,GNTの自動化の可能性を検討する。
本研究は, GNTの生成における現在のMTシステム固有の限界を実証的に明らかにし, 中立性の促進に関連する可能性や課題について貴重な知見を提供する。
関連論文リスト
- Thesis proposal: Are We Losing Textual Diversity to Natural Language Processing? [3.8073142980733]
ニューラルネットワーク翻訳で使用されるアルゴリズムは、ほとんどの入力タイプに有益であるが、非典型的テキストの処理に有害な帰納的バイアスを持つかどうかを問う。
我々は,NMTシステムがこのようなテキストの多様性を維持するのに苦戦しているかどうかを調べるために,一連の実験を行った。
我々の最終的な目標は、出力の統計特性の分布に一様性を課さない代替手段を開発することである。
論文 参考訳(メタデータ) (2024-09-15T01:06:07Z) - OTTAWA: Optimal TransporT Adaptive Word Aligner for Hallucination and Omission Translation Errors Detection [36.59354124910338]
オタワ(Ottawa)は、機械翻訳システムにおける幻覚や失語の検出を強化するために特別に設計された単語整合器である。
提案手法は,HalOmiベンチマークを用いた18言語対の最先端手法と比較して,競争力のある結果が得られる。
論文 参考訳(メタデータ) (2024-06-04T03:00:55Z) - Improving Machine Translation with Large Language Models: A Preliminary Study with Cooperative Decoding [73.32763904267186]
大きな言語モデル(LLM)は、優れた翻訳品質を達成する可能性を示す。
我々は,NMTシステムを事前翻訳モデルとして扱うCooperative Decoding(CoDec)と,MT指向LLMを補足解として提案する。
論文 参考訳(メタデータ) (2023-11-06T03:41:57Z) - Towards Effective Disambiguation for Machine Translation with Large
Language Models [65.80775710657672]
我々は「あいまいな文」を翻訳する大規模言語モデルの能力について研究する。
実験の結果,提案手法はDeepLやNLLBといった最先端システムと5つの言語方向のうち4つで一致し,性能を向上できることがわかった。
論文 参考訳(メタデータ) (2023-09-20T22:22:52Z) - Translation-Enhanced Multilingual Text-to-Image Generation [61.41730893884428]
テキスト・ツー・イメージ・ジェネレーション(TTI)の研究は、現在でも主に英語に焦点を当てている。
そこで本研究では,多言語TTIとニューラルマシン翻訳(NMT)のブートストラップmTTIシステムへの応用について検討する。
我々は,mTTIフレームワーク内で多言語テキスト知識を重み付け,統合する新しいパラメータ効率アプローチであるEnsemble Adapter (EnsAd)を提案する。
論文 参考訳(メタデータ) (2023-05-30T17:03:52Z) - Perturbation-based QE: An Explainable, Unsupervised Word-level Quality
Estimation Method for Blackbox Machine Translation [12.376309678270275]
摂動に基づくQEは、単に摂動入力元文上で出力されるMTシステムを分析することで機能する。
我々のアプローチは、教師付きQEよりも、翻訳における性別バイアスや単語センスの曖昧さの誤りを検出するのに優れている。
論文 参考訳(メタデータ) (2023-05-12T13:10:57Z) - Tackling Ambiguity with Images: Improved Multimodal Machine Translation
and Contrastive Evaluation [72.6667341525552]
本稿では,ニューラルアダプターとガイド付き自己注意機構を用いた,強いテキストのみのMTモデルに基づく新しいMT手法を提案する。
また,不明瞭な文とその翻訳が可能なコントラスト型多モーダル翻訳評価セットであるCoMMuTEについても紹介する。
提案手法は, 標準英語-フランス語, 英語-ドイツ語, 英語-チェコ語のベンチマークにおいて, 強いテキストのみのモデルと比較して, 競争力のある結果が得られる。
論文 参考訳(メタデータ) (2022-12-20T10:18:18Z) - HilMeMe: A Human-in-the-Loop Machine Translation Evaluation Metric
Looking into Multi-Word Expressions [6.85316573653194]
言語的に動機づけたHuman-in-the-loop評価尺度の設計と実装について,慣用的および用語的マルチワード表現(MWEs)について述べる。
MWEは、MWEを正確で意味のある等価な方法で認識・翻訳する能力を調べることで、異なるMTシステムを区別する主要な要因の1つである。
論文 参考訳(メタデータ) (2022-11-09T21:15:40Z) - When Does Translation Require Context? A Data-driven, Multilingual
Exploration [71.43817945875433]
談話の適切な処理は機械翻訳(MT)の品質に大きく貢献する
文脈認識型MTにおける最近の研究は、評価中に少量の談話現象を標的にしようとしている。
談話現象のモデル性能を識別・評価するタグの集合である,多言語談話認識ベンチマークを開発した。
論文 参考訳(メタデータ) (2021-09-15T17:29:30Z) - PheMT: A Phenomenon-wise Dataset for Machine Translation Robustness on
User-Generated Contents [40.25277134147149]
日本語翻訳における特定の言語現象に対するMTシステムの堅牢性を評価するための新しいデータセットであるPheMTを提案する。
作成したデータセットを用いて行った実験では、社内モデルだけでなく、市販のシステムでも、特定の現象の存在によって大きく混乱していることが明らかになりました。
論文 参考訳(メタデータ) (2020-11-04T04:44:47Z) - Neural Machine Translation: Challenges, Progress and Future [62.75523637241876]
機械翻訳(英: Machine translation, MT)は、コンピュータを利用して人間の言語を自動翻訳する技術である。
ニューラルマシン翻訳(NMT)は、ディープニューラルネットワークを用いたソース言語とターゲット言語間の直接マッピングをモデル化する。
この記事では、NMTフレームワークをレビューし、NMTの課題について論じ、最近のエキサイティングな進歩を紹介します。
論文 参考訳(メタデータ) (2020-04-13T07:53:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。