論文の概要: Modeling Target-side Inflection in Placeholder Translation
- arxiv url: http://arxiv.org/abs/2107.00334v1
- Date: Thu, 1 Jul 2021 09:54:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-02 20:02:17.817965
- Title: Modeling Target-side Inflection in Placeholder Translation
- Title(参考訳): プレースホルダー翻訳におけるターゲット側インフレクションのモデル化
- Authors: Ryokan Ri, Toshiaki Nakazawa and Yoshimasa Tsuruoka
- Abstract要約: プレースホルダー翻訳システムは、特定のフレーズが出力文でどのように翻訳されるかを指定することができる。
システムは特別なプレースホルダートークンを出力するように訓練され、ユーザ指定用語がプレースホルダートークンの文脈自由置換によって出力に注入される。
この手法は、翻訳前に未知の出力の文脈に従って特定の項を屈折させる必要がある場合が多いため、非文法的な文をもたらす可能性がある。
- 参考スコア(独自算出の注目度): 15.716533830931764
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Placeholder translation systems enable the users to specify how a specific
phrase is translated in the output sentence. The system is trained to output
special placeholder tokens, and the user-specified term is injected into the
output through the context-free replacement of the placeholder token. However,
this approach could result in ungrammatical sentences because it is often the
case that the specified term needs to be inflected according to the context of
the output, which is unknown before the translation. To address this problem,
we propose a novel method of placeholder translation that can inflect specified
terms according to the grammatical construction of the output sentence. We
extend the sequence-to-sequence architecture with a character-level decoder
that takes the lemma of a user-specified term and the words generated from the
word-level decoder to output the correct inflected form of the lemma. We
evaluate our approach with a Japanese-to-English translation task in the
scientific writing domain, and show that our model can incorporate specified
terms in the correct form more successfully than other comparable models.
- Abstract(参考訳): プレースホルダー翻訳システムは、特定のフレーズが出力文でどのように翻訳されるかを指定することができる。
システムは特別なプレースホルダートークンを出力するように訓練され、ユーザ指定用語がプレースホルダートークンの文脈自由置換によって出力に注入される。
しかし、この手法は、翻訳前に未知の出力の文脈に従って特定の項を屈折させる必要がある場合が多いため、非文法的な文をもたらす可能性がある。
この問題に対処するために,出力文の文法的構成に応じて特定の単語を入力できる新しいプレースホルダー翻訳法を提案する。
ユーザが指定した単語の補題と単語レベルのデコーダから生成された単語を取り込んで正しい補題の屈折形を出力する文字レベルデコーダを用いてシーケンスツーシーケンスアーキテクチャを拡張する。
本手法は,日本語から英語への翻訳タスクを科学書体領域で評価し,他の同等のモデルよりも適切な形式に特定の用語を組み込むことができることを示した。
関連論文リスト
- Attributable and Scalable Opinion Summarization [79.87892048285819]
我々は、頻繁なエンコーディングを復号することで抽象的な要約を生成し、同じ頻繁なエンコーディングに割り当てられた文を選択して抽出的な要約を生成する。
本手法は,要約プロセスの一部として要約を生成するために使用される文を同定するため,帰属的手法である。
なぜなら、アグリゲーションはトークンの長いシーケンスではなく、潜在空間で実行されるからである。
論文 参考訳(メタデータ) (2023-05-19T11:30:37Z) - Encoding Sentence Position in Context-Aware Neural Machine Translation
with Concatenation [25.9276959748365]
コンテクスト対応翻訳は、連続した文と標準のTransformerアーキテクチャとの結合を処理することで実現できる。
本稿では,連結ウィンドウに含まれる文の位置に関する明示的な情報をモデルに提供するという直感的な考え方について検討する。
論文 参考訳(メタデータ) (2023-02-13T15:39:08Z) - Principled Paraphrase Generation with Parallel Corpora [52.78059089341062]
ラウンドトリップ機械翻訳によって引き起こされる暗黙の類似性関数を形式化する。
一つのあいまいな翻訳を共有する非パラフレーズ対に感受性があることが示される。
この問題を緩和する別の類似度指標を設計する。
論文 参考訳(メタデータ) (2022-05-24T17:22:42Z) - Example-Based Machine Translation from Text to a Hierarchical
Representation of Sign Language [1.3999481573773074]
本稿では,テキスト・トゥ・サイン翻訳の原本について述べる。
これは、AZeeにおける手話ビデオのテキストと階層的な形式記述の間のアライメントのドメイン固有の並列コーパスを使用して、データの不足を補う。
提案アルゴリズムは、ソーステキストに存在する類似性の検出に基づいて、整列セグメントのマッチングと置換を利用して、複数の候補翻訳を構築する。
結果として得られる翻訳は、アバターシステムへの入力として使用されるように設計されたAZee式(英語版)の形式である。
論文 参考訳(メタデータ) (2022-05-06T15:48:43Z) - Probing for the Usage of Grammatical Number [103.8175326220026]
私たちは、モデルが実際に使用しているエンコーディングを見つけようと試み、使用量ベースの探索設定を導入しました。
BERTの文法的数値のエンコード方法と,このエンコーディングを用いて数値合意課題を解決する方法に焦点をあてる。
論文 参考訳(メタデータ) (2022-04-19T11:59:52Z) - As Little as Possible, as Much as Necessary: Detecting Over- and
Undertranslations with Contrastive Conditioning [42.46681912294797]
本稿では,ニューラルマシン翻訳における過剰な単語の検出手法を提案する。
我々は,翻訳モデルに基づく全列の確率と,対応するソースやターゲットシーケンスを考慮に入れた部分の確率を比較する。
これにより、参照翻訳がなくても、翻訳中の過剰な単語とソース内の未翻訳の単語をピンポイントで特定することができる。
論文 参考訳(メタデータ) (2022-03-03T18:59:02Z) - End-to-End Lexically Constrained Machine Translation for Morphologically
Rich Languages [0.0]
本研究は, 機械翻訳による単語の正しいインフレクションを許容する機構について検討する。
英語とチェコ語のペアを用いた実験により, 自動評価と手動評価の両方において, 制約付き単語の翻訳が改良されることが示唆された。
論文 参考訳(メタデータ) (2021-06-23T13:40:13Z) - 2kenize: Tying Subword Sequences for Chinese Script Conversion [54.33749520569979]
本稿では,2つのスクリプト間のマッピングと変換をあいまいにできるモデルを提案する。
提案手法は,従来の漢字変換手法よりも精度が6ポイント向上した。
論文 参考訳(メタデータ) (2020-05-07T10:53:05Z) - Exploring Contextual Word-level Style Relevance for Unsupervised Style
Transfer [60.07283363509065]
教師なしのスタイル転送は、元のコンテンツを保持しながら入力文のスタイルを変更することを目的としている。
本稿では,各出力語がターゲットスタイルに関連性があることを活かした,新たな注目シーケンス・ツー・シーケンスモデルを提案する。
実験結果から,提案手法は転送精度とコンテンツ保存の両面から,最先端の性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2020-05-05T10:24:28Z) - Neural Syntactic Preordering for Controlled Paraphrase Generation [57.5316011554622]
私たちの研究は、構文変換を使用して、ソース文をソフトに"リオーダー"し、神経パラフレージングモデルをガイドします。
まず、入力文が与えられた場合、エンコーダ・デコーダモデルを用いて、実行可能な構文再構成のセットを導出する。
次に、提案した各再構成を用いて位置埋め込みのシーケンスを生成し、最終的なエンコーダ-デコーダパラフレーズモデルが特定の順序でソース語に従属することを奨励する。
論文 参考訳(メタデータ) (2020-05-05T09:02:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。