論文の概要: On the Influence of Machine Translation on Language Origin Obfuscation
- arxiv url: http://arxiv.org/abs/2106.12830v1
- Date: Thu, 24 Jun 2021 08:33:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-26 02:37:23.500877
- Title: On the Influence of Machine Translation on Language Origin Obfuscation
- Title(参考訳): 機械翻訳が言語起源の難読化に及ぼす影響について
- Authors: Benjamin Murauer, Michael Tschuggnall, G\"unther Specht
- Abstract要約: 本稿では、広く使われている2つの商用機械翻訳システムの翻訳結果から、ソースコードを検出する能力について分析する。
評価の結果,十分な量の翻訳文を含む文書に対して,ソースコードを高精度に再構築できることが示唆された。
- 参考スコア(独自算出の注目度): 0.3437656066916039
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: In the last decade, machine translation has become a popular means to deal
with multilingual digital content. By providing higher quality translations,
obfuscating the source language of a text becomes more attractive. In this
paper, we analyze the ability to detect the source language from the translated
output of two widely used commercial machine translation systems by utilizing
machine-learning algorithms with basic textual features like n-grams.
Evaluations show that the source language can be reconstructed with high
accuracy for documents that contain a sufficient amount of translated text. In
addition, we analyze how the document size influences the performance of the
prediction, as well as how limiting the set of possible source languages
improves the classification accuracy.
- Abstract(参考訳): 過去10年間、機械翻訳は多言語デジタルコンテンツを扱う手段として人気を高めてきた。
高品質な翻訳を提供することで、テキストのソース言語を難読化することがより魅力的になる。
本稿では,n-gramsのような基本的なテキスト特徴を持つ機械学習アルゴリズムを用いて,2つの商用機械翻訳システムの翻訳出力からソース言語を検出する能力を分析する。
十分な量の翻訳文を含む文書に対して,ソースコードを高精度に再構築できることを示す。
さらに,文書サイズが予測性能にどのように影響するかを解析し,可能なソース言語のセットを制限することで,分類精度が向上することを示した。
関連論文リスト
- Improving Multilingual Neural Machine Translation by Utilizing Semantic and Linguistic Features [18.76505158652759]
複数の言語間の意味的特徴と言語的特徴を利用して多言語翻訳を強化することを提案する。
エンコーダ側では,意味的特徴と言語的特徴を両立させることにより,エンコーダ表現を整合させる非係合学習タスクを導入する。
デコーダ側では、言語エンコーダを利用して低レベル言語機能を統合し、ターゲット言語生成を支援する。
論文 参考訳(メタデータ) (2024-08-02T17:10:12Z) - Towards a Deep Understanding of Multilingual End-to-End Speech
Translation [52.26739715012842]
我々は22言語以上で訓練された多言語エンドツーエンド音声翻訳モデルで学習した表現を解析する。
我々は分析から3つの大きな発見を得た。
論文 参考訳(メタデータ) (2023-10-31T13:50:55Z) - NSOAMT -- New Search Only Approach to Machine Translation [0.0]
機械翻訳に対する新しい検索のみのアプローチ」が採用され、他の技術の遅さと不正確さに対処した。
この考え方は、特定の意味的意味を組み合わす単語のインクリメンタルな集合をインデクシングすることによって、ネイティブ言語レコードと翻訳言語との対応プロセスを作成することができるソリューションを開発することを目的としている。
論文 参考訳(メタデータ) (2023-09-19T11:12:21Z) - T3L: Translate-and-Test Transfer Learning for Cross-Lingual Text
Classification [50.675552118811]
言語間テキスト分類は通常、様々な言語で事前訓練された大規模多言語言語モデル(LM)に基づいて構築される。
本稿では,古典的な「翻訳とテスト」パイプラインを再考し,翻訳と分類の段階を適切に分離することを提案する。
論文 参考訳(メタデータ) (2023-06-08T07:33:22Z) - Exploring Human-Like Translation Strategy with Large Language Models [93.49333173279508]
大規模言語モデル(LLM)は、一般的なシナリオにおいて印象的な機能を示している。
本研究は,マルチアスペクト・プロンプトと選択のためのMAPSフレームワークを提案する。
品質推定に基づく選択機構を用いて,ノイズや不ヘッピーな知識を抽出する。
論文 参考訳(メタデータ) (2023-05-06T19:03:12Z) - Machine Translation for Accessible Multi-Language Text Analysis [1.5484595752241124]
英語への翻訳後に計算した英語学習尺度の精度が十分であることを示す。
これは、感情分析、トピック分析、単語の埋め込みという3つの主要な分析で、16以上の言語で示します。
論文 参考訳(メタデータ) (2023-01-20T04:11:38Z) - Informative Language Representation Learning for Massively Multilingual
Neural Machine Translation [47.19129812325682]
多言語ニューラルマシン翻訳モデルでは、通常、人工言語トークンを使用して、所望のターゲット言語への翻訳をガイドする。
近年の研究では、先行する言語トークンは、多言語ニューラルマシン翻訳モデルから正しい翻訳方向へのナビゲートに失敗することがある。
本稿では,言語埋め込み型エンボディメントと言語認識型マルチヘッドアテンションという2つの手法を提案する。
論文 参考訳(メタデータ) (2022-09-04T04:27:17Z) - DEEP: DEnoising Entity Pre-training for Neural Machine Translation [123.6686940355937]
機械翻訳モデルは通常、トレーニングコーパスで稀な名前付きエンティティの翻訳を貧弱に生成することが示されている。
文中の名前付きエンティティ翻訳精度を向上させるために,大量のモノリンガルデータと知識ベースを利用するDenoising Entity Pre-training法であるDEEPを提案する。
論文 参考訳(メタデータ) (2021-11-14T17:28:09Z) - A Survey of Orthographic Information in Machine Translation [1.2124289787900182]
我々は, アンダーリソース言語における機械翻訳を改善するために, 正書法情報をどのように利用できるかを示す。
本稿では,機械翻訳のさまざまなタイプについて論じるとともに,正書法と機械翻訳手法の整合性を示す最近の傾向を示す。
論文 参考訳(メタデータ) (2020-08-04T07:59:02Z) - Translation Artifacts in Cross-lingual Transfer Learning [51.66536640084888]
機械翻訳は、既存の言語間モデルに顕著な影響を与える微妙なアーティファクトを導入することができることを示す。
自然言語の推論では、前提と仮説を独立に翻訳することで、それらの間の語彙的重複を減らすことができる。
また、XNLIでは、それぞれ4.3点と2.8点の翻訳とゼロショットのアプローチを改善している。
論文 参考訳(メタデータ) (2020-04-09T17:54:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。