論文の概要: Intelligent Translation Memory Matching and Retrieval with Sentence
Encoders
- arxiv url: http://arxiv.org/abs/2004.12894v1
- Date: Mon, 27 Apr 2020 15:54:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-09 05:20:54.993274
- Title: Intelligent Translation Memory Matching and Retrieval with Sentence
Encoders
- Title(参考訳): 文エンコーダを用いたインテリジェント翻訳メモリマッチングと検索
- Authors: Tharindu Ranasinghe, Constantin Orasan, Ruslan Mitkov
- Abstract要約: 本稿では,翻訳記憶システムにおけるマッチングと検索のプロセスを改善するための文エンコーダを提案する。
我々は,編集距離に基づくアルゴリズムが翻訳記憶システムにおいて大きな欠点であることを確認した。
- 参考スコア(独自算出の注目度): 14.403165053223395
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Matching and retrieving previously translated segments from a Translation
Memory is the key functionality in Translation Memories systems. However this
matching and retrieving process is still limited to algorithms based on edit
distance which we have identified as a major drawback in Translation Memories
systems. In this paper we introduce sentence encoders to improve the matching
and retrieving process in Translation Memories systems - an effective and
efficient solution to replace edit distance based algorithms.
- Abstract(参考訳): 翻訳メモリからの予め翻訳されたセグメントのマッチングと検索は、翻訳メモリシステムにおいて重要な機能である。
しかし、このマッチングと検索のプロセスは、翻訳記憶システムにおける大きな欠点と認識された編集距離に基づくアルゴリズムに限定されている。
本稿では,文エンコーダを導入して,編集距離に基づくアルゴリズムを効率よく置き換える,翻訳記憶システムにおけるマッチングと検索のプロセスを改善する。
関連論文リスト
- Complexity of Symbolic Representation in Working Memory of Transformer Correlates with the Complexity of a Task [3.1331371767476366]
本稿では,Transformerモデルデコーダに付加されたシンボリックワーキングメモリの内容について検討する。
翻訳されたテキストキーワードはワーキングメモリに格納され、処理されたテキストに対するメモリ内容の関連性を示す。
メモリに格納されたトークンと音声の部分の多様性は、機械翻訳タスクのためのコーパスの複雑さと相関する。
論文 参考訳(メタデータ) (2024-06-20T11:27:29Z) - Optimizing example selection for retrieval-augmented machine translation with translation memories [9.67203800171351]
アップストリーム検索のステップを改善し、ダウンストリーム編集に基づく修正モデルを検討することを目的としている。
このタスクは、ソース文の全体カバレッジを最大化する一連の例を見つけることで構成される。
機械翻訳作業における結果のパフォーマンス向上を評価した。
論文 参考訳(メタデータ) (2024-05-23T21:42:03Z) - Dense X Retrieval: What Retrieval Granularity Should We Use? [56.90827473115201]
しばしば見過ごされる設計選択は、コーパスが索引付けされる検索単位である。
本稿では,高密度検索のための新しい検索ユニット,命題を提案する。
実験により、提案のような細粒度単位によるコーパスのインデックス付けは、検索タスクにおける通過レベル単位を著しく上回っていることが明らかとなった。
論文 参考訳(メタデータ) (2023-12-11T18:57:35Z) - NSOAMT -- New Search Only Approach to Machine Translation [0.0]
機械翻訳に対する新しい検索のみのアプローチ」が採用され、他の技術の遅さと不正確さに対処した。
この考え方は、特定の意味的意味を組み合わす単語のインクリメンタルな集合をインデクシングすることによって、ネイティブ言語レコードと翻訳言語との対応プロセスを作成することができるソリューションを開発することを目的としている。
論文 参考訳(メタデータ) (2023-09-19T11:12:21Z) - Implicit Memory Transformer for Computationally Efficient Simultaneous
Speech Translation [0.20305676256390928]
本稿では,新たな左コンテキスト手法により暗黙的にメモリを保持するImplicit Memory Transformerを提案する。
MuST-Cデータセットの実験では、Implicit Memory Transformerがエンコーダのフォワードパスにかなりのスピードアップを提供することが示された。
論文 参考訳(メタデータ) (2023-07-03T22:20:21Z) - Efficient Audio Captioning Transformer with Patchout and Text Guidance [74.59739661383726]
本稿では, [1] で提案した Patchout を利用したフルトランスフォーマーアーキテクチャを提案する。
キャプション生成は、事前訓練された分類モデルにより抽出されたテキストオーディオセットタグに部分的に条件付けされる。
提案手法は,DCASE Challenge 2022のタスク6Aで審査員賞を受賞している。
論文 参考訳(メタデータ) (2023-04-06T07:58:27Z) - ConTextual Mask Auto-Encoder for Dense Passage Retrieval [49.49460769701308]
CoT-MAEは,高密度経路抽出のための簡易かつ効果的な生成前訓練法である。
文のセマンティクスを高密度ベクトルに圧縮する学習は、自己教師付きおよび文脈教師付きマスキングによる自動エンコーディングによって行われる。
我々は,大規模経路探索ベンチマークの実験を行い,強力なベースラインよりも大幅に改善されたことを示す。
論文 参考訳(メタデータ) (2022-08-16T11:17:22Z) - Impact of Encoding and Segmentation Strategies on End-to-End
Simultaneous Speech Translation [17.78024523121448]
本稿では, 終末同時音声翻訳の2つの重要な側面として, 連続した音声の流れを効率よく符号化する方法と, 音声の流れをセグメント化する方法について検討する。
提案したエンド・ツー・エンドのオンラインデコーディング戦略を拡張し,MLSTMエンコーディングによるBLSTMの置き換えはオフラインモードで性能を劣化させるが,オンラインモードでの効率と性能を実際に向上させることを示す。
論文 参考訳(メタデータ) (2021-04-29T16:33:08Z) - Worse WER, but Better BLEU? Leveraging Word Embedding as Intermediate in
Multitask End-to-End Speech Translation [127.54315184545796]
音声翻訳(ST)は、ソース言語の音声からターゲット言語のテキストへの変換を学習することを目的としている。
単語埋め込みを中間語として活用することでマルチタスクSTモデルを改善することを提案する。
論文 参考訳(メタデータ) (2020-05-21T14:22:35Z) - Pairwise Supervised Hashing with Bernoulli Variational Auto-Encoder and
Self-Control Gradient Estimator [62.26981903551382]
バイナリ潜在変数を持つ変分自動エンコーダ(VAE)は、文書検索の精度の観点から最先端のパフォーマンスを提供する。
本稿では、クラス内類似度とクラス間類似度に報いるために、個別潜伏型VAEを用いたペアワイズ損失関数を提案する。
この新しいセマンティックハッシュフレームワークは、最先端技術よりも優れたパフォーマンスを実現する。
論文 参考訳(メタデータ) (2020-05-21T06:11:33Z) - IMRAM: Iterative Matching with Recurrent Attention Memory for
Cross-Modal Image-Text Retrieval [105.77562776008459]
既存の手法は、注意機構を利用して、そのような対応をきめ細かな方法で探索する。
既存の手法でこのような高度な対応を最適に捉えるのは難しいかもしれない。
本稿では,複数段階のアライメントで対応を捉えるIMRAM法を提案する。
論文 参考訳(メタデータ) (2020-03-08T12:24:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。