Fugu-MT 論文翻訳(概要): Incorporate Semantic Structures into Machine Translation Evaluation via UCCA

論文の概要: Incorporate Semantic Structures into Machine Translation Evaluation via UCCA

arxiv url: http://arxiv.org/abs/2010.08728v2
Date: Thu, 22 Oct 2020 03:38:19 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-06 11:47:49.064439
Title: Incorporate Semantic Structures into Machine Translation Evaluation via UCCA
Title（参考訳）: UCCAによる機械翻訳評価への意味構造の導入
Authors: Jin Xu, Yinuo Guo, Junfeng Hu
Abstract要約: 文中の重要な意味を持つ単語を意味的中核語と定義する。意味的重み付き文類似性(SWSS)というMT評価手法を提案する。
参考スコア（独自算出の注目度）: 9.064153799336536
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Copying mechanism has been commonly used in neural paraphrasing networks and other text generation tasks, in which some important words in the input sequence are preserved in the output sequence. Similarly, in machine translation, we notice that there are certain words or phrases appearing in all good translations of one source text, and these words tend to convey important semantic information. Therefore, in this work, we define words carrying important semantic meanings in sentences as semantic core words. Moreover, we propose an MT evaluation approach named Semantically Weighted Sentence Similarity (SWSS). It leverages the power of UCCA to identify semantic core words, and then calculates sentence similarity scores on the overlap of semantic core words. Experimental results show that SWSS can consistently improve the performance of popular MT evaluation metrics which are based on lexical similarity.
Abstract（参考訳）: コピー機構はニューラルパラフレーズネットワークやその他のテキスト生成タスクでよく使われており、入力シーケンスのいくつかの重要な単語が出力シーケンスに保存されている。同様に、機械翻訳では、あるソーステキストのすべての良い翻訳に特定の単語やフレーズが現れることに気づき、これらの単語は重要な意味情報を伝達する傾向にある。そこで本研究では,文中の重要な意味を持つ単語を意味コア語として定義する。さらに,意味的重み付き文類似性(SWSS)というMT評価手法を提案する。 UCCAの力を利用してセマンティックコアワードを識別し、セマンティックコアワードの重複に基づいて文類似度スコアを算出する。実験の結果,SWSS は語彙的類似性に基づく一般的な MT 評価指標の性能を一貫して改善できることがわかった。

関連論文リスト

Evaluating the impact of word embeddings on similarity scoring in practical information retrieval [0.5872014229110214]
ベクトル空間モデリング(VSM)とニューラルワード埋め込みは、現代の機械学習と自然言語処理パイプラインにおいて重要な役割を果たす。本稿では,ニューラルワード埋め込みのセントロイドの共通類似度尺度から離れて,クエリ文の類似度を測定する方法を提案する。
論文参考訳（メタデータ） (2026-02-05T14:57:38Z)
SMILE: A Composite Lexical-Semantic Metric for Question-Answering Evaluation [55.26111461168754]
本稿では,文レベルの意味理解とキーワードレベルの意味理解と簡単なキーワードマッチングを組み合わせた新しいアプローチであるSemantic Metric Integrating Lexical Exactnessを紹介する。人間の判断と計算学的に軽量であり、語彙的評価と意味的評価のギャップを埋める。
論文参考訳（メタデータ） (2025-11-21T17:30:18Z)
Evaluating Semantic Variation in Text-to-Image Synthesis: A Causal Perspective [50.261681681643076]
本稿では,SemVarEffectとSemVarBenchというベンチマークを用いて,テキスト・画像合成における入力のセマンティックな変化と出力の因果性を評価する。本研究は,T2I合成コミュニティによるヒューマンインストラクション理解の探索を促進する効果的な評価枠組みを確立する。
論文参考訳（メタデータ） (2024-10-14T08:45:35Z)
Predicting Word Similarity in Context with Referential Translation Machines [0.0]
タスクを機械翻訳性能予測(MTPP)としてキャストすることで、英語の2単語間の類似性を識別する。我々は、トレーニングとテストセットの共通表現を可能にするレファレンシャル翻訳機械(RTM)を使用している。 RTMは、グレードドドワード類似性(GWSC)タスクの上位結果を達成することができる。
論文参考訳（メタデータ） (2024-07-07T09:36:41Z)
Evaluation of Machine Translation Based on Semantic Dependencies and Keywords [7.240399904675839]
本稿では,参照翻訳に基づく機械翻訳の意味的正当性を評価するための計算手法を提案する。 Harbin Institute of TechnologyのSocial Computing and Information Retrieval Research Centerが開発した言語技術プラットフォームを使用する。
論文参考訳（メタデータ） (2024-04-20T04:14:28Z)
A General and Flexible Multi-concept Parsing Framework for Multilingual Semantic Matching [60.51839859852572]
我々は,テキストを多言語セマンティックマッチングのためのマルチコンセプトに分解し,NERモデルに依存するモデルからモデルを解放することを提案する。英語データセットのQQPとMRPC、中国語データセットのMedical-SMについて包括的な実験を行った。
論文参考訳（メタデータ） (2024-03-05T13:55:16Z)
Unsupervised Semantic Variation Prediction using the Distribution of Sibling Embeddings [17.803726860514193]
単語の意味的変化の検出は,様々なNLPアプリケーションにおいて重要な課題である。意味表現だけではそのような意味的バリエーションを正確に捉えることはできないと我々は主張する。対象単語の文脈的埋め込みのコホート全体を利用する手法を提案する。
論文参考訳（メタデータ） (2023-05-15T13:58:21Z)
Retrofitting Multilingual Sentence Embeddings with Abstract Meaning Representation [70.58243648754507]
抽象的意味表現(AMR)を用いた既存の多言語文の埋め込みを改善する新しい手法を提案する。原文入力と比較すると、AMRは文の中核概念と関係を明確かつ曖昧に表す構造的意味表現である。実験結果から,多言語文をAMRで埋め込むと,意味的類似性と伝達タスクの両方において,最先端の性能が向上することがわかった。
論文参考訳（メタデータ） (2022-10-18T11:37:36Z)
Textual Entailment Recognition with Semantic Features from Empirical Text Representation [60.31047947815282]
テキストが仮説を包含するのは、仮説の真の価値がテキストに従う場合に限る。本稿では,テキストと仮説のテキストの包含関係を同定する新しい手法を提案する。本手法では,テキスト・ハイブリッド・ペア間の意味的含意関係を識別できる要素ワイド・マンハッタン距離ベクトルベースの特徴を用いる。
論文参考訳（メタデータ） (2022-10-18T10:03:51Z)
Contextualized Semantic Distance between Highly Overlapped Texts [85.1541170468617]
テキスト編集や意味的類似性評価といった自然言語処理タスクにおいて、ペア化されたテキストに重複が頻繁に発生する。本稿では,マスク・アンド・予測戦略を用いてこの問題に対処することを目的とする。本稿では,最も長い単語列の単語を隣接する単語とみなし,その位置の分布を予測するためにマスク付き言語モデリング(MLM)を用いる。セマンティックテキスト類似性の実験では、NDDは様々な意味的差異、特に高い重なり合うペアテキストに対してより敏感であることが示されている。
論文参考訳（メタデータ） (2021-10-04T03:59:15Z)
EDS-MEMBED: Multi-sense embeddings based on enhanced distributional semantic structures via a graph walk over word senses [0.0]
WordNetの豊富なセマンティック構造を活用して、マルチセンス埋め込みの品質を高めます。 M-SEの新たな分布意味類似度測定法を先行して導出する。 WSDとWordの類似度タスクを含む11のベンチマークデータセットの評価結果を報告します。
論文参考訳（メタデータ） (2021-02-27T14:36:55Z)
SST-BERT at SemEval-2020 Task 1: Semantic Shift Tracing by Clustering in BERT-based Embedding Spaces [63.17308641484404]
本稿では,異なる単語の意味の表現として,各単語の異なる事象のクラスタを特定することを提案する。得られたクラスタの分解は、自然に4つのターゲット言語において、各ターゲットワードごとの意味的シフトのレベルを定量化することができる。当社のアプローチは,提供されたすべてのSemEvalベースラインを抜いて,個別(言語毎)と全体の両方で良好に動作します。
論文参考訳（メタデータ） (2020-10-02T08:38:40Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。