論文の概要: SynWMD: Syntax-aware Word Mover's Distance for Sentence Similarity
Evaluation
- arxiv url: http://arxiv.org/abs/2206.10029v1
- Date: Mon, 20 Jun 2022 22:30:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-22 17:12:07.250780
- Title: SynWMD: Syntax-aware Word Mover's Distance for Sentence Similarity
Evaluation
- Title(参考訳): SynWMD:Syntax-aware Word Moverの文類似性評価のための距離
- Authors: Chengwei Wei, Bin Wang, C.-C. Jay Kuo
- Abstract要約: Word Mover's Distance (WMD)は、単語とモデル間の距離を、2つのテキストシーケンスにおける単語間の移動コストと類似性を計算する。
SynWMD(Syntax-aware Word Mover's Distance)と呼ばれる構文解析木を用いた改良WMD法を提案する。
- 参考スコア(独自算出の注目度): 36.5590780726458
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Word Mover's Distance (WMD) computes the distance between words and models
text similarity with the moving cost between words in two text sequences. Yet,
it does not offer good performance in sentence similarity evaluation since it
does not incorporate word importance and fails to take inherent contextual and
structural information in a sentence into account. An improved WMD method using
the syntactic parse tree, called Syntax-aware Word Mover's Distance (SynWMD),
is proposed to address these two shortcomings in this work. First, a weighted
graph is built upon the word co-occurrence statistics extracted from the
syntactic parse trees of sentences. The importance of each word is inferred
from graph connectivities. Second, the local syntactic parsing structure of
words is considered in computing the distance between words. To demonstrate the
effectiveness of the proposed SynWMD, we conduct experiments on 6 textual
semantic similarity (STS) datasets and 4 sentence classification datasets.
Experimental results show that SynWMD achieves state-of-the-art performance on
STS tasks. It also outperforms other WMD-based methods on sentence
classification tasks.
- Abstract(参考訳): Word Mover's Distance (WMD)は、単語とモデル間の距離を、2つのテキストシーケンスにおける単語間の移動コストと類似性を計算する。
しかし,単語の重要度を考慮せず,文の文脈的・構造的情報を考慮に入れないため,文の類似性評価に優れた性能は得られない。
SynWMD(Syntax-aware Word Mover's Distance)と呼ばれる構文解析木を用いた改良WMD法を提案する。
まず,文の構文解析木から抽出した単語共起統計に基づいて重み付きグラフを構築する。
各単語の重要性はグラフ接続性から推測される。
次に,単語間の距離を計算する際に,単語の局所構文解析構造を考える。
提案するSynWMDの有効性を示すために,6つのテキスト意味類似性データセットと4つの文分類データセットの実験を行った。
実験結果から,SynWMDはSTSタスクの最先端性能を実現することがわかった。
また、文分類タスクにおける他のWMDベースの手法よりも優れている。
関連論文リスト
- Evaluating Semantic Variation in Text-to-Image Synthesis: A Causal Perspective [50.261681681643076]
本稿では,SemVarEffectとSemVarBenchというベンチマークを用いて,テキスト・画像合成における入力のセマンティックな変化と出力の因果性を評価する。
本研究は,T2I合成コミュニティによるヒューマンインストラクション理解の探索を促進する効果的な評価枠組みを確立する。
論文 参考訳(メタデータ) (2024-10-14T08:45:35Z) - Syntax and Semantics Meet in the "Middle": Probing the Syntax-Semantics
Interface of LMs Through Agentivity [68.8204255655161]
このような相互作用を探索するためのケーススタディとして,作用性のセマンティックな概念を提示する。
これは、LMが言語アノテーション、理論テスト、発見のためのより有用なツールとして役立つ可能性を示唆している。
論文 参考訳(メタデータ) (2023-05-29T16:24:01Z) - Relational Sentence Embedding for Flexible Semantic Matching [86.21393054423355]
文埋め込みの可能性を明らかにするための新しいパラダイムとして,文埋め込み(Sentence Embedding, RSE)を提案する。
RSEは文関係のモデル化に有効で柔軟性があり、一連の最先端の埋め込み手法より優れている。
論文 参考訳(メタデータ) (2022-12-17T05:25:17Z) - Improving word mover's distance by leveraging self-attention matrix [7.934452214142754]
提案手法は,単語の埋め込みの類似性を同時に考慮したFused Gromov-Wasserstein距離と,2つの文間の最適な移動を計算するSAMに基づく。
提案手法は, 意味的テキストの類似性にほぼ等価な性能を持つパラフレーズ識別において, WMDとその変種を向上することを示す。
論文 参考訳(メタデータ) (2022-11-11T14:25:08Z) - Moving Other Way: Exploring Word Mover Distance Extensions [7.195824023358536]
モービル距離(英: mover's distance、WMD)は、2つのテキストに対する一般的な意味的類似度尺度である。
本稿では,WMDの拡張の可能性について検討する。
論文 参考訳(メタデータ) (2022-02-07T12:56:32Z) - WMDecompose: A Framework for Leveraging the Interpretable Properties of
Word Mover's Distance in Sociocultural Analysis [0.0]
妥当性と解釈可能性のバランスをとる一般的なモデルは、Word Mover's Distance (WMD)である。
WMDecomposeは、文書レベル距離を構成語レベル距離に分解し、その後、単語をクラスタ化してテーマ要素を誘導するモデルおよびPythonライブラリである。
論文 参考訳(メタデータ) (2021-10-14T13:04:38Z) - Contextualized Semantic Distance between Highly Overlapped Texts [85.1541170468617]
テキスト編集や意味的類似性評価といった自然言語処理タスクにおいて、ペア化されたテキストに重複が頻繁に発生する。
本稿では,マスク・アンド・予測戦略を用いてこの問題に対処することを目的とする。
本稿では,最も長い単語列の単語を隣接する単語とみなし,その位置の分布を予測するためにマスク付き言語モデリング(MLM)を用いる。
セマンティックテキスト類似性の実験では、NDDは様々な意味的差異、特に高い重なり合うペアテキストに対してより敏感であることが示されている。
論文 参考訳(メタデータ) (2021-10-04T03:59:15Z) - Syntactic representation learning for neural network based TTS with
syntactic parse tree traversal [49.05471750563229]
本稿では,構文解析木に基づく構文表現学習手法を提案し,構文構造情報を自動的に活用する。
実験の結果,提案手法の有効性が示された。
複数の構文解析木を持つ文では、合成音声から韻律的差異が明確に認識される。
論文 参考訳(メタデータ) (2020-12-13T05:52:07Z) - Incorporate Semantic Structures into Machine Translation Evaluation via
UCCA [9.064153799336536]
文中の重要な意味を持つ単語を意味的中核語と定義する。
意味的重み付き文類似性(SWSS)というMT評価手法を提案する。
論文 参考訳(メタデータ) (2020-10-17T06:47:58Z) - Text classification with word embedding regularization and soft
similarity measure [0.20999222360659603]
2つの単語埋め込み正規化技術は、ストレージとメモリコストを削減し、トレーニング速度、文書処理速度、タスクパフォーマンスを改善する。
正規化単語埋め込みによる平均$k$NNテスト誤差の39%を非正規化単語埋め込みと比較した。
また,正規化単語埋め込みを用いたSCMはテキスト分類においてWMDを著しく上回り,1万倍以上高速であることを示す。
論文 参考訳(メタデータ) (2020-03-10T22:07:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。