論文の概要: A novel hybrid methodology of measuring sentence similarity
- arxiv url: http://arxiv.org/abs/2105.00648v1
- Date: Mon, 3 May 2021 06:50:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-04 21:55:24.491065
- Title: A novel hybrid methodology of measuring sentence similarity
- Title(参考訳): 文類似度測定のための新しいハイブリッド手法
- Authors: Yongmin Yoo, Tak-Sung Heo, Yeongjoon Park
- Abstract要約: 文間の類似性を正確に測定する必要がある。
ディープラーニング手法は、多くの自然言語処理分野における最先端のパフォーマンスを示す。
文の構造や文を構成する単語構造を考えることも重要である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The problem of measuring sentence similarity is an essential issue in the
natural language processing (NLP) area. It is necessary to measure the
similarity between sentences accurately. There are many approaches to measuring
sentence similarity. Deep learning methodology shows a state-of-the-art
performance in many natural language processing fields and is used a lot in
sentence similarity measurement methods. However, in the natural language
processing field, considering the structure of the sentence or the word
structure that makes up the sentence is also important. In this study, we
propose a methodology combined with both deep learning methodology and a method
considering lexical relationships. Our evaluation metric is the Pearson
correlation coefficient and Spearman correlation coefficient. As a result, the
proposed method outperforms the current approaches on a KorSTS standard
benchmark Korean dataset. Moreover, it performs a maximum of 65% increase than
only using deep learning methodology. Experiments show that our proposed method
generally results in better performance than those with only a deep learning
model.
- Abstract(参考訳): 文類似度を測定することは自然言語処理(NLP)領域において重要な問題である。
文間の類似性を正確に測定する必要がある。
文の類似性を測定するには多くのアプローチがある。
ディープラーニングの方法論は多くの自然言語処理分野で最先端のパフォーマンスを示し、文の類似度測定法で多く使われている。
しかし、自然言語処理の分野では、文の構造や文を構成する単語構造を考えることも重要である。
本研究では,深層学習手法と語彙関係を考慮した手法を併用した手法を提案する。
評価基準はピアソン相関係数とスピアマン相関係数である。
その結果、提案手法はkorsts標準ベンチマーク韓国データセットの現在のアプローチを上回っている。
さらに、ディープラーニング手法のみを使用する場合よりも最大で65%向上する。
実験の結果,提案手法はディープラーニングモデルのみを用いた手法よりも性能がよいことがわかった。
関連論文リスト
- DenoSent: A Denoising Objective for Self-Supervised Sentence
Representation Learning [59.4644086610381]
本稿では,他の視点,すなわち文内視点から継承する新たな認知的目的を提案する。
離散ノイズと連続ノイズの両方を導入することで、ノイズの多い文を生成し、モデルを元の形式に復元するように訓練する。
我々の経験的評価は,本手法が意味的テキスト類似性(STS)と幅広い伝達タスクの両面で競合する結果をもたらすことを示した。
論文 参考訳(メタデータ) (2024-01-24T17:48:45Z) - Relation-aware Ensemble Learning for Knowledge Graph Embedding [68.94900786314666]
我々は,既存の手法を関係性に配慮した方法で活用し,アンサンブルを学習することを提案する。
関係認識アンサンブルを用いてこれらのセマンティクスを探索すると、一般的なアンサンブル法よりもはるかに大きな検索空間が得られる。
本稿では,リレーショナルなアンサンブル重みを独立に検索する分割探索合成アルゴリズムRelEns-DSCを提案する。
論文 参考訳(メタデータ) (2023-10-13T07:40:12Z) - A Comparative Study of Sentence Embedding Models for Assessing Semantic
Variation [0.0]
本稿では,複数の文献において,連続する文間の意味的類似性の時系列と対の文類似性の行列を用いた最近の文埋め込み法について比較する。
文の埋め込み手法のほとんどは、ある文書において意味的類似性の高相関パターンを推定するが、興味深い相違が見られる。
論文 参考訳(メタデータ) (2023-08-08T23:31:10Z) - Automatic Design of Semantic Similarity Ensembles Using Grammatical Evolution [0.0]
単一の意味的類似度尺度はすべてのタスクに最も適しており、研究者はパフォーマンスを確保するためにアンサンブル戦略を使うことが多い。
本研究は,意味的類似性アンサンブルを自動設計する手法を提案する。
提案手法は,人的判断の相関を最大化するアンサンブルを作成するために,まず,候補のプールから測度を自動的に選択・集約するために文法的進化を利用する。
論文 参考訳(メタデータ) (2023-07-03T10:53:05Z) - Relational Sentence Embedding for Flexible Semantic Matching [86.21393054423355]
文埋め込みの可能性を明らかにするための新しいパラダイムとして,文埋め込み(Sentence Embedding, RSE)を提案する。
RSEは文関係のモデル化に有効で柔軟性があり、一連の最先端の埋め込み手法より優れている。
論文 参考訳(メタデータ) (2022-12-17T05:25:17Z) - Differentiable Data Augmentation for Contrastive Sentence Representation
Learning [6.398022050054328]
提案手法は, 半教師付き設定と教師付き設定の両方において, 既存手法よりも大幅に改善されている。
また,低ラベルデータ設定による実験により,本手法は最先端のコントラスト学習法よりもラベル効率が高いことが示された。
論文 参考訳(メタデータ) (2022-10-29T08:57:45Z) - A New Sentence Ordering Method Using BERT Pretrained Model [2.1793134762413433]
本稿では,訓練段階を必要とせず,学習のための大きなコーパスを必要とする文順序付け手法を提案する。
提案手法は,5文ストーリーのコーパスであるROCStoriesの他のベースラインよりも優れていた。
この方法の他の利点の1つは、言語知識に対する解釈可能性と不要性である。
論文 参考訳(メタデータ) (2021-08-26T18:47:15Z) - On Sampling-Based Training Criteria for Neural Language Modeling [97.35284042981675]
我々はモンテカルロサンプリング、重要サンプリング、補償部分和と呼ばれる新しい方法、およびノイズコントラスト推定を検討する。
対象のクラス後部確率を補正しさえすれば,これらすべてのサンプリング手法が同等に動作可能であることを示す。
Switchboard と LibriSpeech における言語モデリングと音声認識の実験結果が,我々の主張を支持した。
論文 参考訳(メタデータ) (2021-04-21T12:55:52Z) - A Statistical Analysis of Summarization Evaluation Metrics using
Resampling Methods [60.04142561088524]
信頼区間は比較的広く,信頼性の高い自動測定値の信頼性に高い不確実性を示す。
多くのメトリクスはROUGEよりも統計的改善を示していないが、QAEvalとBERTScoreという2つの最近の研究は、いくつかの評価設定で行われている。
論文 参考訳(メタデータ) (2021-03-31T18:28:14Z) - A Topological Method for Comparing Document Semantics [0.0]
2つの文書間の意味的類似性を比較するための新しいアルゴリズムを提案する。
私たちの実験は、人間の判定結果を含む文書データセット上で行われます。
提案アルゴリズムは,NLTKとの結びつきはあるものの,人間の一貫性の高い結果が得られるとともに,ほとんどの最先端の手法に勝る。
論文 参考訳(メタデータ) (2020-12-08T04:21:40Z) - Provably Robust Metric Learning [98.50580215125142]
既存のメトリクス学習アルゴリズムは、ユークリッド距離よりもロバストなメトリクスをもたらすことを示す。
対向摂動に対して頑健なマハラノビス距離を求めるための新しい距離学習アルゴリズムを提案する。
実験結果から,提案アルゴリズムは証明済みの堅牢な誤りと経験的堅牢な誤りの両方を改善した。
論文 参考訳(メタデータ) (2020-06-12T09:17:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。