論文の概要: Combining word embeddings and convolutional neural networks to detect
duplicated questions
- arxiv url: http://arxiv.org/abs/2006.04513v1
- Date: Mon, 8 Jun 2020 12:30:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-24 00:14:12.359772
- Title: Combining word embeddings and convolutional neural networks to detect
duplicated questions
- Title(参考訳): 単語埋め込みと畳み込みニューラルネットワークを組み合わせて重複した質問を検出する
- Authors: Yoan Dimitrov
- Abstract要約: 本稿では,単語埋め込みと畳み込みニューラルネットワークの強みを組み合わせることで,意味論的に類似した質問を識別する簡単な手法を提案する。
私たちのネットワークは、400万以上の質問ペアを含むQuoraデータセットでトレーニングされています。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Detecting semantic similarities between sentences is still a challenge today
due to the ambiguity of natural languages. In this work, we propose a simple
approach to identifying semantically similar questions by combining the
strengths of word embeddings and Convolutional Neural Networks (CNNs). In
addition, we demonstrate how the cosine similarity metric can be used to
effectively compare feature vectors. Our network is trained on the Quora
dataset, which contains over 400k question pairs. We experiment with different
embedding approaches such as Word2Vec, Fasttext, and Doc2Vec and investigate
the effects these approaches have on model performance. Our model achieves
competitive results on the Quora dataset and complements the well-established
evidence that CNNs can be utilized for paraphrase detection tasks.
- Abstract(参考訳): 文間の意味的類似性の検出は、自然言語の曖昧さのため、現在でも課題である。
本研究では,単語埋め込みと畳み込みニューラルネットワーク(cnns)の強みを組み合わせることで,意味的に類似した質問を識別する手法を提案する。
さらに,コサイン類似度計量を用いて特徴ベクトルを効果的に比較する方法を示す。
私たちのネットワークは、400万以上の質問ペアを含むquoraデータセットでトレーニングされています。
我々は、Word2Vec、Fasttext、Doc2Vecといった様々な埋め込み手法を実験し、これらの手法がモデル性能に与える影響について検討する。
提案モデルはQuoraデータセット上での競合的な結果を実現し,CNNがパラフレーズ検出タスクに利用できるという確固たる証拠を補完する。
関連論文リスト
- Syntax and Semantics Meet in the "Middle": Probing the Syntax-Semantics
Interface of LMs Through Agentivity [68.8204255655161]
このような相互作用を探索するためのケーススタディとして,作用性のセマンティックな概念を提示する。
これは、LMが言語アノテーション、理論テスト、発見のためのより有用なツールとして役立つ可能性を示唆している。
論文 参考訳(メタデータ) (2023-05-29T16:24:01Z) - Revealing Similar Semantics Inside CNNs: An Interpretable Concept-based
Comparison of Feature Spaces [0.0]
安全に重要なアプリケーションは、人工知能コンポーネントの透明性を必要とする。
認識タスクに広く使用される畳み込みニューラルネットワーク(CNN)は、固有の解釈可能性に欠ける。
CNN潜在空間内の意味情報間の階層的類似性を推定する2つの手法を提案する。
論文 参考訳(メタデータ) (2023-04-30T13:53:39Z) - Relational Sentence Embedding for Flexible Semantic Matching [86.21393054423355]
文埋め込みの可能性を明らかにするための新しいパラダイムとして,文埋め込み(Sentence Embedding, RSE)を提案する。
RSEは文関係のモデル化に有効で柔軟性があり、一連の最先端の埋め込み手法より優れている。
論文 参考訳(メタデータ) (2022-12-17T05:25:17Z) - Explaining Neural Network Predictions on Sentence Pairs via Learning
Word-Group Masks [21.16662651409811]
入力テキストペアから相関語をグループ化して単語相関を暗黙的に検出するグループマスク(GMASK)手法を提案する。
提案手法は4つのデータセットにまたがる2つの異なるモデルアーキテクチャ (decomposable attention model と bert) を用いて評価した。
論文 参考訳(メタデータ) (2021-04-09T17:14:34Z) - R$^2$-Net: Relation of Relation Learning Network for Sentence Semantic
Matching [58.72111690643359]
文意味マッチングのための関係学習ネットワーク(R2-Net)を提案する。
最初にBERTを使用して、グローバルな視点から入力文をエンコードします。
次に、cnnベースのエンコーダは、ローカルな視点からキーワードやフレーズ情報をキャプチャするように設計されている。
関係情報抽出にラベルを十分に活用するために,関係分類タスクの自己教師付き関係性を導入する。
論文 参考訳(メタデータ) (2020-12-16T13:11:30Z) - On the Effects of Using word2vec Representations in Neural Networks for
Dialogue Act Recognition [0.6767885381740952]
文中の単語列をキャプチャする再帰モデルを探索するディープニューラルネットワークを提案する。
このモデルを英語、フランス語、チェコ語という3つの言語で検証する。
論文 参考訳(メタデータ) (2020-10-22T07:21:17Z) - Sequential Sentence Matching Network for Multi-turn Response Selection
in Retrieval-based Chatbots [45.920841134523286]
本稿では,文レベルの意味情報を用いて問題に対処する,逐次文マッチングネットワーク(S2M)を提案する。
まず、文レベルの意味情報を用いて、ネットワークが問題に対処し、マッチングを大幅に改善し、その結果、最先端のパフォーマンスが得られることがわかった。
論文 参考訳(メタデータ) (2020-05-16T09:47:19Z) - Information-Theoretic Probing for Linguistic Structure [74.04862204427944]
本稿では,相互情報を推定するための情報理論による探索運用手法を提案する。
我々は,NLP研究でしばしば不足している10の型的多様言語について評価した。
論文 参考訳(メタデータ) (2020-04-07T01:06:36Z) - Expressing Objects just like Words: Recurrent Visual Embedding for
Image-Text Matching [102.62343739435289]
既存の画像テキストマッチングアプローチは、テキストと画像の各独立オブジェクト間の親和性をキャプチャして集約することにより、画像テキストペアの類似性を推測する。
本稿では,リカレントニューラルネットワーク(RNN)を用いて画像と文を対称に処理するDual Path Recurrent Neural Network (DP-RNN)を提案する。
我々のモデルはFlickr30Kデータセットの最先端性能とMS-COCOデータセットの競合性能を達成する。
論文 参考訳(メタデータ) (2020-02-20T00:51:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。