論文の概要: Word Embeddings Are Capable of Capturing Rhythmic Similarity of Words
- arxiv url: http://arxiv.org/abs/2204.04833v1
- Date: Mon, 11 Apr 2022 02:33:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-13 05:25:04.114249
- Title: Word Embeddings Are Capable of Capturing Rhythmic Similarity of Words
- Title(参考訳): 単語埋め込みは単語のリズミカルな類似性を捉えることができる
- Authors: Hosein Rezaei
- Abstract要約: Word2VecやGloVeのような単語埋め込みシステムは、NLPに対するディープラーニングアプローチでよく知られている。
本研究は,単語のリズム的類似性を捉える上での有用性について検討した。
その結果、これらの埋め込みは、他の単語と比較して、韻律語に割り当てられるベクターが互いに類似していることが判明した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Word embedding systems such as Word2Vec and GloVe are well-known in deep
learning approaches to NLP. This is largely due to their ability to capture
semantic relationships between words. In this work we investigated their
usefulness in capturing rhythmic similarity of words instead. The results show
that vectors these embeddings assign to rhyming words are more similar to each
other, compared to the other words. It is also revealed that GloVe performs
relatively better than Word2Vec in this regard. We also proposed a first of its
kind metric for quantifying rhythmic similarity of a pair of words.
- Abstract(参考訳): Word2VecやGloVeのような単語埋め込みシステムは、NLPに対するディープラーニングアプローチでよく知られている。
これは主に、単語間の意味的関係を捉える能力による。
本研究では,単語のリズム的類似性を捉える上での有用性について検討した。
その結果、これらの埋め込みが押韻語に割り当てられるベクトルは、他の単語と比較して互いに類似していることが示された。
また、この点に関してGloVeはWord2Vecよりも比較的優れていることも明らかにされている。
また,一対の単語のリズミカルな類似性を定量化するための最初の指標を提案した。
関連論文リスト
- The Impact of Word Splitting on the Semantic Content of Contextualized
Word Representations [3.4668147567693453]
分割される単語の表現の質は、しばしば、必ずしも、既知の単語の埋め込みの質よりも悪いとは限らない。
分析の結果, 単語の表現の質は, 単語の埋め込みよりも必ずしも悪くはないことが明らかとなった。
論文 参考訳(メタデータ) (2024-02-22T15:04:24Z) - Spoken Word2Vec: Learning Skipgram Embeddings from Speech [0.8901073744693314]
本研究では,入力単位が音響的に相関している場合に,スワップスキップグラムのようなアルゴリズムが分布意味論を符号化できないことを示す。
そこで本研究では,モデルのエンド・ツー・エンドの代替案の可能性を説明し,その結果の埋め込みへの影響について検討する。
論文 参考訳(メタデータ) (2023-11-15T19:25:29Z) - Neighboring Words Affect Human Interpretation of Saliency Explanations [65.29015910991261]
単語レベルのサリエンシの説明は、しばしばテキストベースのモデルで特徴属性を伝えるために使われる。
近年の研究では、単語の長さなどの表面的要因が、コミュニケーションされたサリエンシスコアの人間の解釈を歪めてしまうことが報告されている。
本研究では,単語の近傍にある単語のマーキングが,その単語の重要性に対する説明者の認識にどのように影響するかを検討する。
論文 参考訳(メタデータ) (2023-05-04T09:50:25Z) - Problems with Cosine as a Measure of Embedding Similarity for High
Frequency Words [45.58634797899206]
その結果、コサイン類似性は、同じ単語の他の例や、コンテキスト間での他の例と、頻繁な単語の類似性を過小評価していることがわかった。
我々は、この高頻度単語の類似性の過小評価は、高頻度単語と低頻度単語の表現幾何学の違いによるものであると推測する。
論文 参考訳(メタデータ) (2022-05-10T18:00:06Z) - Simple, Interpretable and Stable Method for Detecting Words with Usage
Change across Corpora [54.757845511368814]
2つの文体を比較し、その用法が異なる単語を探すという問題は、しばしばデジタル人文科学や計算社会科学において生じる。
これは一般に、各コーパスに単語の埋め込みを訓練し、ベクトル空間を整列させ、整列空間における余弦距離が大きい単語を探すことでアプローチされる。
本稿では,ベクトル空間アライメントを使わず,各単語の近傍を考慮した代替手法を提案する。
論文 参考訳(メタデータ) (2021-12-28T23:46:00Z) - Syllabic Quantity Patterns as Rhythmic Features for Latin Authorship
Attribution [74.27826764855911]
我々は、ラテン散文の計算的オーサシップ属性のタスクにおいて、リズミカルな特徴を導出する基盤として、音節量を用いる。
2つの異なる機械学習手法を用いて3つの異なるデータセットを用いて実験を行い、音節量に基づくリズム特徴がラテン散文の著者の識別に有用であることを示した。
論文 参考訳(メタデータ) (2021-10-27T06:25:31Z) - SemGloVe: Semantic Co-occurrences for GloVe from BERT [55.420035541274444]
GloVeは単語共起行列からの統計情報を利用して単語埋め込みを学ぶ。
BERTから静的なGloVeワード埋め込みに意味的共起を蒸留するSemGloVeを提案します。
論文 参考訳(メタデータ) (2020-12-30T15:38:26Z) - Speakers Fill Lexical Semantic Gaps with Context [65.08205006886591]
我々は単語の語彙的あいまいさを意味のエントロピーとして運用する。
単語のあいまいさの推定値と,WordNetにおける単語の同義語数との間には,有意な相関関係が認められた。
これは、あいまいさの存在下では、話者が文脈をより情報的にすることで補うことを示唆している。
論文 参考訳(メタデータ) (2020-10-05T17:19:10Z) - Comparative Analysis of Word Embeddings for Capturing Word Similarities [0.0]
分散言語表現は、様々な自然言語処理タスクにおいて、言語表現において最も広く使われている技術となっている。
ディープラーニング技術に基づく自然言語処理モデルのほとんどは、単語埋め込みと呼ばれる、すでに訓練済みの分散単語表現を使用している。
適切な単語の埋め込みを選択することは 複雑な作業です なぜなら、投影された埋め込み空間は 人間にとって直感的ではないからです
論文 参考訳(メタデータ) (2020-05-08T01:16:03Z) - Dense Embeddings Preserving the Semantic Relationships in WordNet [2.9443230571766854]
WordNetにおける名詞と動詞の合成のための低次元ベクトル埋め込みを生成する新しい方法を提案する。
これをSense Spectrum(および埋め込みのためのSense Spectra)と呼ぶ。
感性スペクトルの学習に適したラベルを作成するために,WordNetにおける名詞と動詞の合成のための新しい類似度尺度を考案した。
論文 参考訳(メタデータ) (2020-04-22T21:09:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。