論文の概要: Rethinking Word Similarity: Semantic Similarity through Classification Confusion
- arxiv url: http://arxiv.org/abs/2502.05704v1
- Date: Sat, 08 Feb 2025 21:55:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-11 14:35:32.787261
- Title: Rethinking Word Similarity: Semantic Similarity through Classification Confusion
- Title(参考訳): 単語の類似性を再考する:分類的融合による意味的類似性
- Authors: Kaitlyn Zhou, Haishan Gao, Sarah Chen, Dan Edelstein, Dan Jurafsky, Chen Shani,
- Abstract要約: 本稿では,特徴に基づく分類の混乱という観点から意味的類似性を再編成する,類似性の新たな尺度,Word Confusionを提案する。
提案手法は,複数のデータセットにまたがる人間の類似性判定におけるコサイン類似性に匹敵するものである。
フランスの「革命」という言葉の18世紀における変化に関する仮説を検証するために、我々のモデルが動的特徴を活用できることを実証する。
- 参考スコア(独自算出の注目度): 31.12253159483973
- License:
- Abstract: Word similarity has many applications to social science and cultural analytics tasks like measuring meaning change over time and making sense of contested terms. Yet traditional similarity methods based on cosine similarity between word embeddings cannot capture the context-dependent, asymmetrical, polysemous nature of semantic similarity. We propose a new measure of similarity, Word Confusion, that reframes semantic similarity in terms of feature-based classification confusion. Word Confusion is inspired by Tversky's suggestion that similarity features be chosen dynamically. Here we train a classifier to map contextual embeddings to word identities and use the classifier confusion (the probability of choosing a confounding word c instead of the correct target word t) as a measure of the similarity of c and t. The set of potential confounding words acts as the chosen features. Our method is comparable to cosine similarity in matching human similarity judgments across several datasets (MEN, WirdSim353, and SimLex), and can measure similarity using predetermined features of interest. We demonstrate our model's ability to make use of dynamic features by applying it to test a hypothesis about changes in the 18th C. meaning of the French word "revolution" from popular to state action during the French Revolution. We hope this reimagining of semantic similarity will inspire the development of new tools that better capture the multi-faceted and dynamic nature of language, advancing the fields of computational social science and cultural analytics and beyond.
- Abstract(参考訳): 言葉の類似性は、時間とともに変化する意味を測り、争った言葉を理解するなど、社会科学や文化分析のタスクに多くの応用がある。
しかし、単語埋め込み間のコサイン類似性に基づく従来の類似性手法では、文脈依存的、非対称的、意味的類似性の多文性は捉えられない。
本稿では,特徴に基づく分類の混乱という観点から意味的類似性を再編成する,類似性の新たな尺度,Word Confusionを提案する。
Word ConfusionはTversky氏の提案に触発され、類似性機能は動的に選択される。
ここでは、文脈埋め込みを単語のアイデンティティにマッピングするように分類器を訓練し、c と t の類似性の尺度として分類器混乱(正しいターゲット語 t の代わりに共起語 c を選択する確率)を用いる。
潜在的な相反する単語のセットは、選択された特徴として機能する。
提案手法は,複数のデータセット(MEN, WirdSim353, SimLex)における人間の類似性判定に適合するコサイン類似性に匹敵するものであり,所定特徴を用いて類似性を測定することができる。
我々は,フランス革命期の大衆から国家行動への「革命」という言葉の18世紀における変化に関する仮説を検証するために,動的特徴を応用する我々のモデルの能力を実証する。
この意味的類似性の再認識が、多面的・動的言語の性質をよりよく捉え、計算社会科学や文化分析などの分野を前進させる新しいツールの開発を促すことを願っている。
関連論文リスト
- Conjuring Semantic Similarity [59.18714889874088]
2つのテキスト表現間の意味的類似性は、潜伏者の「意味」の間の距離を測定する
テキスト表現間の意味的類似性は、他の表現を言い換えるのではなく、それらが引き起こすイメージに基づいている、という新しいアプローチを提案する。
提案手法は,人間の注釈付きスコアに適合するだけでなく,テキスト条件付き生成モデル評価のための新たな道を開く意味的類似性に関する新たな視点を提供する。
論文 参考訳(メタデータ) (2024-10-21T18:51:34Z) - Relational Sentence Embedding for Flexible Semantic Matching [86.21393054423355]
文埋め込みの可能性を明らかにするための新しいパラダイムとして,文埋め込み(Sentence Embedding, RSE)を提案する。
RSEは文関係のモデル化に有効で柔軟性があり、一連の最先端の埋め込み手法より優れている。
論文 参考訳(メタデータ) (2022-12-17T05:25:17Z) - Evaluation of taxonomic and neural embedding methods for calculating
semantic similarity [0.0]
分類学的類似度尺度と分布的類似度尺度のメカニズムについて検討する。
分類学的類似度尺度は、意味的類似度を予測するための素因として、最短経路長に依存する可能性がある。
類似性予測における概念関係と神経埋め込みの相乗効果は、伝達学習における知識ベースを活用する新しい傾向を示す可能性がある。
論文 参考訳(メタデータ) (2022-09-30T02:54:21Z) - Identifying Ambiguous Similarity Conditions via Semantic Matching [49.06931755266372]
Weakly Supervised Conditional similarity Learning (WS-CSL)を紹介する。
WS-CSLは、"can fly"のような明示的な条件ラベルなしでセマンティック条件にマッチする複数の埋め込みを学習する
本研究では, インスタンスインスタンスと三重項条件の関係を「分解・融合」方式で特徴付ける, 距離誘起セマンティック・コンディション検証ネットワーク (DiscoverNet) を提案する。
論文 参考訳(メタデータ) (2022-04-08T13:15:55Z) - Comparing in context: Improving cosine similarity measures with a metric
tensor [0.0]
コサイン類似性は、言語モデリングの目標に基づいて訓練された事前訓練された単語埋め込みの関連性の尺度として広く用いられている。
そこで我々は,そのタスクの性能向上のために,拡張されたコサイン類似度尺度を用いることを提案する。
我々は、文脈化メトリクスを学習し、標準コサイン類似度尺度を用いて得られた基準値と比較し、常に改善を示す。
また、SimLex-999 と WordSim-353 のコンテキスト化類似度尺度をトレーニングし、結果と対応するベースラインを比較し、これらのデータセットを学習した全コンテキスト類似度尺度の独立したテストセットとして使用する。
論文 参考訳(メタデータ) (2022-03-28T18:04:26Z) - Attributable Visual Similarity Learning [90.69718495533144]
本稿では、画像間のより正確で説明可能な類似度測定のための帰属的視覚類似度学習(AVSL)フレームワークを提案する。
人間の意味的類似性認知に動機づけられた2つの画像とグラフとの類似性を表現するために,一般化された類似性学習パラダイムを提案する。
CUB-200-2011、Cars196、Stanford Online Productsデータセットの実験は、既存の深い類似性学習方法よりも大幅に改善されたことを示している。
論文 参考訳(メタデータ) (2022-03-28T17:35:31Z) - MNet-Sim: A Multi-layered Semantic Similarity Network to Evaluate
Sentence Similarity [0.0]
類似性(英: similarity)は、それが考慮される領域によって異なる比較目的測度である。
本稿では,複数の類似度に基づく多層意味類似性ネットワークモデルを提案する。
その結果, 文類似性の評価において, 性能スコアが向上していることが判明した。
論文 参考訳(メタデータ) (2021-11-09T20:43:18Z) - Patterns of Lexical Ambiguity in Contextualised Language Models [9.747449805791092]
本稿では,単語感覚の類似度と共述度を拡張した,人間による注釈付きデータセットを提案する。
どちらの人間の判断も、多文解釈の類似性は意味の同一性とホモニミーの連続性にあることを示している。
我々のデータセットは、語彙的曖昧性の複雑さの大部分を捉えており、文脈的埋め込みのための現実的なテストベッドを提供することができる。
論文 参考訳(メタデータ) (2021-09-27T13:11:44Z) - Fake it Till You Make it: Self-Supervised Semantic Shifts for
Monolingual Word Embedding Tasks [58.87961226278285]
語彙意味変化をモデル化するための自己教師付きアプローチを提案する。
本手法は,任意のアライメント法を用いて意味変化の検出に利用できることを示す。
3つの異なるデータセットに対する実験結果を用いて,本手法の有用性について述べる。
論文 参考訳(メタデータ) (2021-01-30T18:59:43Z) - Comparative Analysis of Word Embeddings for Capturing Word Similarities [0.0]
分散言語表現は、様々な自然言語処理タスクにおいて、言語表現において最も広く使われている技術となっている。
ディープラーニング技術に基づく自然言語処理モデルのほとんどは、単語埋め込みと呼ばれる、すでに訓練済みの分散単語表現を使用している。
適切な単語の埋め込みを選択することは 複雑な作業です なぜなら、投影された埋め込み空間は 人間にとって直感的ではないからです
論文 参考訳(メタデータ) (2020-05-08T01:16:03Z) - Multiplex Word Embeddings for Selectional Preference Acquisition [70.33531759861111]
単語間の様々な関係に応じて容易に拡張できる多重単語埋め込みモデルを提案する。
本モデルでは,不必要なスパース性を導入することなく,関係の異なる単語を効果的に識別することができる。
論文 参考訳(メタデータ) (2020-01-09T04:47:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。