論文の概要: Rethinking Crowd Sourcing for Semantic Similarity
- arxiv url: http://arxiv.org/abs/2109.11969v1
- Date: Fri, 24 Sep 2021 13:57:30 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-27 14:23:24.831053
- Title: Rethinking Crowd Sourcing for Semantic Similarity
- Title(参考訳): セマンティックな類似性のための群衆ソーシングの再考
- Authors: Shaul Solomon and Adam Cohn and Hernan Rosenblum and Chezi Hershkovitz
and Ivan P. Yamshchikov
- Abstract要約: 本稿では,クラウドソース型セマンティックラベリングにおけるあいまいさについて検討する。
これは、セマンティックな類似性をバイナリカテゴリとして扱うアノテーションが、ラベル付けにおいて最も重要な役割を担っていることを示している。
- 参考スコア(独自算出の注目度): 0.13999481573773073
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Estimation of semantic similarity is crucial for a variety of natural
language processing (NLP) tasks. In the absence of a general theory of semantic
information, many papers rely on human annotators as the source of ground truth
for semantic similarity estimation. This paper investigates the ambiguities
inherent in crowd-sourced semantic labeling. It shows that annotators that
treat semantic similarity as a binary category (two sentences are either
similar or not similar and there is no middle ground) play the most important
role in the labeling. The paper offers heuristics to filter out unreliable
annotators and stimulates further discussions on human perception of semantic
similarity.
- Abstract(参考訳): 意味的類似性の推定は、さまざまな自然言語処理(NLP)タスクに不可欠である。
意味情報の一般的な理論が存在しない中で、多くの論文は、意味的類似性推定の根拠として人間の注釈に頼っている。
本稿では,クラウドソーシングによる意味ラベリングに固有のあいまいさについて検討する。
意味的類似性をバイナリカテゴリとして扱うアノテーション(2つの文は似ているか似ていないかのどちらか)がラベル付けにおいて最も重要な役割を担っていることを示している。
この論文は、信頼できないアノテーションをフィルタリングするヒューリスティックスを提供し、意味的類似性に対する人間の認識に関するさらなる議論を刺激する。
関連論文リスト
- Tomato, Tomahto, Tomate: Measuring the Role of Shared Semantics among Subwords in Multilingual Language Models [88.07940818022468]
エンコーダのみの多言語言語モデル(mLM)におけるサブワード間の共有セマンティクスの役割を測る第一歩を踏み出した。
意味的に類似したサブワードとその埋め込みをマージして「意味トークン」を形成する。
グループ化されたサブワードの検査では 様々な意味的類似性を示します
論文 参考訳(メタデータ) (2024-11-07T08:38:32Z) - Domain Embeddings for Generating Complex Descriptions of Concepts in
Italian Language [65.268245109828]
電子辞書から抽出した言語情報と語彙情報に富んだ分布意味資源を提案する。
リソースは21のドメイン固有の行列と1つの包括的なマトリックスとグラフィカルユーザインタフェースから構成される。
本モデルは,具体的概念知識に直接関連した行列を選択することにより,概念の意味的記述の推論を容易にする。
論文 参考訳(メタデータ) (2024-02-26T15:04:35Z) - Interpretable Measures of Conceptual Similarity by
Complexity-Constrained Descriptive Auto-Encoding [112.0878081944858]
画像間の類似度を定量化することは、画像ベースの機械学習にとって重要な著作権問題である。
我々は,高次関係を捉えた画像間での「概念的類似性」の概念を定義し,計算することを目指している。
2つの非常に異種な画像は、その記述の早い段階で識別できるが、概念的に異種な画像は、より詳細を区別する必要がある。
論文 参考訳(メタデータ) (2024-02-14T03:31:17Z) - Agentivit\`a e telicit\`a in GilBERTo: implicazioni cognitive [77.71680953280436]
本研究の目的は,トランスフォーマーに基づくニューラルネットワークモデルが語彙意味論を推論するかどうかを検討することである。
考慮される意味的性質は、テリシティ(定性とも組み合わされる)と作用性である。
論文 参考訳(メタデータ) (2023-07-06T10:52:22Z) - Textual Entailment Recognition with Semantic Features from Empirical
Text Representation [60.31047947815282]
テキストが仮説を包含するのは、仮説の真の価値がテキストに従う場合に限る。
本稿では,テキストと仮説のテキストの包含関係を同定する新しい手法を提案する。
本手法では,テキスト・ハイブリッド・ペア間の意味的含意関係を識別できる要素ワイド・マンハッタン距離ベクトルベースの特徴を用いる。
論文 参考訳(メタデータ) (2022-10-18T10:03:51Z) - Measuring Fine-Grained Semantic Equivalence with Abstract Meaning
Representation [9.666975331506812]
意味論的に等価な文を特定することは、多くのNLPタスクにとって重要である。
意味的同値性への最近のアプローチは「等価性」への緩やかな文レベルのアプローチを取る
抽象的意味表現グラフ構造を利用した意味等価性を特徴付ける新しい,より敏感な手法を提案する。
論文 参考訳(メタデータ) (2022-10-06T16:08:27Z) - Evaluation of taxonomic and neural embedding methods for calculating
semantic similarity [0.0]
分類学的類似度尺度と分布的類似度尺度のメカニズムについて検討する。
分類学的類似度尺度は、意味的類似度を予測するための素因として、最短経路長に依存する可能性がある。
類似性予測における概念関係と神経埋め込みの相乗効果は、伝達学習における知識ベースを活用する新しい傾向を示す可能性がある。
論文 参考訳(メタデータ) (2022-09-30T02:54:21Z) - Patterns of Lexical Ambiguity in Contextualised Language Models [9.747449805791092]
本稿では,単語感覚の類似度と共述度を拡張した,人間による注釈付きデータセットを提案する。
どちらの人間の判断も、多文解釈の類似性は意味の同一性とホモニミーの連続性にあることを示している。
我々のデータセットは、語彙的曖昧性の複雑さの大部分を捉えており、文脈的埋め込みのための現実的なテストベッドを提供することができる。
論文 参考訳(メタデータ) (2021-09-27T13:11:44Z) - Comparative Probing of Lexical Semantics Theories for Cognitive
Plausibility and Technological Usefulness [1.028961895672321]
語彙意味論の理論は、単語の意味が推論グラフ、特徴写像、ベクトル空間として表されると主張する点で異なる。
我々は,その認知的妥当性と技術的有用性のレベルについて,様々な語彙意味論を体系的に研究した。
論文 参考訳(メタデータ) (2020-11-16T14:46:08Z) - Synonymy = Translational Equivalence [6.198307677263333]
同義語と翻訳の等価性は、言語内および言語間における意味の同義性の関係である。
本稿では,これらの2つの関係を統一的に扱うことを提案する。
論文 参考訳(メタデータ) (2020-04-28T23:15:02Z) - Human Correspondence Consensus for 3D Object Semantic Understanding [56.34297279246823]
本稿では,CorresPondenceNetという新しいデータセットを提案する。
このデータセットに基づいて、新しい測地的整合性損失を伴う密接なセマンティック埋め込みを学習することができる。
CorresPondenceNetは異種オブジェクトの細粒度理解を促進できるだけでなく、クロスオブジェクト登録や部分オブジェクトマッチングも実現できた。
論文 参考訳(メタデータ) (2019-12-29T04:24:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。