論文の概要: UltraWiki: Ultra-fine-grained Entity Set Expansion with Negative Seed Entities
- arxiv url: http://arxiv.org/abs/2403.04247v2
- Date: Tue, 23 Apr 2024 08:29:51 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-24 19:06:16.355969
- Title: UltraWiki: Ultra-fine-grained Entity Set Expansion with Negative Seed Entities
- Title(参考訳): UltraWiki: 負の種子を持つ超微細なエンティティセットの拡張
- Authors: Yangning Li, Qingsong Lv, Tianyu Yu, Yinghui Li, Shulin Huang, Tingwei Lu, Xuming Hu, Wenhao JIang, Hai-Tao Zheng, Hui Wang,
- Abstract要約: 入力に負のシードエンティティを導入し、正のシードエンティティと同じ粒度のセマンティッククラスに属するが、特定の属性が異なる。
負の種実体は、正と負の属性の対比によって意味的あいまいさを排除している。
超きめ細かなエンティティセマンティクスの理解を強化するための3つの戦略を考案した。
- 参考スコア(独自算出の注目度): 38.85274314130823
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Entity Set Expansion (ESE) aims to identify new entities belonging to the same semantic class as a given set of seed entities. Traditional methods primarily relied on positive seed entities to represent a target semantic class, which poses challenge for the representation of ultra-fine-grained semantic classes. Ultra-fine-grained semantic classes are defined based on fine-grained semantic classes with more specific attribute constraints. Describing it with positive seed entities alone cause two issues: (i) Ambiguity among ultra-fine-grained semantic classes. (ii) Inability to define "unwanted" semantic. Due to these inherent shortcomings, previous methods struggle to address the ultra-fine-grained ESE (Ultra-ESE). To solve this issue, we first introduce negative seed entities in the inputs, which belong to the same fine-grained semantic class as the positive seed entities but differ in certain attributes. Negative seed entities eliminate the semantic ambiguity by contrast between positive and negative attributes. Meanwhile, it provide a straightforward way to express "unwanted". To assess model performance in Ultra-ESE, we constructed UltraWiki, the first large-scale dataset tailored for Ultra-ESE. UltraWiki encompasses 236 ultra-fine-grained semantic classes, where each query of them is represented with 3-5 positive and negative seed entities. A retrieval-based framework RetExpan and a generation-based framework GenExpan are proposed to comprehensively assess the efficacy of large language models from two different paradigms in Ultra-ESE. Moreover, we devised three strategies to enhance models' comprehension of ultra-fine-grained entities semantics: contrastive learning, retrieval augmentation, and chain-of-thought reasoning. Extensive experiments confirm the effectiveness of our proposed strategies and also reveal that there remains a large space for improvement in Ultra-ESE.
- Abstract(参考訳): Entity Set Expansion (ESE)は、与えられたシードエンティティのセットと同じセマンティッククラスに属する新しいエンティティを特定することを目的としている。
従来のメソッドは、ターゲットセマンティッククラスを表現するために、主に正のシードエンティティに依存しており、これは超微細なセマンティッククラスを表現する上での課題である。
超微粒なセマンティッククラスは、より特定の属性制約を持つ細粒なセマンティッククラスに基づいて定義される。
ポジティブなシードエンティティだけで記述することは、以下の2つの問題を引き起こす。
(i)超きめ細かい意味クラス間のあいまいさ。
(ii)「望ましくない」意味を定義することができないこと。
これらの固有の欠点のため、従来の手法は超微細な ESE (Ultra-ESE) に対処するのに苦労していた。
この問題を解決するために、まず、正のシードエンティティと同じ粒度のセマンティッククラスに属するが、特定の属性が異なる入力に負のシードエンティティを導入する。
負の種実体は、正と負の属性の対比によって意味的あいまいさを排除している。
一方、これは「望ましくない」を表現するための簡単な方法である。
我々はUltra-ESEのモデル性能を評価するために,Ultra-ESEに適した最初の大規模データセットであるUltraWikiを構築した。
UltraWikiは236の超微細なセマンティッククラスを含み、それぞれのクエリは3-5の正と負のシードエンティティで表現される。
検索に基づくフレームワークRetExpanと世代ベースのフレームワークGenExpanを提案し,Ultra-ESEにおける2つの異なるパラダイムから大規模言語モデルの有効性を総合的に評価した。
さらに,モデルが持つ超きめ細かなセマンティクスの理解を強化するための3つの戦略を考案した。
また,提案手法の有効性を確認し,Ultra-ESEに改善の余地があることも明らかにした。
関連論文リスト
- Tackling Ambiguity from Perspective of Uncertainty Inference and Affinity Diversification for Weakly Supervised Semantic Segmentation [12.308473939796945]
画像レベルのラベルを持つ弱教師付きセマンティックセマンティックセグメンテーション(WSSS)は、退屈なアノテーションを使わずに高密度なタスクを実現することを目的としている。
WSSSの性能、特にクラス活性化マップ(CAM)の生成と擬似マスクの精製の段階では、あいまいさに悩まされている。
統一された単一ステージWSSSフレームワークであるUniAを提案し、不確実性推論と親和性多様化の観点からこの問題に対処する。
論文 参考訳(メタデータ) (2024-04-12T01:54:59Z) - GroupContrast: Semantic-aware Self-supervised Representation Learning for 3D Understanding [66.5538429726564]
自己教師付き3D表現学習は、大規模未ラベルの点群から効果的な表現を学習することを目的としている。
本稿では,セグメンテーションとセマンティック・アウェア・コントラッシブ・ラーニングを組み合わせた新しいアプローチであるGroupContrastを提案する。
論文 参考訳(メタデータ) (2024-03-14T17:59:59Z) - Syntax and Semantics Meet in the "Middle": Probing the Syntax-Semantics
Interface of LMs Through Agentivity [68.8204255655161]
このような相互作用を探索するためのケーススタディとして,作用性のセマンティックな概念を提示する。
これは、LMが言語アノテーション、理論テスト、発見のためのより有用なツールとして役立つ可能性を示唆している。
論文 参考訳(メタデータ) (2023-05-29T16:24:01Z) - Advancing Incremental Few-shot Semantic Segmentation via Semantic-guided
Relation Alignment and Adaptation [98.51938442785179]
増分的な数ショットセマンティックセマンティックセマンティクスは、セマンティクスセマンティクスモデルを新しいクラスに漸進的に拡張することを目的としている。
このタスクは、データ不均衡のため、ベースクラスと新しいクラスの間で深刻な意味認識の問題に直面します。
本稿では,従来の意味情報のガイダンスを完全に考慮した意味誘導型関係調整適応法を提案する。
論文 参考訳(メタデータ) (2023-05-18T10:40:52Z) - Semantic-aware Contrastive Learning for More Accurate Semantic Parsing [32.74456368167872]
そこで本研究では,意味表現の微粒化を学習できる意味認識型コントラスト学習アルゴリズムを提案する。
2つの標準データセットの実験により、我々の手法はMLEベースラインよりも大幅に改善されていることが示された。
論文 参考訳(メタデータ) (2023-01-19T07:04:32Z) - Contrastive Learning with Hard Negative Entities for Entity Set
Expansion [29.155036098444008]
様々なNLPおよびIRアプリケーションは、知識を発見する能力により、ESEの恩恵を受けるだろう。
我々は、エンティティの表現を洗練させるために、コントラスト学習を伴うエンティティレベルのマスキング言語モデルを考案する。
さらに、上記の言語モデルによって得られたエンティティ表現を利用してエンティティを拡張する新しい確率的ESEフレームワークであるProbExpanを提案する。
論文 参考訳(メタデータ) (2022-04-16T12:26:42Z) - Hyperbolic Disentangled Representation for Fine-Grained Aspect
Extraction [5.545062009366532]
HDAEは、ユーザーレビューのための双曲型アンタングルアスペクト抽出器である。
Amazonの製品レビューとレストランレビューデータセットでは、平均F1パフォーマンスが18.2%、24.1%向上している。
論文 参考訳(メタデータ) (2021-12-16T21:47:28Z) - Deep Clustering by Semantic Contrastive Learning [67.28140787010447]
Semantic Contrastive Learning (SCL) と呼ばれる新しい変種を紹介します。
従来のコントラスト学習とディープクラスタリングの両方の特徴を探求する。
コントラスト学習と深層クラスタリングの強みを統一的なアプローチで増幅することができる。
論文 参考訳(メタデータ) (2021-03-03T20:20:48Z) - On graded semantics of abstract argumentation: Extension-based case [0.0]
本稿では,抽象的議論フレームワーク(AAF)における拡張型意味論の課題について考察する。
代替基本補題が与えられ、[1]で得られた対応する結果を一般化する。
コンフリクトフリー、許容可能、完全、安定のセマンティクスを含む、AFの基本的なセマンティクスは、リミット・ミート・モジュロ・アン・ウルトラフィルタの下で閉じられていることが示されている。
論文 参考訳(メタデータ) (2020-12-19T04:32:19Z) - Empower Entity Set Expansion via Language Model Probing [58.78909391545238]
既存の拡張方法は、コンテキスト特徴を適応的に選択し、新しいエンティティを抽出することで、シードエンティティをブートストラップする。
エンティティセット拡張の鍵となる課題は、クラスセマンティクスをシフトし、後のイテレーションで累積エラーにつながる曖昧なコンテキスト機能を選択することを避けることである。
セマンティックドリフト問題に対処するために、自動生成されたクラス名を活用する新しい反復的集合拡張フレームワークを提案する。
論文 参考訳(メタデータ) (2020-04-29T00:09:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。