論文の概要: UltraWiki: Ultra-fine-grained Entity Set Expansion with Negative Seed Entities
- arxiv url: http://arxiv.org/abs/2403.04247v3
- Date: Tue, 03 Jun 2025 11:11:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-05 01:42:08.838268
- Title: UltraWiki: Ultra-fine-grained Entity Set Expansion with Negative Seed Entities
- Title(参考訳): UltraWiki: 負の種子を持つ超微細なエンティティセットの拡張
- Authors: Yangning Li, Qingsong Lv, Tianyu Yu, Yinghui Li, Xuming Hu, Wenhao Jiang, Hai-Tao Zheng, Hui Wang,
- Abstract要約: 入力に負のシードエンティティを導入し、正のシードエンティティを持つ超微粒なセマンティッククラスを共同で記述する。
負の種実体は、正の属性と負の属性の対比を提供することによって意味的曖昧さを排除している。
また,モデルによる超きめ細かな実体の意味の理解を強化するための2つの戦略を考案した。
- 参考スコア(独自算出の注目度): 40.69180027290688
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Entity Set Expansion (ESE) aims to identify new entities belonging to the same semantic class as the given set of seed entities. Traditional methods solely relied on positive seed entities to represent the target fine-grained semantic class, rendering them tough to represent ultra-fine-grained semantic classes. Specifically, merely relying on positive seed entities leads to two inherent shortcomings: (i) Ambiguity among ultra-fine-grained semantic classes. (ii) Inability to define ``unwanted'' semantics. Hence, previous ESE methods struggle to address the ultra-fine-grained ESE (Ultra-ESE) task. To solve this issue, we first introduce negative seed entities in the inputs, which jointly describe the ultra-fine-grained semantic class with positive seed entities. Negative seed entities eliminate the semantic ambiguity by providing a contrast between positive and negative attributes. Meanwhile, it provides a straightforward way to express ``unwanted''. To assess model performance in Ultra-ESE and facilitate further research, we also constructed UltraWiki, the first large-scale dataset tailored for Ultra-ESE. UltraWiki encompasses 50,973 entities and 394,097 sentences, alongside 236 ultra-fine-grained semantic classes, where each class is represented with 3-5 positive and negative seed entities. Moreover, a retrieval-based framework RetExpan and a generation-based framework GenExpan are proposed to provide powerful baselines for Ultra-ESE. Additionally, we devised two strategies to enhance models' comprehension of ultra-fine-grained entities' semantics: contrastive learning and chain-of-thought reasoning. Extensive experiments confirm the effectiveness of our proposed strategies and also reveal that there remains a large space for improvement in Ultra-ESE.
- Abstract(参考訳): Entity Set Expansion (ESE)は、与えられたシードエンティティのセットと同じセマンティッククラスに属する新しいエンティティを特定することを目的としている。
従来の手法では、ターゲットの微細なセマンティッククラスを表現するために正のシードエンティティのみに依存しており、超微粒なセマンティッククラスを表現するのが困難であった。
具体的には、単に正のシードエンティティに依存するだけで、2つの固有の欠点が生じる。
(i)超きめ細かい意味クラス間のあいまいさ。
(ii) ``unwanted'のセマンティクスを定義することができない。
したがって、従来のESE法は超微細なESE(Ultra-ESE)課題に対処するのに苦労する。
この問題を解決するために、まず入力に負のシードエンティティを導入し、正のシードエンティティを持つ超微細なセマンティッククラスを共同で記述する。
負の種実体は、正の属性と負の属性の対比を提供することによって意味的曖昧さを排除している。
一方、これは ``unwanted'' を簡潔に表現する方法を提供する。
また,Ultra-ESEのモデル性能を評価し,さらなる研究を促進するために,Ultra-ESEに適した最初の大規模データセットであるUltraWikiを構築した。
UltraWikiには50,973個のエンティティと394,097個の文があり、さらに236個の超微細なセマンティッククラスがあり、各クラスは3,5個の正のシードエンティティと負のシードエンティティで表現されている。
さらに,検索ベースのフレームワークRetExpanと世代ベースのフレームワークGenExpanを提案し,Ultra-ESEの強力なベースラインを提供する。
さらに,モデルによる超きめ細かな実体の意味の理解を強化するための2つの戦略を考案した。
また,提案手法の有効性を確認し,Ultra-ESEに改善の余地があることも明らかにした。
関連論文リスト
- Bidirectional Logits Tree: Pursuing Granularity Reconcilement in Fine-Grained Classification [89.20477310885731]
本稿では,粒度分類タスクにおけるグラニュラリティコンペティションの課題について述べる。
既存のアプローチは通常、共通のベースエンコーダから抽出された共有特徴に基づいて、独立した階層認識モデルを開発する。
グラニュラリティ再構成のための双方向ロジットツリー(BiLT)と呼ばれる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-17T10:42:19Z) - Tackling Ambiguity from Perspective of Uncertainty Inference and Affinity Diversification for Weakly Supervised Semantic Segmentation [12.308473939796945]
画像レベルのラベルを持つ弱教師付きセマンティックセマンティックセグメンテーション(WSSS)は、退屈なアノテーションを使わずに高密度なタスクを実現することを目的としている。
WSSSの性能、特にクラス活性化マップ(CAM)の生成と擬似マスクの精製の段階では、あいまいさに悩まされている。
統一された単一ステージWSSSフレームワークであるUniAを提案し、不確実性推論と親和性多様化の観点からこの問題に対処する。
論文 参考訳(メタデータ) (2024-04-12T01:54:59Z) - GroupContrast: Semantic-aware Self-supervised Representation Learning for 3D Understanding [66.5538429726564]
自己教師付き3D表現学習は、大規模未ラベルの点群から効果的な表現を学習することを目的としている。
本稿では,セグメンテーションとセマンティック・アウェア・コントラッシブ・ラーニングを組み合わせた新しいアプローチであるGroupContrastを提案する。
論文 参考訳(メタデータ) (2024-03-14T17:59:59Z) - Syntax and Semantics Meet in the "Middle": Probing the Syntax-Semantics
Interface of LMs Through Agentivity [68.8204255655161]
このような相互作用を探索するためのケーススタディとして,作用性のセマンティックな概念を提示する。
これは、LMが言語アノテーション、理論テスト、発見のためのより有用なツールとして役立つ可能性を示唆している。
論文 参考訳(メタデータ) (2023-05-29T16:24:01Z) - Advancing Incremental Few-shot Semantic Segmentation via Semantic-guided
Relation Alignment and Adaptation [98.51938442785179]
増分的な数ショットセマンティックセマンティックセマンティクスは、セマンティクスセマンティクスモデルを新しいクラスに漸進的に拡張することを目的としている。
このタスクは、データ不均衡のため、ベースクラスと新しいクラスの間で深刻な意味認識の問題に直面します。
本稿では,従来の意味情報のガイダンスを完全に考慮した意味誘導型関係調整適応法を提案する。
論文 参考訳(メタデータ) (2023-05-18T10:40:52Z) - Semantic-aware Contrastive Learning for More Accurate Semantic Parsing [32.74456368167872]
そこで本研究では,意味表現の微粒化を学習できる意味認識型コントラスト学習アルゴリズムを提案する。
2つの標準データセットの実験により、我々の手法はMLEベースラインよりも大幅に改善されていることが示された。
論文 参考訳(メタデータ) (2023-01-19T07:04:32Z) - Contrastive Learning with Hard Negative Entities for Entity Set
Expansion [29.155036098444008]
様々なNLPおよびIRアプリケーションは、知識を発見する能力により、ESEの恩恵を受けるだろう。
我々は、エンティティの表現を洗練させるために、コントラスト学習を伴うエンティティレベルのマスキング言語モデルを考案する。
さらに、上記の言語モデルによって得られたエンティティ表現を利用してエンティティを拡張する新しい確率的ESEフレームワークであるProbExpanを提案する。
論文 参考訳(メタデータ) (2022-04-16T12:26:42Z) - Hyperbolic Disentangled Representation for Fine-Grained Aspect
Extraction [5.545062009366532]
HDAEは、ユーザーレビューのための双曲型アンタングルアスペクト抽出器である。
Amazonの製品レビューとレストランレビューデータセットでは、平均F1パフォーマンスが18.2%、24.1%向上している。
論文 参考訳(メタデータ) (2021-12-16T21:47:28Z) - Deep Clustering by Semantic Contrastive Learning [67.28140787010447]
Semantic Contrastive Learning (SCL) と呼ばれる新しい変種を紹介します。
従来のコントラスト学習とディープクラスタリングの両方の特徴を探求する。
コントラスト学習と深層クラスタリングの強みを統一的なアプローチで増幅することができる。
論文 参考訳(メタデータ) (2021-03-03T20:20:48Z) - On graded semantics of abstract argumentation: Extension-based case [0.0]
本稿では,抽象的議論フレームワーク(AAF)における拡張型意味論の課題について考察する。
代替基本補題が与えられ、[1]で得られた対応する結果を一般化する。
コンフリクトフリー、許容可能、完全、安定のセマンティクスを含む、AFの基本的なセマンティクスは、リミット・ミート・モジュロ・アン・ウルトラフィルタの下で閉じられていることが示されている。
論文 参考訳(メタデータ) (2020-12-19T04:32:19Z) - Empower Entity Set Expansion via Language Model Probing [58.78909391545238]
既存の拡張方法は、コンテキスト特徴を適応的に選択し、新しいエンティティを抽出することで、シードエンティティをブートストラップする。
エンティティセット拡張の鍵となる課題は、クラスセマンティクスをシフトし、後のイテレーションで累積エラーにつながる曖昧なコンテキスト機能を選択することを避けることである。
セマンティックドリフト問題に対処するために、自動生成されたクラス名を活用する新しい反復的集合拡張フレームワークを提案する。
論文 参考訳(メタデータ) (2020-04-29T00:09:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。