論文の概要: Evaluating Design Decisions for Dual Encoder-based Entity Disambiguation
- arxiv url: http://arxiv.org/abs/2505.11683v1
- Date: Fri, 16 May 2025 20:44:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:10.78106
- Title: Evaluating Design Decisions for Dual Encoder-based Entity Disambiguation
- Title(参考訳): デュアルエンコーダに基づくエンティティ曖昧化のための設計決定の評価
- Authors: Susanna Rücker, Alan Akbik,
- Abstract要約: 本稿では、文脈ラベルの動詞化と効率的なハードネガティブサンプリングを含む文書レベルのデュアルモデルを提案する。
AIDA-Yagoに関する総合的な実験は、我々のアプローチの有効性を検証する。
- 参考スコア(独自算出の注目度): 3.7279275358316535
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Entity disambiguation (ED) is the task of linking mentions in text to corresponding entries in a knowledge base. Dual Encoders address this by embedding mentions and label candidates in a shared embedding space and applying a similarity metric to predict the correct label. In this work, we focus on evaluating key design decisions for Dual Encoder-based ED, such as its loss function, similarity metric, label verbalization format, and negative sampling strategy. We present the resulting model VerbalizED, a document-level Dual Encoder model that includes contextual label verbalizations and efficient hard negative sampling. Additionally, we explore an iterative prediction variant that aims to improve the disambiguation of challenging data points. Comprehensive experiments on AIDA-Yago validate the effectiveness of our approach, offering insights into impactful design choices that result in a new State-of-the-Art system on the ZELDA benchmark.
- Abstract(参考訳): エンティティの曖昧さ (Entity Disambiguation, ED) は、テキスト内の参照を知識ベース内の対応するエントリにリンクするタスクである。
デュアルエンコーダは、参照とラベル候補を共有埋め込み空間に埋め込み、適切なラベルを予測するために類似度メトリクスを適用することで、この問題に対処する。
本研究では,その損失関数,類似度指標,ラベルの動詞化形式,負のサンプリング戦略など,デュアルエンコーダをベースとしたEDの鍵となる設計決定を評価することに焦点を当てる。
本稿では,文書レベルのデュアルエンコーダモデルであるVerbalizEDを提案する。
さらに,挑戦的なデータポイントの曖昧さを改善することを目的とした,反復予測のバリエーションについても検討する。
AIDA-Yagoに関する総合的な実験は、我々のアプローチの有効性を検証し、ZELDAベンチマークに新しいState-of-the-Artシステムをもたらす影響のある設計選択に関する洞察を提供する。
関連論文リスト
- Self-Training with Pseudo-Label Scorer for Aspect Sentiment Quad Prediction [54.23208041792073]
Aspect Sentiment Quad Prediction (ASQP) は、与えられたレビューに対して全てのクワッド(アスペクト項、アスペクトカテゴリー、意見項、感情極性)を予測することを目的としている。
ASQPタスクにおける重要な課題はラベル付きデータの不足であり、既存のメソッドのパフォーマンスを制限している。
そこで我々は,擬似ラベルスコアラーを用いた自己学習フレームワークを提案し,レビューと擬似ラベルの一致をスコアラーが評価する。
論文 参考訳(メタデータ) (2024-06-26T05:30:21Z) - Learnable Item Tokenization for Generative Recommendation [78.30417863309061]
LETTER (Larnable Tokenizer for generaTivE Recommendation) を提案する。
LETTERは、セマンティック正規化のためのResidual Quantized VAE、協調正規化のためのコントラストアライメント損失、コードの割り当てバイアスを軽減するための多様性損失を組み込んでいる。
論文 参考訳(メタデータ) (2024-05-12T15:49:38Z) - Coherent Entity Disambiguation via Modeling Topic and Categorical
Dependency [87.16283281290053]
従来のエンティティ曖昧化(ED)メソッドは、参照コンテキストと候補エンティティの一致するスコアに基づいて予測を行う、識別パラダイムを採用している。
本稿では,エンティティ予測のコヒーレンス向上を目的とした新しいデザインを備えたEDシステムであるCoherentedを提案する。
我々は、人気EDベンチマークにおいて、平均1.3F1ポイントの改善により、最先端の新たな結果を得る。
論文 参考訳(メタデータ) (2023-11-06T16:40:13Z) - Drawing the Same Bounding Box Twice? Coping Noisy Annotations in Object
Detection with Repeated Labels [6.872072177648135]
そこで本研究では,基礎的真理推定手法に適合する新しい局所化アルゴリズムを提案する。
また,本アルゴリズムは,TexBiGデータセット上でのトレーニングにおいて,優れた性能を示す。
論文 参考訳(メタデータ) (2023-09-18T13:08:44Z) - Towards Integration of Discriminability and Robustness for
Document-Level Relation Extraction [41.51148745387936]
ドキュメントレベルの関係抽出(DocRE)は、ドキュメント内の長距離コンテキスト依存推論に依存するエンティティペアの関係を予測する。
本研究では,DocRE問題に対する差別性とロバスト性の両方をよりよく統合することを目的としている。
エントロピーの最小化と教師付きコントラスト学習を革新的にカスタマイズする。
論文 参考訳(メタデータ) (2023-04-03T09:11:18Z) - Contrastive Test-Time Adaptation [83.73506803142693]
本稿では,自己指導型コントラスト学習を活用して特徴学習を支援する新しい手法を提案する。
擬似ラベルをオンラインで作成し、ターゲットのフィーチャースペースに最も近い隣人の間でソフト投票によってそれらを洗練します。
我々の手法であるAdaContrastは、主要なベンチマーク上で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-04-21T19:17:22Z) - Label Semantics for Few Shot Named Entity Recognition [68.01364012546402]
名前付きエンティティ認識におけるショットラーニングの問題について検討する。
我々は,ラベル名中の意味情報を,モデルに付加的な信号を与え,よりリッチな事前情報を与える手段として活用する。
本モデルは,第1エンコーダによって計算された名前付きエンティティの表現と,第2エンコーダによって計算されたラベル表現とを一致させることを学習する。
論文 参考訳(メタデータ) (2022-03-16T23:21:05Z) - Seeking Common but Distinguishing Difference, A Joint Aspect-based
Sentiment Analysis Model [43.4726612032584]
本稿では,エンコーダ共有の利点を享受するだけでなく,モデルの有効性向上にも焦点をあてる共同ABSAモデルを提案する。
具体的には、ペアエンコーダが特に候補アスペクト-オピニオン対の分類に重点を置いており、元のエンコーダはシーケンスラベリングに注意を払っている。
実験結果から,提案モデルが頑健性を示し,従来の4つのベンチマークデータセットよりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2021-11-18T11:24:48Z) - Uncertainty-Aware Annotation Protocol to Evaluate Deformable
Registration Algorithms [3.2845753359072125]
変形性登録における金規格構築のための原則的な戦略を紹介します。
i) 従来のアノテーションとの冗長性を考慮して、次に注釈をつけるための最も有益な場所を反復的に提案する; (ii) それぞれのアノテーションの空間的不確実性を考慮して、従来のポイントワイズアノテーションを拡張する; (iii) 自然に変形可能な登録アルゴリズムを評価するための新しい戦略を提供する。
論文 参考訳(メタデータ) (2021-04-02T19:31:19Z) - A Unified Dual-view Model for Review Summarization and Sentiment
Classification with Inconsistency Loss [51.448615489097236]
ユーザーレビューから正確な要約と感情を取得することは、現代のEコマースプラットフォームにとって不可欠な要素である。
本稿では,これら2つのタスクの性能を協調的に改善する新しいデュアルビューモデルを提案する。
異なる領域の4つの実世界のデータセットに対する実験結果から,本モデルの有効性が示された。
論文 参考訳(メタデータ) (2020-06-02T13:34:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。