論文の概要: Proxy-based Zero-Shot Entity Linking by Effective Candidate Retrieval
- arxiv url: http://arxiv.org/abs/2301.13318v1
- Date: Mon, 30 Jan 2023 22:43:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-01 18:17:33.639709
- Title: Proxy-based Zero-Shot Entity Linking by Effective Candidate Retrieval
- Title(参考訳): 効果的な候補検索によるプロキシベースゼロショットエンティティリンク
- Authors: Maciej Wiatrak, Eirini Arvaniti, Angus Brayne, Jonas Vetterle, Aaron
Sim
- Abstract要約: 本稿では, 逆正則化器とプロキシベースのメトリック学習損失のペアリングが, 候補探索段階における強負サンプリングの効率的な代替手段となることを示す。
特に、リコール@1メートル法で競合性能を示すため、高価な候補ランキングのステップを除外するオプションを提供する。
- 参考スコア(独自算出の注目度): 3.1498833540989413
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A recent advancement in the domain of biomedical Entity Linking is the
development of powerful two-stage algorithms, an initial candidate retrieval
stage that generates a shortlist of entities for each mention, followed by a
candidate ranking stage. However, the effectiveness of both stages are
inextricably dependent on computationally expensive components. Specifically,
in candidate retrieval via dense representation retrieval it is important to
have hard negative samples, which require repeated forward passes and nearest
neighbour searches across the entire entity label set throughout training. In
this work, we show that pairing a proxy-based metric learning loss with an
adversarial regularizer provides an efficient alternative to hard negative
sampling in the candidate retrieval stage. In particular, we show competitive
performance on the recall@1 metric, thereby providing the option to leave out
the expensive candidate ranking step. Finally, we demonstrate how the model can
be used in a zero-shot setting to discover out of knowledge base biomedical
entities.
- Abstract(参考訳): バイオメディカルエンティティリンクの分野における最近の進歩は、2段階の強力なアルゴリズムの開発である。
しかし、両方のステージの有効性は計算量的に高価なコンポーネントに依存する。
特に、濃密な表現検索による候補検索では、トレーニングを通してエンティティラベルセット全体にわたって繰り返し前方通過と近接探索を必要とする、ハードネガティブなサンプルを持つことが重要である。
本研究は,プロキシベースのメトリック学習損失と敵対的正規化子を組み合わせることで,候補検索段階におけるハードネガティブサンプリングの効率的な代替となることを示す。
特に、recall@1メトリックで競争力のあるパフォーマンスを示し、高価な候補ランキングステップを除外するオプションを提供します。
最後に,このモデルがゼロショット設定でどのように利用され,知識ベースから生物医学的実体を見出すかを示す。
関連論文リスト
- Unified Examination of Entity Linking in Absence of Candidate Sets [3.55026004901472]
本稿では,エンティティリンクの性能に及ぼす候補集合の影響について,アブレーション研究を用いて検討する。
制約の少ない候補集合間のトレードオフ、推論時間の増加、いくつかのモデルのメモリフットプリントを示す。
論文 参考訳(メタデータ) (2024-04-17T04:37:58Z) - Are We Wasting Time? A Fast, Accurate Performance Evaluation Framework
for Knowledge Graph Link Predictors [4.31947784387967]
より大規模な知識グラフでは、ランク付けプロセスは急速に重くなります。
従来のアプローチでは、エンティティのランダムサンプリングを使用して、メソッドによって予測または提案されるリンクの品質を評価していた。
得られた評価基準が真の結果を適切に反映していないため,本手法には深刻な限界があることが示されている。
本稿では,リレーショナルリコメンデータを用いて候補の選択を誘導するフレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-25T15:44:46Z) - Noisy Correspondence Learning with Self-Reinforcing Errors Mitigation [63.180725016463974]
クロスモーダル検索は、実際は精力的な、十分に整合した大規模データセットに依存している。
我々は、新しい雑音対応学習フレームワーク、textbfSelf-textbfReinforcing textbfErrors textbfMitigation(SREM)を導入する。
論文 参考訳(メタデータ) (2023-12-27T09:03:43Z) - The Battleship Approach to the Low Resource Entity Matching Problem [0.0]
本稿では,エンティティマッチング問題に対する新しいアクティブな学習手法を提案する。
我々は、エンティティマッチングのユニークな特性を利用する選択メカニズムに焦点を当てる。
実験により,提案アルゴリズムは,最先端のアクティブ・ラーニング・ソリューションより低リソース・エンティティ・マッチングに優れることを示した。
論文 参考訳(メタデータ) (2023-11-27T10:18:17Z) - A Read-and-Select Framework for Zero-shot Entity Linking [33.15662306409253]
本稿では、エンティティの曖昧さの主成分をモデル化し、リード・アンド・セレクト(ReS)フレームワークを提案する。
提案手法は,確立されたゼロショットエンティティリンクデータセットであるZESHELに対して,2.55%のマイクロ平均精度向上を実現している。
論文 参考訳(メタデータ) (2023-10-19T04:08:10Z) - Neighbour Consistency Guided Pseudo-Label Refinement for Unsupervised
Person Re-Identification [80.98291772215154]
教師なしの人物再識別(ReID)は、アノテーションを使わずに人物検索のための識別的アイデンティティの特徴を学習することを目的としている。
近年の進歩はクラスタリングに基づく擬似ラベルを活用することで実現されている。
本稿では, Pseudo Label Refinement フレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-30T09:39:57Z) - Detection, Disambiguation, Re-ranking: Autoregressive Entity Linking as
a Multi-Task Problem [46.028180604304985]
本稿では,2つの補助的なタスクで訓練された自己回帰エンティティリンクモデルを提案する。
我々は,2つの補助課題のそれぞれがパフォーマンスを向上し,再ランク付けが増加の重要な要因であることをアブレーション研究を通して示す。
論文 参考訳(メタデータ) (2022-04-12T17:55:22Z) - Diverse Knowledge Distillation for End-to-End Person Search [81.4926655119318]
人物検索は、画像ギャラリーから特定の人物をローカライズし識別することを目的としている。
最近の手法は2つのグループ、すなわち2段階とエンドツーエンドのアプローチに分類できる。
ボトルネックを解消するために、多様な知識蒸留を備えたシンプルで強力なエンドツーエンドネットワークを提案します。
論文 参考訳(メタデータ) (2020-12-21T09:04:27Z) - Minimax Active Learning [61.729667575374606]
アクティブラーニングは、人間のアノテーションによってラベル付けされる最も代表的なサンプルをクエリすることによって、ラベル効率の高いアルゴリズムを開発することを目指している。
現在のアクティブラーニング技術は、最も不確実なサンプルを選択するためにモデルの不確実性に頼るか、クラスタリングを使うか、最も多様なラベルのないサンプルを選択するために再構築する。
我々は,不確実性と多様性を両立させる半教師付きミニマックスエントロピーに基づく能動学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-12-18T19:03:40Z) - Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking
Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。
学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。
本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-15T10:08:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。