論文の概要: Prompt-tuning with Attribute Guidance for Low-resource Entity Matching
- arxiv url: http://arxiv.org/abs/2603.19321v1
- Date: Tue, 17 Mar 2026 03:09:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 19:48:38.792843
- Title: Prompt-tuning with Attribute Guidance for Low-resource Entity Matching
- Title(参考訳): 低リソースエンティティマッチングのための属性誘導によるPrompt-tuning
- Authors: Lihui Liu, Carl Yang,
- Abstract要約: 本稿では,属性レベルのプロンプトチューニングと論理的推論を通じてEMに取り組む包括的ソリューションであるProMPTATTRIBを紹介する。
ProMPTATTRIBはエンティティレベルと属性レベルの両方のプロンプトを使用して、よりリッチなコンテキスト情報を組み込む。
また、SimCSEにインスパイアされたソフトプロンプトにドロップアウトベースのコントラスト学習を統合し、EMパフォーマンスをさらに向上させる。
- 参考スコア(独自算出の注目度): 19.80644891027441
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Entity Matching (EM) is an important task that determines the logical relationship between two entities, such as Same, Different, or Undecidable. Traditional EM approaches rely heavily on supervised learning, which requires large amounts of high-quality labeled data. This labeling process is both time-consuming and costly, limiting practical applicability. As a result, there is a strong need for low-resource EM methods that can perform well with minimal labeled data. Recent prompt-tuning approaches have shown promise for low-resource EM, but they mainly focus on entity-level matching and often overlook critical attribute-level information. In addition, these methods typically lack interpretability and explainability. To address these limitations, this paper introduces PROMPTATTRIB, a comprehensive solution that tackles EM through attribute-level prompt tuning and logical reasoning. PROMPTATTRIB uses both entity-level and attribute-level prompts to incorporate richer contextual information and employs fuzzy logic formulas to infer the final matching label. By explicitly considering attributes, the model gains a deeper understanding of the entities, resulting in more accurate matching. Furthermore, PROMPTATTRIB integrates dropout-based contrastive learning on soft prompts, inspired by SimCSE, which further boosts EM performance. Extensive experiments on real-world datasets demonstrate the effectiveness of PROMPTATTRIB.
- Abstract(参考訳): エンティティマッチング(EM)は、同じ、異なる、決定不可能な2つのエンティティ間の論理的関係を決定する重要なタスクである。
従来のEMアプローチは、大量の高品質なラベル付きデータを必要とする教師付き学習に大きく依存している。
このラベル付けプロセスは、時間とコストの両方を消費し、実用的な適用性を制限する。
その結果、最小限のラベル付きデータでうまく機能する低リソースのEMメソッドが強く求められている。
最近のプロンプトチューニングアプローチは、低リソースEMを約束しているが、主にエンティティレベルのマッチングに焦点を当てており、しばしば重要な属性レベルの情報を見落としている。
加えて、これらの手法は一般的に解釈可能性と説明可能性に欠ける。
これらの制約に対処するために,属性レベルのプロンプトチューニングと論理的推論を通じてEMに取り組む包括的ソリューションであるProMPTATTRIBを紹介する。
PROMPTATTRIBは、エンティティレベルと属性レベルの両方のプロンプトを使用して、よりリッチなコンテキスト情報を取り込み、ファジィ論理式を用いて最終的なマッチングラベルを推測する。
属性を明示的に考慮することで、モデルはエンティティをより深く理解し、より正確なマッチングをもたらす。
さらに、PROMPTATTRIBは、SimCSEにインスパイアされたソフトプロンプトに、ドロップアウトに基づくコントラスト学習を統合し、EMパフォーマンスをさらに向上させる。
実世界のデータセットに関する大規模な実験は、ProMPTATTRIBの有効性を実証している。
関連論文リスト
- COMM:Concentrated Margin Maximization for Robust Document-Level Relation Extraction [5.291403671224172]
文書レベルの関係抽出(DocRE)は、文書内の複数の文にまたがるエンティティ間の関係を識別し、抽出するプロセスである。
DocREに固有の複雑さにより、ラベル付けプロセスはエラーを起こしやすくなり、正の関係サンプルの極端に親和性がある。
DocREをよりよく解くために,textittextbfCOMMという堅牢なフレームワークを開発した。
論文 参考訳(メタデータ) (2025-03-18T04:31:57Z) - Harnessing Large Language Models for Knowledge Graph Question Answering via Adaptive Multi-Aspect Retrieval-Augmentation [81.18701211912779]
本稿では,KG(Amar)フレームワーク上での適応型マルチアスペクト検索手法を提案する。
この方法は、エンティティ、リレーション、サブグラフを含む知識を検索し、検索した各テキストを即時埋め込みに変換する。
提案手法は2つの共通データセットに対して最先端の性能を達成した。
論文 参考訳(メタデータ) (2024-12-24T16:38:04Z) - Web-Scale Visual Entity Recognition: An LLM-Driven Data Approach [56.55633052479446]
Webスケールのビジュアルエンティティ認識は、クリーンで大規模なトレーニングデータがないため、重大な課題を呈している。
本稿では,ラベル検証,メタデータ生成,合理性説明に多モーダル大言語モデル(LLM)を活用することによって,そのようなデータセットをキュレートする新しい手法を提案する。
実験により、この自動キュレートされたデータに基づいてトレーニングされたモデルは、Webスケールの視覚的エンティティ認識タスクで最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2024-10-31T06:55:24Z) - Ground Truth Inference for Weakly Supervised Entity Matching [76.6732856489872]
弱監督タスクのための単純だが強力なラベル付けモデルを提案する。
次に、エンティティマッチングのタスクに特化してラベルモデルを調整します。
その結果,従来の手法よりもF1スコアが9%高い結果が得られた。
論文 参考訳(メタデータ) (2022-11-13T17:57:07Z) - QUEACO: Borrowing Treasures from Weakly-labeled Behavior Data for Query
Attribute Value Extraction [57.56700153507383]
本稿では,QUEACOというEコマース検索におけるクエリ属性値の統一抽出システムを提案する。
NER フェーズでは、QUEACO は教師-学生ネットワークを採用し、強くラベル付けされたデータに基づいてトレーニングされた教師ネットワークが擬似ラベルを生成する。
AVN フェーズでは、弱いラベル付けされたクエリ・ツー・アトリビュート・ビヘイビア・データを利用して、クエリーから表層属性値の正規化を行い、製品から標準形式へと変換する。
論文 参考訳(メタデータ) (2021-08-19T03:24:23Z) - Interpretable and Low-Resource Entity Matching via Decoupling Feature
Learning from Decision Making [22.755892575582788]
Entity Matchingは、同じ現実世界のオブジェクトを表すエンティティレコードを認識することを目的としている。
異種情報融合(HIF)とキー属性ツリー(KAT)誘導からなる新しいEMフレームワークを提案する。
提案手法は効率が高く,ほとんどの場合SOTA EMモデルより優れている。
論文 参考訳(メタデータ) (2021-06-08T08:27:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。