論文の概要: Crowdsourced Collective Entity Resolution with Relational Match
Propagation
- arxiv url: http://arxiv.org/abs/2002.09361v1
- Date: Fri, 21 Feb 2020 15:33:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-30 01:36:59.230466
- Title: Crowdsourced Collective Entity Resolution with Relational Match
Propagation
- Title(参考訳): リレーショナルマッチング伝搬を用いたクラウドソース集合エンティティ分解
- Authors: Jiacheng Huang and Wei Hu and Zhifeng Bao and Yuzhong Qu
- Abstract要約: 我々はクラウドソーシング集団ERと呼ばれる新しいアプローチを提案する。
それは、人間の労働者に、選択されたエンティティペアをラベル付けするよう繰り返し要求し、そのラベル付け情報を隣人に遠隔で伝達する。
実世界のデータセットに対する我々の実験は、最先端の手法と比較すると、我々の手法はラベル付けよりもはるかに少ない精度で達成できることを示した。
- 参考スコア(独自算出の注目度): 35.791846152809406
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Knowledge bases (KBs) store rich yet heterogeneous entities and facts. Entity
resolution (ER) aims to identify entities in KBs which refer to the same
real-world object. Recent studies have shown significant benefits of involving
humans in the loop of ER. They often resolve entities with pairwise similarity
measures over attribute values and resort to the crowds to label uncertain
ones. However, existing methods still suffer from high labor costs and
insufficient labeling to some extent. In this paper, we propose a novel
approach called crowdsourced collective ER, which leverages the relationships
between entities to infer matches jointly rather than independently.
Specifically, it iteratively asks human workers to label picked entity pairs
and propagates the labeling information to their neighbors in distance. During
this process, we address the problems of candidate entity pruning,
probabilistic propagation, optimal question selection and error-tolerant truth
inference. Our experiments on real-world datasets demonstrate that, compared
with state-of-the-art methods, our approach achieves superior accuracy with
much less labeling.
- Abstract(参考訳): 知識ベース(kbs)は豊かだが異質なエンティティや事実を格納する。
エンティティ解決(ER)は、同じ現実世界のオブジェクトを参照するKB内のエンティティを識別することを目的としている。
近年の研究では、ERのループにヒトを巻き込むという大きな利点が示されている。
彼らはしばしば属性値よりも一対の類似性によってエンティティを解決し、不確かさをラベル付けるために群衆に頼る。
しかし、既存の方法は高い労働コストとある程度のラベル付けに悩まされている。
本稿では,相互関係を独立ではなく相互に推論する,クラウドソーシング型集団型erという新しい手法を提案する。
具体的には、人間労働者に対して、選択されたエンティティペアをラベル付けし、そのラベル情報を隣人に遠ざけるように繰り返し要求する。
このプロセスでは、候補となるエンティティのプルーニング、確率的伝播、最適な質問選択、誤り耐性の真理推論といった問題に対処する。
実世界のデータセットに対する我々の実験は、最先端の手法と比較すると、我々の手法はラベル付けよりもはるかに少ない精度で達成できることを示した。
関連論文リスト
- The Battleship Approach to the Low Resource Entity Matching Problem [0.0]
本稿では,エンティティマッチング問題に対する新しいアクティブな学習手法を提案する。
我々は、エンティティマッチングのユニークな特性を利用する選択メカニズムに焦点を当てる。
実験により,提案アルゴリズムは,最先端のアクティブ・ラーニング・ソリューションより低リソース・エンティティ・マッチングに優れることを示した。
論文 参考訳(メタデータ) (2023-11-27T10:18:17Z) - Distantly-Supervised Joint Extraction with Noise-Robust Learning [36.23022433465051]
我々は、知識ベース(KB)を用いてエンティティの言及を対応するエンティティと関係タグに整合させることによりラベルを生成する遠隔ラベル付きデータにおける共同抽出の問題に焦点をあてる。
既存のアプローチは、ノイズの1つの源のみを考慮するか、外部知識を使って決定を行うかのどちらかであり、トレーニングデータにおいて重要な情報を十分に活用することはできない。
本稿では,軽量トランスフォーマーバックボーンを結合タグ付けのためのシーケンスラベリング方式に組み込んだ一般化可能なフレームワークDENRLを提案する。
論文 参考訳(メタデータ) (2023-10-08T03:42:15Z) - Jointprop: Joint Semi-supervised Learning for Entity and Relation
Extraction with Heterogeneous Graph-based Propagation [13.418617500641401]
共同半教師付きエンティティと関係抽出のための不均一グラフに基づく伝搬フレームワークであるJointpropを提案する。
我々は、エンティティと関係候補から統一されたスパンベースのヘテロジニアスグラフを構築し、信頼度スコアに基づいてクラスラベルを伝搬する。
我々はNERおよびREタスクにおける最先端の半教師付きアプローチよりも優れた性能を示す。
論文 参考訳(メタデータ) (2023-05-25T09:07:04Z) - Fairness and Bias in Truth Discovery Algorithms: An Experimental
Analysis [7.575734557466221]
群衆労働者は信頼できないラベルを提供することもある。
真理探索(TD)アルゴリズムを用いて、競合するワーカー応答からコンセンサスラベルを決定する。
我々はTDアルゴリズムのバイアスと公平性を体系的に研究する。
論文 参考訳(メタデータ) (2023-04-25T04:56:35Z) - Nested Named Entity Recognition from Medical Texts: An Adaptive Shared
Network Architecture with Attentive CRF [53.55504611255664]
ネスト現象によるジレンマを解決するために,ASACと呼ばれる新しい手法を提案する。
提案手法は,適応共有(AS)部と注意条件付きランダムフィールド(ACRF)モジュールの2つの鍵モジュールを含む。
我々のモデルは、異なるカテゴリのエンティティ間の暗黙の区別と関係をキャプチャすることで、より良いエンティティ表現を学ぶことができる。
論文 参考訳(メタデータ) (2022-11-09T09:23:56Z) - Relational Proxies: Emergent Relationships as Fine-Grained
Discriminators [52.17542855760418]
本稿では,オブジェクトのグローバル部分とローカル部分の間の情報を利用してラベルを符号化する手法を提案する。
我々は、理論的な結果に基づいてプロキシを設計し、7つの挑戦的なきめ細かいベンチマークデータセットに基づいて評価する。
また、この理論を実験的に検証し、複数のベンチマークで一貫した結果を得る。
論文 参考訳(メタデータ) (2022-10-05T11:08:04Z) - Exploiting Global Semantic Similarities in Knowledge Graphs by
Relational Prototype Entities [55.952077365016066]
実証的な観察では、頭と尾のエンティティが同じ関係で結ばれている場合、しばしば同様の意味的属性を共有する。
我々は、textittextbfrelational prototype entityと呼ばれる仮想ノードのセットを導入する新しいアプローチを提案する。
エンティティの埋め込みを、関連するプロトタイプの埋め込みに近づけることで、私たちのアプローチは、エンティティのグローバルな意味的類似性を効果的に促進できる。
論文 参考訳(メタデータ) (2022-06-16T09:25:33Z) - Part-based Pseudo Label Refinement for Unsupervised Person
Re-identification [29.034390810078172]
教師なしの人物再識別(re-ID)は、ラベルなしデータから人物検索のための識別表現を学習することを目的としている。
近年の手法では擬似ラベルを用いることでこの課題が達成されているが,これらのラベルは本質的にノイズが多く,精度が低下している。
本稿では,グローバルな特徴と部分的特徴の相補関係を利用して,ラベルノイズを低減するPseudo Label Refinement (PPLR) フレームワークを提案する。
論文 参考訳(メタデータ) (2022-03-28T12:15:53Z) - Knowledge-Rich Self-Supervised Entity Linking [58.838404666183656]
Knowledge-RIch Self-Supervision(KRISSBERT$)は400万のUMLSエンティティのためのユニバーサルエンティティリンカーである。
提案手法はゼロショット法と少数ショット法を仮定し,利用可能であればエンティティ記述やゴールドレファレンスラベルを簡単に組み込むことができる。
ラベル付き情報を一切使わずに400万のUMLSエンティティのためのユニバーサルエンティティリンカである$tt KRISSBERT$を生成する。
論文 参考訳(メタデータ) (2021-12-15T05:05:12Z) - Cross-Supervised Joint-Event-Extraction with Heterogeneous Information
Networks [61.950353376870154]
Joint-event- Extractは、トリガとエンティティのタグからなるタグセットを備えたシーケンスからシーケンスまでのラベリングタスクである。
トリガやエンティティの抽出を交互に監督するクロススーパーバイザードメカニズム(CSM)を提案する。
我々の手法は、エンティティとトリガー抽出の両方において最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2020-10-13T11:51:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。