論文の概要: Entity Alignment with Unlabeled Dangling Cases
- arxiv url: http://arxiv.org/abs/2403.10978v1
- Date: Sat, 16 Mar 2024 17:21:58 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-19 20:46:34.649878
- Title: Entity Alignment with Unlabeled Dangling Cases
- Title(参考訳): ラベル付きダンピングケースを用いたエンティティアライメント
- Authors: Hang Yin, Dong Ding, Liyao Xiang, Yuheng He, Yihan Wu, Xinbing Wang, Chenghu Zhou,
- Abstract要約: 本稿では,新しいGNNに基づくダングリング検出とエンティティアライメントフレームワークを提案する。
2つのタスクは同じGNNを共有するが、検出されたダングリングエンティティはアライメントで削除される。
このフレームワークは,表現学習における選択的近傍集約のための設計された実体と関係性注意機構によって特徴付けられる。
- 参考スコア(独自算出の注目度): 49.86384156476041
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We investigate the entity alignment problem with unlabeled dangling cases, meaning that there are entities in the source or target graph having no counterparts in the other, and those entities remain unlabeled. The problem arises when the source and target graphs are of different scales, and it is much cheaper to label the matchable pairs than the dangling entities. To solve the issue, we propose a novel GNN-based dangling detection and entity alignment framework. While the two tasks share the same GNN and are trained together, the detected dangling entities are removed in the alignment. Our framework is featured by a designed entity and relation attention mechanism for selective neighborhood aggregation in representation learning, as well as a positive-unlabeled learning loss for an unbiased estimation of dangling entities. Experimental results have shown that each component of our design contributes to the overall alignment performance which is comparable or superior to baselines, even if the baselines additionally have 30\% of the dangling entities labeled as training data.
- Abstract(参考訳): 我々は、ラベルのないダングリングケースによるエンティティアライメントの問題について検討する。つまり、ソースグラフやターゲットグラフには、もう一方のエンティティを持たないエンティティが存在し、それらのエンティティはラベル付けされていないままである。
この問題は、ソースグラフとターゲットグラフが異なるスケールであるときに起こり、マッチ可能なペアをダングリングエンティティよりもずっと安くラベル付けることができる。
そこで本研究では,新しいGNNに基づくダングリング検出とエンティティアライメントフレームワークを提案する。
2つのタスクは同じGNNを共有し、一緒に訓練されるが、検出されたダングリングエンティティはアライメントで削除される。
本フレームワークは,表現学習における選択的近傍集約のための設計された実体と関係性注意機構と,非偏見的実体推定のための正の未ラベル学習損失を特徴とする。
実験結果から,ベースラインがトレーニングデータとしてラベル付けされたダングリングエンティティの30%を付加しても,設計の各コンポーネントがベースラインに匹敵するあるいは優越するアライメント性能に寄与することが判明した。
関連論文リスト
- Unsupervised Robust Cross-Lingual Entity Alignment via Neighbor Triple Matching with Entity and Relation Texts [17.477542644785483]
言語間エンティティアライメント(EA)は、異なる言語間での複数の知識グラフ(KG)の統合を可能にする。
近隣の3重マッチング戦略により、エンティティレベルとリレーレベルアライメントを共同で実行するEAパイプライン。
論文 参考訳(メタデータ) (2024-07-22T12:25:48Z) - Provable Optimization for Adversarial Fair Self-supervised Contrastive Learning [49.417414031031264]
本稿では,自己教師型学習環境におけるフェアエンコーダの学習について検討する。
すべてのデータはラベル付けされておらず、そのごく一部だけが機密属性で注釈付けされている。
論文 参考訳(メタデータ) (2024-06-09T08:11:12Z) - Unraveling the Impact of Heterophilic Structures on Graph Positive-Unlabeled Learning [71.9954600831939]
実世界の多くのシナリオにおいて、肯定的無ラベル(PU)学習は不可欠であるが、そのグラフデータへの応用は未探索のままである。
グラフ上でのPU学習において重要な課題がエッジヘテロフィリーにあり、クラスプライア推定の既約性前提に直接違反していることを明らかにする。
この課題に対応するために,ラベル伝搬損失(GPL)を用いたグラフPU学習という新しい手法を導入する。
論文 参考訳(メタデータ) (2024-05-30T10:30:44Z) - Robust Representation Learning for Unreliable Partial Label Learning [86.909511808373]
部分ラベル学習(Partial Label Learning, PLL)は、弱い教師付き学習の一種で、各トレーニングインスタンスに候補ラベルのセットが割り当てられる。
これはUn Reliable partial Label Learning (UPLL) と呼ばれ、部分ラベルの本質的な信頼性の欠如とあいまいさにより、さらなる複雑さをもたらす。
本研究では,信頼できない部分ラベルに対するモデル強化を支援するために,信頼性に欠けるコントラスト学習を活用するUnreliability-Robust Representation Learning framework(URRL)を提案する。
論文 参考訳(メタデータ) (2023-08-31T13:37:28Z) - LightEA: A Scalable, Robust, and Interpretable Entity Alignment
Framework via Three-view Label Propagation [27.483109233276632]
既存のGNNベースのEAメソッドは、ニューラルネットワークの系統から生まれてくる欠陥を継承している、と我々は主張する。
我々は,(i)ランダム直交ラベル生成,(ii)3ビューラベル伝搬,(iii)スパースシンクホーンイテレーションという3つの効率的なコンポーネントからなる非神経EAフレームワーク-LightEAを提案する。
公開データセットに関する広範な実験によると、LightEAは印象的なスケーラビリティ、堅牢性、解釈可能性を持っている。
論文 参考訳(メタデータ) (2022-10-19T10:07:08Z) - Optimizing Bi-Encoder for Named Entity Recognition via Contrastive
Learning [80.36076044023581]
名前付きエンティティ認識(NER)のための効率的なバイエンコーダフレームワークを提案する。
我々はNERを、エンティティ参照のベクトル表現とその型との類似性を最大化する計量学習問題とみなす。
NERのこのバイエンコーダの定式化における大きな課題は、エンティティの言及から非エンゲージスを分離することにある。
論文 参考訳(メタデータ) (2022-08-30T23:19:04Z) - Nested Named Entity Recognition as Latent Lexicalized Constituency
Parsing [29.705133932275892]
最近(Fu et al, 2021)は、ネストされたNERに取り組むために、スパンベースの選挙区に適応している。
本研究では, より表現力のある構造, 語彙化された選挙区木を用いて, 成分がキーワードでアノテートされる。
我々はアイズナー・サッタのアルゴリズムを有効活用し,部分的辺縁化と推論を効率的に行う。
論文 参考訳(メタデータ) (2022-03-09T12:02:59Z) - ActiveEA: Active Learning for Neural Entity Alignment [31.212894129845093]
エンティティアライメント(EA)は、異なる知識グラフ(KG)間で同等のエンティティをマッチングすることを目的としている。
現在の主流の手法であるニューラルEAモデルは、シードアライメントによるトレーニング、すなわち、事前整合したエンティティペアのセットに依存しています。
我々は、神経EAのための新しいアクティブラーニング(AL)フレームワークを考案し、非常に有意義なシードアライメントを作ることを目指している。
論文 参考訳(メタデータ) (2021-10-13T03:38:04Z) - Towards Entity Alignment in the Open World: An Unsupervised Approach [29.337157862514204]
これは知識のカバレッジと品質を高めるために知識グラフ(kgs)を統合する上で重要なステップである。
最先端のソリューションは、モデルトレーニングにラベル付きデータに頼る傾向があります。
オープンな世界でエンティティアライメントを行う監視されていないフレームワークを提供します。
論文 参考訳(メタデータ) (2021-01-26T03:10:24Z) - Structured Prediction with Partial Labelling through the Infimum Loss [85.4940853372503]
弱い監督の目標は、収集コストの安いラベル付け形式のみを使用してモデルを学習できるようにすることである。
これは、各データポイントに対して、実際のものを含むラベルのセットとして、監督がキャストされる不完全なアノテーションの一種です。
本稿では、構造化された予測と、部分的なラベリングを扱うための無限損失の概念に基づく統一的なフレームワークを提供する。
論文 参考訳(メタデータ) (2020-03-02T13:59:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。