論文の概要: Combating Confirmation Bias: A Unified Pseudo-Labeling Framework for Entity Alignment
- arxiv url: http://arxiv.org/abs/2307.02075v4
- Date: Wed, 02 Jul 2025 01:04:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-03 14:22:55.644294
- Title: Combating Confirmation Bias: A Unified Pseudo-Labeling Framework for Entity Alignment
- Title(参考訳): Combating Confirmation Bias: エンティティアライメントのための統一された擬似ラベルフレームワーク
- Authors: Qijie Ding, Jie Yin, Daokun Zhang, Junbin Gao,
- Abstract要約: エンティティアライメントのための統一擬似ラベルフレームワーク(UPL-EA)を提案する。
UPL-EAは、エンティティアライメントの精度を高めるために、擬似ラベルエラーを明示的に排除する。
以上の結果から,UPL-EAが15の競争ベースラインに優越していることが示唆された。
- 参考スコア(独自算出の注目度): 30.407534668054286
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Entity alignment (EA) aims at identifying equivalent entity pairs across different knowledge graphs (KGs) that refer to the same real-world identity. To circumvent the shortage of seed alignments provided for training, recent EA models utilize pseudo-labeling strategies to iteratively add unaligned entity pairs predicted with high confidence to the seed alignments for model training. However, the adverse impact of confirmation bias during pseudo-labeling has been largely overlooked, thus hindering entity alignment performance. To systematically combat confirmation bias for pseudo-labeling-based entity alignment, we propose a Unified Pseudo-Labeling framework for Entity Alignment (UPL-EA) that explicitly eliminates pseudo-labeling errors to boost the accuracy of entity alignment. UPL-EA consists of two complementary components: (1) Optimal Transport (OT)-based pseudo-labeling uses discrete OT modeling as an effective means to determine entity correspondences and reduce erroneous matches across two KGs. An effective criterion is derived to infer pseudo-labeled alignments that satisfy one-to-one correspondences; (2) Parallel pseudo-label ensembling refines pseudo-labeled alignments by combining predictions over multiple models independently trained in parallel. The ensembled pseudo-labeled alignments are thereafter used to augment seed alignments to reinforce subsequent model training for alignment inference. The effectiveness of UPL-EA in eliminating pseudo-labeling errors is both theoretically supported and experimentally validated. Our extensive results and in-depth analyses demonstrate the superiority of UPL-EA over 15 competitive baselines and its utility as a general pseudo-labeling framework for entity alignment.
- Abstract(参考訳): エンティティアライメント(EA)は、異なる知識グラフ(KG)にまたがる同等のエンティティペアを識別することを目的としている。
トレーニング用種子アライメントの不足を回避するため、最近のEAモデルは擬似ラベル戦略を用いて、モデルトレーニング用種子アライメントに高い信頼性で予測される不整合エンティティペアを反復的に追加する。
しかし、疑似ラベル作成における確認バイアスの悪影響は概ね見過ごされ、エンティティアライメント性能が損なわれている。
擬似ラベルに基づくエンティティアライメント(UPL-EA)の検証バイアスを系統的に回避するために,擬似ラベルエラーを明示的に排除し,エンティティアライメントの精度を高める統一擬似ラベルアライメント(UPL-EA)を提案する。
UPL-EAは2つの相補的なコンポーネントから構成される: (1) 最適輸送(OT)ベースの擬似ラベルは、2つのKG間でのエンティティ対応を判定し、誤マッチを低減する効果的な手段として離散OTモデリングを使用する。
有効基準は、1対1の対応を満たす擬似ラベルアライメントを推論するために導かれる。(2)パラレル擬似ラベルアンサンブルは、独立に訓練された複数のモデルに対する予測を組み合わせることで、擬似ラベルアライメントを洗練する。
その後、アンサンブルされた擬似ラベルアライメントを用いて種子アライメントを増強し、その後のモデルトレーニングを強化してアライメント推論を行う。
UPL-EAの擬似ラベル誤り除去効果は理論的に支持され,実験的に検証された。
UPL-EAが15以上の競争ベースラインに優越していることと、エンティティアライメントのための一般的な擬似ラベルフレームワークとしての有用性を示す。
関連論文リスト
- Drawing the Same Bounding Box Twice? Coping Noisy Annotations in Object
Detection with Repeated Labels [6.872072177648135]
そこで本研究では,基礎的真理推定手法に適合する新しい局所化アルゴリズムを提案する。
また,本アルゴリズムは,TexBiGデータセット上でのトレーニングにおいて,優れた性能を示す。
論文 参考訳(メタデータ) (2023-09-18T13:08:44Z) - Alternative Pseudo-Labeling for Semi-Supervised Automatic Speech
Recognition [49.42732949233184]
ラベル付きデータが不十分な場合、擬似ラベル技術による半教師付き学習は自動音声認識の性能を大幅に向上させることができる。
損失関数のグラウンドトルースとしてノイズラベルを取ると、最適以下の性能が得られる。
そこで我々は,ノイズの多い擬似ラベル問題に対処するために,代替擬似ラベル方式という新しい枠組みを提案する。
論文 参考訳(メタデータ) (2023-08-12T12:13:52Z) - Class-Distribution-Aware Pseudo Labeling for Semi-Supervised Multi-Label
Learning [97.88458953075205]
Pseudo-labelingは、ラベルなしデータを利用するための人気で効果的なアプローチとして登場した。
本稿では,クラスアウェアの擬似ラベル処理を行うCAP(Class-Aware Pseudo-Labeling)という新しい手法を提案する。
論文 参考訳(メタデータ) (2023-05-04T12:52:18Z) - Ambiguity-Resistant Semi-Supervised Learning for Dense Object Detection [98.66771688028426]
本研究では,一段階検出器のためのAmbiguity-Resistant Semi-supervised Learning (ARSL)を提案する。
擬似ラベルの分類とローカライズ品質を定量化するために,JCE(Joint-Confidence Estimation)を提案する。
ARSLは、曖昧さを効果的に軽減し、MS COCOおよびPASCALVOC上で最先端のSSOD性能を達成する。
論文 参考訳(メタデータ) (2023-03-27T07:46:58Z) - Exploiting Completeness and Uncertainty of Pseudo Labels for Weakly
Supervised Video Anomaly Detection [149.23913018423022]
弱教師付きビデオ異常検出は、ビデオレベルのラベルのみを用いて、ビデオ内の異常事象を特定することを目的としている。
2段階の自己学習法は擬似ラベルの自己生成によって著しく改善されている。
本稿では,自己学習のための完全性と不確実性を利用した強化フレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-08T05:53:53Z) - Multi-Label Gold Asymmetric Loss Correction with Single-Label Regulators [6.129273021888717]
本稿では,単一ラベルレギュレータ(GALC-SLR)を用いたGold Asymmetric Loss Correctionを提案する。
GALC-SLRは、単一ラベルサンプルを用いてノイズ混乱行列を推定し、推定された混乱行列を介して非対称な損失補正を構築し、雑音ラベルへの過度な適合を避ける。
実験結果から,本手法は,全ての汚損レベルにおいて,最先端の非対称損失マルチラベル分類器よりも優れた性能を示すことが示された。
論文 参考訳(メタデータ) (2021-08-04T12:57:29Z) - Distribution-Aware Semantics-Oriented Pseudo-label for Imbalanced
Semi-Supervised Learning [80.05441565830726]
本稿では,疑似ラベルの重み付けがモデル性能に悪影響を及ぼすような,不均衡な半教師付き学習に対処する。
本稿では,この観測の動機となるバイアスに対処する,一般的な擬似ラベルフレームワークを提案する。
不均衡SSLのための新しい擬似ラベルフレームワークを、DASO(Distributed-Aware Semantics-Oriented Pseudo-label)と呼ぶ。
論文 参考訳(メタデータ) (2021-06-10T11:58:25Z) - Exploiting Sample Uncertainty for Domain Adaptive Person
Re-Identification [137.9939571408506]
各サンプルに割り当てられた擬似ラベルの信頼性を推定・活用し,ノイズラベルの影響を緩和する。
不確実性に基づく最適化は大幅な改善をもたらし、ベンチマークデータセットにおける最先端のパフォーマンスを達成します。
論文 参考訳(メタデータ) (2020-12-16T04:09:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。