論文の概要: Learning with Dual-level Noisy Correspondence for Multi-modal Entity Alignment
- arxiv url: http://arxiv.org/abs/2510.18240v1
- Date: Tue, 21 Oct 2025 03:00:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:12.828437
- Title: Learning with Dual-level Noisy Correspondence for Multi-modal Entity Alignment
- Title(参考訳): マルチモーダルエンティティアライメントのためのデュアルレベル雑音対応による学習
- Authors: Haobin Li, Yijie Lin, Peng Hu, Mouxing Yang, Xi Peng,
- Abstract要約: マルチモーダル・エンティティ・アライメント(MMEA)は、異種マルチモーダル・ナレッジ・グラフ(MMKG)にまたがる等価なエンティティを識別することを目的としている。
既存の手法では、イントラエンタリティとインターグラフ対応の両方に欠陥がないと仮定しており、実世界のMMKGにはしばしば違反している。
本稿では、DNC(Dual-level Noisy Cor correspondingence)問題に対処するため、RULEと呼ばれる堅牢なMMEAフレームワークを提案する。
- 参考スコア(独自算出の注目度): 32.22464813030617
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-modal entity alignment (MMEA) aims to identify equivalent entities across heterogeneous multi-modal knowledge graphs (MMKGs), where each entity is described by attributes from various modalities. Existing methods typically assume that both intra-entity and inter-graph correspondences are faultless, which is often violated in real-world MMKGs due to the reliance on expert annotations. In this paper, we reveal and study a highly practical yet under-explored problem in MMEA, termed Dual-level Noisy Correspondence (DNC). DNC refers to misalignments in both intra-entity (entity-attribute) and inter-graph (entity-entity and attribute-attribute) correspondences. To address the DNC problem, we propose a robust MMEA framework termed RULE. RULE first estimates the reliability of both intra-entity and inter-graph correspondences via a dedicated two-fold principle. Leveraging the estimated reliabilities, RULE mitigates the negative impact of intra-entity noise during attribute fusion and prevents overfitting to noisy inter-graph correspondences during inter-graph discrepancy elimination. Beyond the training-time designs, RULE further incorporates a correspondence reasoning module that uncovers the underlying attribute-attribute connection across graphs, guaranteeing more accurate equivalent entity identification. Extensive experiments on five benchmarks verify the effectiveness of our method against the DNC compared with seven state-of-the-art methods.The code is available at \href{https://github.com/XLearning-SCU/RULE}{XLearning-SCU/RULE}
- Abstract(参考訳): マルチモーダル・エンティティ・アライメント(MMEA)は、異質なマルチモーダル・ナレッジ・グラフ(MMKG)にまたがる等価なエンティティを識別することを目的としており、各エンティティは様々なモーダルの属性によって記述される。
既存の手法では、イントラエンタリティとインターグラフの対応はどちらも不完全であり、専門家のアノテーションに依存しているため、現実のMMKGではしばしば違反していると仮定する。
本稿では,DNC(Dual-level Noisy Correspondence)と呼ばれるMMEAにおいて,非常に実用的で未探索な問題を明らかにし,研究する。
DNCは、不一致(entity-attribute)と不一致(entity-entityと attribute-attribute)の両方を指す。
DNC問題に対処するため、我々はRULEと呼ばれる堅牢なMMEAフレームワークを提案する。
RULEはまず、専用の2倍の原理を用いて、エンタリティ内およびグラフ間通信の信頼性を推定する。
推定信頼度を利用すると、RULEは属性融合時の遠心雑音の負の影響を軽減し、グラフ間不一致の除去時にノイズの多いグラフ間対応に過度に適合するのを防ぐ。
訓練時間の設計の他に、RULEはさらに対応推論モジュールを組み込んで、グラフ間の属性属性属性接続を明らかにすることで、より正確な等価なエンティティ識別を保証する。
5つのベンチマークによる大規模な実験により、DNCに対する手法の有効性を7つの最先端手法と比較して検証し、そのコードは \href{https://github.com/XLearning-SCU/RULE}{XLearning-SCU/RULE} で公開されている。
関連論文リスト
- Cross-modal Full-mode Fine-grained Alignment for Text-to-Image Person Retrieval [54.90229711181207]
TIPR (Text-to-Image Person Retrieval) は、与えられたテキストクエリに基づいて、最も関連性の高い人物画像を取得することを目的としている。
TIPRの鍵となる課題は、テキストと視覚のモダリティの効果的なアライメントを達成することである。
FMFA, クロスモーダルフルモーデファインファインファインファインアライメントフレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-17T07:12:05Z) - Robust Brain Tumor Segmentation with Incomplete MRI Modalities Using Hölder Divergence and Mutual Information-Enhanced Knowledge Transfer [10.66488607852885]
不完全なモダリティであっても高いセグメンテーション精度を実現する頑健な単一モード並列処理フレームワークを提案する。
モデルでは、利用可能な入力に基づいてネットワークパラメータを動的に調整しながら、モダリティ固有の特徴を維持している。
これらのばらつきと情報に基づく損失関数を用いることで、このフレームワークは予測と地味ラベルの差異を効果的に定量化する。
論文 参考訳(メタデータ) (2025-07-02T00:18:07Z) - Localizing Factual Inconsistencies in Attributable Text Generation [74.11403803488643]
本稿では,帰属可能なテキスト生成における事実の不整合をローカライズするための新しい形式であるQASemConsistencyを紹介する。
QASemConsistencyは、人間の判断とよく相関する事実整合性スコアを得られることを示す。
論文 参考訳(メタデータ) (2024-10-09T22:53:48Z) - Disentangled Noisy Correspondence Learning [56.06801962154915]
クロスモーダル検索は、モダリティ間の潜在対応を理解する上で重要である。
DisNCLはノイズ対応学習における特徴分散のための新しい情報理論フレームワークである。
論文 参考訳(メタデータ) (2024-08-10T09:49:55Z) - Unsupervised Robust Cross-Lingual Entity Alignment via Neighbor Triple Matching with Entity and Relation Texts [17.477542644785483]
言語間エンティティアライメント(EA)は、異なる言語間での複数の知識グラフ(KG)の統合を可能にする。
近隣の3重マッチング戦略により、エンティティレベルとリレーレベルアライメントを共同で実行するEAパイプライン。
論文 参考訳(メタデータ) (2024-07-22T12:25:48Z) - REPAIR: Rank Correlation and Noisy Pair Half-replacing with Memory for
Noisy Correspondence [36.274879585424635]
取得したデータにノイズが存在することは、クロスモーダルマッチングの性能低下につながる。
我々は,不一致なデータペア問題に対処するために,ランクコラーレーションと雑音hAlf wIth memoRyというフレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-13T04:01:20Z) - Object Segmentation by Mining Cross-Modal Semantics [68.88086621181628]
マルチモーダル特徴の融合と復号を導くために,クロスモーダル・セマンティックスをマイニングする手法を提案する。
具体的には,(1)全周減衰核融合(AF),(2)粗大デコーダ(CFD),(3)多層自己超越からなる新しいネットワークXMSNetを提案する。
論文 参考訳(メタデータ) (2023-05-17T14:30:11Z) - VERITE: A Robust Benchmark for Multimodal Misinformation Detection
Accounting for Unimodal Bias [17.107961913114778]
マルチモーダルの誤報は ソーシャルメディアのプラットフォームで 増え続けている問題です
本研究では,広範に使用されているMDDベンチマークにおいて,一様偏差の存在を調査・同定する。
リアルな合成学習データを生成するための新しい手法であるCrossmodal HArd Synthetic MisAlignment (CHASMA)を導入する。
論文 参考訳(メタデータ) (2023-04-27T12:28:29Z) - Attribute-Consistent Knowledge Graph Representation Learning for
Multi-Modal Entity Alignment [14.658282035561792]
MMEA(ACK-MMEA)のための属性一貫性のある知識グラフ表現学習フレームワークを提案する。
当社のアプローチは、競合他社と比較して優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2023-04-04T06:39:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。