Fugu-MT 論文翻訳(概要): PSQE: A Theoretical-Practical Approach to Pseudo Seed Quality Enhancement for Unsupervised MMEA

論文の概要: PSQE: A Theoretical-Practical Approach to Pseudo Seed Quality Enhancement for Unsupervised MMEA

arxiv url: http://arxiv.org/abs/2602.22903v1
Date: Thu, 26 Feb 2026 11:47:32 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-27 18:41:22.667063
Title: PSQE: A Theoretical-Practical Approach to Pseudo Seed Quality Enhancement for Unsupervised MMEA
Title（参考訳）: PSQE: 教師なしMMEAにおける擬似種子品質向上のための理論的実践的アプローチ
Authors: Yunpeng Hong, Chenyang Bu, Jie Zhang, Yi He, Di Wu, Xindong Wu,
Abstract要約: 擬似種子の精度とグラフカバレッジバランスを改善するためにPSQE(Pseudo-Seed Quality Enhancement)を提案する。理論解析により、擬似種子が既存のコントラスト学習に基づくMMEAモデルに与える影響が明らかになった。実験結果から,PSQEをプラグ・アンド・プレイモジュールとして用いることで,ベースラインの性能をかなりのマージンで向上できることが示された。
参考スコア（独自算出の注目度）: 15.624740362482905
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Multimodal Entity Alignment (MMEA) aims to identify equivalent entities across different data modalities, enabling structural data integration that in turn improves the performance of various large language model applications. To lift the requirement of labeled seed pairs that are difficult to obtain, recent methods shifted to an unsupervised paradigm using pseudo-alignment seeds. However, unsupervised entity alignment in multimodal settings remains underexplored, mainly because the incorporation of multimodal information often results in imbalanced coverage of pseudo-seeds within the knowledge graph. To overcome this, we propose PSQE (Pseudo-Seed Quality Enhancement) to improve the precision and graph coverage balance of pseudo seeds via multimodal information and clustering-resampling. Theoretical analysis reveals the impact of pseudo seeds on existing contrastive learning-based MMEA models. In particular, pseudo seeds can influence the attraction and the repulsion terms in contrastive learning at once, whereas imbalanced graph coverage causes models to prioritize high-density regions, thereby weakening their learning capability for entities in sparse regions. Experimental results validate our theoretical findings and show that PSQE as a plug-and-play module can improve the performance of baselines by considerable margins.
Abstract（参考訳）: MMEA(Multimodal Entity Alignment)は、さまざまなデータモダリティにまたがる同等のエンティティを識別することを目的としている。取得が困難なラベル付き種子ペアの要求を解消するため,最近の手法は擬似配向種子を用いた教師なしパラダイムに移行した。しかし、マルチモーダル情報の導入は、知識グラフ内の擬似種子の非バランスなカバレッジをもたらすことが多いため、マルチモーダルセッティングにおける教師なしエンティティアライメントは未解明のままである。これを解決するため,PSQE (Pseudo-Seed Quality Enhancement) を提案し,マルチモーダル情報とクラスタリング・サンプリングによる擬似種子の精度とグラフカバレッジバランスを改善する。理論解析により、擬似種子が既存のコントラスト学習に基づくMMEAモデルに与える影響が明らかになった。特に、擬似種子は、対照的な学習において、一度にアトラクションと反発項に影響を与えるが、不均衡なグラフカバレッジは、モデルに高密度領域を優先させ、スパース領域のエンティティに対する学習能力を弱める。実験結果から,PSQEをプラグ・アンド・プレイモジュールとして用いることで,ベースラインの性能をかなりのマージンで向上できることが示された。

関連論文リスト

SetPO: Set-Level Policy Optimization for Diversity-Preserving LLM Reasoning [50.93295951454092]
本稿では,カーネル化類似性を用いたサンプル軌道上で定義された設定レベル多様性の目的について紹介する。提案手法は,各サンプル軌跡に対する余剰余剰貢献を導出し,この目的を政策最適化のためのプラグイン・アドバンテージ・シェーピング用語として統合する。様々なモデルスケールで実験を行い、提案アルゴリズムの有効性を示し、様々なベンチマークでPass@1とPass@Kの双方において、強いベースラインを一貫して上回っている。
論文参考訳（メタデータ） (2026-02-01T07:13:20Z)
Mixture-of-Experts Models in Vision: Routing, Optimization, and Generalization [0.0]
画像分類設定におけるMoEの挙動について検討し、予測性能、専門家の活用、一般化に着目した。我々は、CIFAR10データセット上の密度、SoftMoE、SparseMoE分類器を、同等のモデルキャパシティで比較する。どちらのMoE変種も、正規化によるバランスの取れた専門家の利用を維持しながら、密度の高いベースラインよりもわずかに高い検証精度を達成する。 DenseとSparseMoEは、全てのモデルが同等の一般化性能を達成しているにもかかわらず、同様の曲率状態にあるのに対して、SoftMoEはこれらの指標によってよりシャープさを示す。
論文参考訳（メタデータ） (2026-01-21T14:22:25Z)
Did Models Sufficient Learn? Attribution-Guided Training via Subset-Selected Counterfactual Augmentation [61.248535801314375]
Subset-Selected Counterfactual Augmentation (SS-CA) 我々は,モデル予測を選択的に変更可能な最小空間領域集合を識別するために,対実的LIMAを開発した。実験により,SS-CAは分布内テストデータ(ID)の一般化を改善し,分布外ベンチマーク(OOD)において優れた性能を発揮することが示された。
論文参考訳（メタデータ） (2025-11-15T08:39:22Z)
Uncertainty Quantification for Incomplete Multi-View Data Using Divergence Measures [16.7647980166695]
KPHD-Netは、H"older divergence"に基づくマルチビュー分類とクラスタリングタスクのために提案されている。我々の理論的分析は、H'olderの発散が分布の相違をより効果的に測定できることを証明している。大規模な実験により、提案手法は分類タスクとクラスタリングタスクの両方において現在の最先端手法よりも優れていることが示された。
論文参考訳（メタデータ） (2025-07-14T06:55:32Z)
Robust Molecular Property Prediction via Densifying Scarce Labeled Data [53.24886143129006]
薬物発見において、研究を進める上で最も重要な化合物は、しばしば訓練セットを越えている。本稿では, ラベル付きデータを利用して, 分布内データ(ID)と分布外データ(OOD)を補間する2段階最適化手法を提案する。
論文参考訳（メタデータ） (2025-06-13T15:27:40Z)
Preconditioned Inexact Stochastic ADMM for Deep Model [35.37705488695026]
本稿では,拡張性のある並列コンピューティングを実現するアルゴリズムであるPISAを開発し,様々な前提条件をサポートする。これは、有界領域上の勾配のリプシッツ連続性の唯一の仮定の下で収束し、メソッドによって一般的に課される他の条件の必要性を取り除く。様々な最先端の繰り返しに比べて優れた数値性能を示す。
論文参考訳（メタデータ） (2025-02-15T12:28:51Z)
Preference-Based Multi-Agent Reinforcement Learning: Data Coverage and Algorithmic Techniques [65.55451717632317]
PbMARL(Preference-based Multi-Agent Reinforcement Learning)について検討する。一般ゲームにおける嗜好のみのオフラインデータセットからナッシュ平衡を同定する。以上の結果から,PbMARLの多面的アプローチが示唆された。
論文参考訳（メタデータ） (2024-09-01T13:14:41Z)
Quantifying Prediction Consistency Under Fine-Tuning Multiplicity in Tabular LLMs [10.494477811252034]
微調整多重度は分類タスクにおけるタブラル LLM に現れる。我々の研究は、タブラルLLMにおける微調整多重性というこのユニークな挑戦を定式化する。本稿では,コストのかかるモデル再訓練を伴わずに,個々の予測の一貫性を定量化する手法を提案する。
論文参考訳（メタデータ） (2024-07-04T22:22:09Z)
Beyond DAGs: A Latent Partial Causal Model for Multimodal Learning [80.44084021062105]
本稿では,非方向エッジで連結された2つの潜在結合変数を特徴とする,多モーダルデータに対する新しい潜在部分因果モデルを提案する。特定の統計的仮定の下では、多モーダル・コントラッシブ・ラーニングによって学習された表現が、自明な変換までの潜在結合変数に対応することを示す。事前トレーニングされたCLIPモデルの実験は、非絡み合った表現を具現化し、数ショットの学習を可能にし、さまざまな現実世界のデータセットにわたるドメインの一般化を改善する。
論文参考訳（メタデータ） (2024-02-09T07:18:06Z)
Distribution-Dependent Rates for Multi-Distribution Learning [26.38831409926518]
最近のマルチディストリビューション学習フレームワークは、環境との動的相互作用において、この目的に対処する。我々は, MDL体制における分布依存性の保証を行い, 最適値以下の差でスケールし, その結果, 試料サイズへの依存度が向上することを示した。適応型楽観的アルゴリズム LCB-DR を考案し,マルチアームバンディット文学における均一性と楽観的アロケーションのコントラストを反映した。
論文参考訳（メタデータ） (2023-12-20T15:50:16Z)
Differentiable Agent-based Epidemiology [71.81552021144589]
GradABM(GradABM)は、エージェントベースのモデリングのためのスケーラブルで微分可能な設計で、勾配に基づく学習と自動微分が可能である。 GradABMは、コモディティハードウェア上で数秒で数百万の人口をシミュレートし、ディープニューラルネットワークと統合し、異種データソースを取り込みます。
論文参考訳（メタデータ） (2022-07-20T07:32:02Z)
Accuracy on the Line: On the Strong Correlation Between Out-of-Distribution and In-Distribution Generalization [89.73665256847858]
分布外性能は,広範囲なモデルと分布シフトに対する分布内性能と強く相関していることを示す。具体的には,CIFAR-10 と ImageNet の変種に対する分布内分布と分布外分布性能の強い相関関係を示す。また,CIFAR-10-Cと組織分類データセットCamelyon17-WILDSの合成分布の変化など,相関が弱いケースについても検討した。
論文参考訳（メタデータ） (2021-07-09T19:48:23Z)
Deep Stable Learning for Out-Of-Distribution Generalization [27.437046504902938]
深層ニューラルネットワークに基づくアプローチは、同様の分布を持つデータとトレーニングデータをテストする際に顕著なパフォーマンスを達成した。トレーニングとテストデータ間の分散シフトの影響を排除することは、パフォーマンス向上の深層モデルの構築に不可欠です。トレーニングサンプルの学習重みによる特徴間の依存関係を除去し,この問題に対処することを提案する。
論文参考訳（メタデータ） (2021-04-16T03:54:21Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。