論文の概要: Towards Pattern-aware Data Augmentation for Temporal Knowledge Graph Completion
- arxiv url: http://arxiv.org/abs/2501.00252v1
- Date: Tue, 31 Dec 2024 03:47:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-05 17:14:35.634506
- Title: Towards Pattern-aware Data Augmentation for Temporal Knowledge Graph Completion
- Title(参考訳): 時間的知識グラフ補完のためのパターン認識データ拡張に向けて
- Authors: Jiasheng Zhang, Deqiang Ouyang, Shuang Liang, Jie Shao,
- Abstract要約: 本稿では、時間的知識グラフのための最初のデータ拡張戦略であるBoosterを紹介する。
本稿では,TKG内の三進的閉包に基づく階層的スコアリングアルゴリズムを提案する。
また、モデルが好むパターンから逸脱するサンプルを特定するための2段階のトレーニング手法を提案する。
- 参考スコア(独自算出の注目度): 18.51546761241817
- License:
- Abstract: Predicting missing facts for temporal knowledge graphs (TKGs) is a fundamental task, called temporal knowledge graph completion (TKGC). One key challenge in this task is the imbalance in data distribution, where facts are unevenly spread across entities and timestamps. This imbalance can lead to poor completion performance or long-tail entities and timestamps, and unstable training due to the introduction of false negative samples. Unfortunately, few previous studies have investigated how to mitigate these effects. Moreover, for the first time, we found that existing methods suffer from model preferences, revealing that entities with specific properties (e.g., recently active) are favored by different models. Such preferences will lead to error accumulation and further exacerbate the effects of imbalanced data distribution, but are overlooked by previous studies. To alleviate the impacts of imbalanced data and model preferences, we introduce Booster, the first data augmentation strategy for TKGs. The unique requirements here lie in generating new samples that fit the complex semantic and temporal patterns within TKGs, and identifying hard-learning samples specific to models. Therefore, we propose a hierarchical scoring algorithm based on triadic closures within TKGs. By incorporating both global semantic patterns and local time-aware structures, the algorithm enables pattern-aware validation for new samples. Meanwhile, we propose a two-stage training approach to identify samples that deviate from the model's preferred patterns. With a well-designed frequency-based filtering strategy, this approach also helps to avoid the misleading of false negatives. Experiments justify that Booster can seamlessly adapt to existing TKGC models and achieve up to an 8.7% performance improvement.
- Abstract(参考訳): 時間知識グラフ(TKG)の不足事実を予測することは、時間知識グラフ補完(TKGC)と呼ばれる基本的な課題である。
このタスクにおける重要な課題の1つは、事実がエンティティやタイムスタンプに不均一に分散されるデータ分散の不均衡である。
この不均衡は、完了性能の低下やロングテールエンティティやタイムスタンプ、偽陰性サンプルの導入による不安定なトレーニングにつながる可能性がある。
残念ながら、これらの効果を緩和する方法を研究する以前の研究はほとんどない。
さらに,既存の手法がモデル優先に悩まされることが初めて判明し,特定の特性を持つエンティティ(例えば最近アクティブになったエンティティ)が異なるモデルに好まれていることが明らかになった。
このような嗜好はエラーの蓄積を招き、不均衡なデータ分布の影響をさらに悪化させるが、以前の研究では見過ごされてしまう。
不均衡なデータとモデル嗜好の影響を軽減するため、TKGの最初のデータ拡張戦略であるBoosterを導入する。
ここでのユニークな要件は、TKG内の複雑な意味的パターンと時間的パターンに適合する新しいサンプルを生成し、モデル固有のハードラーニングサンプルを特定することである。
そこで本研究では,TKG内の三進的閉包に基づく階層的スコアリングアルゴリズムを提案する。
グローバルなセマンティックパターンとローカルな時間認識構造の両方を組み込むことで、新しいサンプルに対するパターン認識の検証が可能になる。
一方、モデルが好むパターンから逸脱するサンプルを特定するための2段階のトレーニング手法を提案する。
周波数ベースのフィルタリング戦略をよく設計することで、この手法は偽陰性の誤解を招くのを防ぐのにも役立ちます。
実験は、Boosterが既存のTKGCモデルにシームレスに適応し、最大8.7%のパフォーマンス改善を達成することを正当化する。
関連論文リスト
- Learning Augmentation Policies from A Model Zoo for Time Series Forecasting [58.66211334969299]
本稿では,強化学習に基づく学習可能なデータ拡張手法であるAutoTSAugを紹介する。
限界サンプルを学習可能なポリシーで強化することにより、AutoTSAugは予測性能を大幅に改善する。
論文 参考訳(メタデータ) (2024-09-10T07:34:19Z) - Leveraging Latent Diffusion Models for Training-Free In-Distribution Data Augmentation for Surface Defect Detection [9.784793380119806]
データ拡張のためのトレーニング不要な拡散型In-Distribution Anomaly GenerationパイプラインであるDIAGを紹介する。
従来の画像生成技術とは異なり、我々は、ドメインの専門家がモデルにマルチモーダルガイダンスを提供する、Human-in-the-loopパイプラインを実装している。
我々は、挑戦的なKSDD2データセットに対する最先端データ拡張アプローチに関して、DIAGの有効性と汎用性を実証する。
論文 参考訳(メタデータ) (2024-07-04T14:28:52Z) - Decoupled Prototype Learning for Reliable Test-Time Adaptation [50.779896759106784]
テスト時間適応(TTA)は、推論中にトレーニング済みのソースモデルをターゲットドメインに継続的に適応させるタスクである。
1つの一般的なアプローチは、推定擬似ラベルによるクロスエントロピー損失を伴う微調整モデルである。
本研究は, 各試料の分類誤差を最小化することで, クロスエントロピー損失の脆弱性がラベルノイズを引き起こすことを明らかにした。
本稿では,プロトタイプ中心の損失計算を特徴とする新しいDPL法を提案する。
論文 参考訳(メタデータ) (2024-01-15T03:33:39Z) - ChiroDiff: Modelling chirographic data with Diffusion Models [132.5223191478268]
チャーログラフィーデータのための強力なモデルクラスである「拡散確率モデル(Denoising Diffusion Probabilistic Models)」やDDPMを導入している。
我々のモデルは「ChiroDiff」と呼ばれ、非自己回帰的であり、全体論的概念を捉えることを学び、したがって高い時間的サンプリングレートに回復する。
論文 参考訳(メタデータ) (2023-04-07T15:17:48Z) - Boosting Differentiable Causal Discovery via Adaptive Sample Reweighting [62.23057729112182]
異なるスコアに基づく因果探索法は観測データから有向非巡回グラフを学習する。
本稿では,Reweighted Score関数ReScoreの適応重みを動的に学習することにより因果発見性能を向上させるためのモデルに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-06T14:49:59Z) - Rethinking Precision of Pseudo Label: Test-Time Adaptation via
Complementary Learning [10.396596055773012]
本稿では,テスト時間適応性を高めるための新しい補完学習手法を提案する。
テスト時適応タスクでは、ソースドメインからの情報は通常利用できない。
我々は,相補ラベルのリスク関数がバニラ損失式と一致することを強調した。
論文 参考訳(メタデータ) (2023-01-15T03:36:33Z) - TeST: Test-time Self-Training under Distribution Shift [99.68465267994783]
Test-Time Self-Training (TeST)は、あるソースデータとテスト時の新しいデータ分散に基づいてトレーニングされたモデルを入力する技術である。
また,TeSTを用いたモデルでは,ベースラインテスト時間適応アルゴリズムよりも大幅に改善されていることがわかった。
論文 参考訳(メタデータ) (2022-09-23T07:47:33Z) - Efficient Test-Time Model Adaptation without Forgetting [60.36499845014649]
テストタイム適応は、トレーニングとテストデータの間の潜在的な分散シフトに取り組むことを目指している。
信頼性および非冗長なサンプルを同定するためのアクティブなサンプル選択基準を提案する。
また、重要なモデルパラメータを劇的な変化から制約するFisher regularizerを導入します。
論文 参考訳(メタデータ) (2022-04-06T06:39:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。