論文の概要: ConcreteGraph: A Data Augmentation Method Leveraging the Properties of
Concept Relatedness Estimation
- arxiv url: http://arxiv.org/abs/2206.12556v1
- Date: Sat, 25 Jun 2022 04:52:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-03 07:58:07.007597
- Title: ConcreteGraph: A Data Augmentation Method Leveraging the Properties of
Concept Relatedness Estimation
- Title(参考訳): concreteGraph:概念関連性評価の特性を活用したデータ拡張手法
- Authors: Yueen Ma, Zixing Song, Chirui Chang, Yue Yu, Irwin King
- Abstract要約: 概念関連性推定(CRE)特性を利用するために,具体グラフというグラフを構築した。
本稿では,WORDデータセットに最初に取り組み,提案したコントラストグラフを用いてトランスフォーマーの精度を2%以上向上させることができる。
concreteGraphの助けを借りた3つのトランスフォーマーは、CNSEとCNSSデータセット上の現在の最先端メソッドであるConcept Interaction Graph(CIG)より優れている。
- 参考スコア(独自算出の注目度): 35.98904983588297
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The concept relatedness estimation (CRE) task is to determine whether two
given concepts are related. Although existing methods for the semantic textual
similarity (STS) task can be easily adapted to this task, the CRE task has some
unique properties that can be leveraged to augment the datasets for addressing
its data scarcity problem. In this paper, we construct a graph named
ConcreteGraph (Concept relatedness estimation Graph) to take advantage of the
CRE properties. For the sampled new concept pairs from the ConcreteGraph, we
add an additional step of filtering out the new concept pairs with low quality
based on simple yet effective quality thresholding. We apply the ConcreteGraph
data augmentation on three Transformer-based models to show its efficacy.
Detailed ablation study for quality thresholding further shows that even a
limited amount of high-quality data is more beneficial than a large quantity of
unthresholded data. This paper is the first one to work on the WORD dataset and
the proposed ConcreteGraph can boost the accuracy of the Transformers by more
than 2%. All three Transformers, with the help of ConcreteGraph, can outperform
the current state-of-theart method, Concept Interaction Graph (CIG), on the
CNSE and CNSS datasets.
- Abstract(参考訳): 概念関連性推定(CRE)タスクは、2つの概念が関連しているかどうかを決定することである。
セマンティックテキスト類似性(STS)タスクの既存のメソッドは、このタスクに容易に適応できるが、CREタスクには、データ不足問題に対処するためにデータセットを拡張するために使用できるいくつかのユニークな特性がある。
本稿では,CRE特性を生かしたConcact Graph (Concept relatedness Estimation Graph) というグラフを構築した。
concretegraphの新たなコンセプトペアのサンプルには、シンプルで効果的な品質閾値に基づいて、新しいコンセプトペアを低品質でフィルタリングする新たなステップを加えます。
3つのトランスフォーマーモデルに具体的データ拡張を適用し,その有効性を示す。
品質閾値付けのための詳細なアブレーション研究は、たとえ限られた量の高品質のデータであっても、大量の未保持データよりも有益であることを示している。
本稿では,WORDデータセットに最初に取り組み,提案したコントラストグラフを用いてトランスフォーマーの精度を2%以上向上させることができる。
concreteGraphの助けを借りた3つのトランスフォーマーは、CNSEとCNSSデータセット上で、現在の最先端メソッドであるConcept Interaction Graph(CIG)より優れている。
関連論文リスト
- Preserving Node Distinctness in Graph Autoencoders via Similarity Distillation [9.395697548237333]
グラフオートエンコーダ(GAE)は、平均二乗誤差(MSE)のような距離ベースの基準に依存して入力グラフを再構築する。
単一の再構築基準にのみ依存すると 再建されたグラフの 特徴が失われる可能性がある
我々は,再構成されたグラフにおいて,必要な相違性を維持するための簡易かつ効果的な戦略を開発した。
論文 参考訳(メタデータ) (2024-06-25T12:54:35Z) - A Pure Transformer Pretraining Framework on Text-attributed Graphs [50.833130854272774]
グラフ構造を先行として扱うことで,特徴中心の事前学習の視点を導入する。
我々のフレームワークであるGraph Sequence Pretraining with Transformer (GSPT)はランダムウォークを通してノードコンテキストをサンプリングする。
GSPTはノード分類とリンク予測の両方に容易に適応でき、様々なデータセットで有望な経験的成功を示す。
論文 参考訳(メタデータ) (2024-06-19T22:30:08Z) - SGTR+: End-to-end Scene Graph Generation with Transformer [42.396971149458324]
シーングラフ生成(SGG)は、その構成特性のため、困難な視覚的理解課題である。
これまでのほとんどの作業ではボトムアップ、2段階またはポイントベースの1段階のアプローチを採用していた。
本稿では、上記の問題に対処する新しいSGG法を提案し、そのタスクを二部グラフ構築問題として定式化する。
論文 参考訳(メタデータ) (2024-01-23T15:18:20Z) - KERMIT: Knowledge Graph Completion of Enhanced Relation Modeling with Inverse Transformation [19.31783654838732]
大規模言語モデルを用いてコヒーレントな記述を生成し,クエリと回答のセマンティックなギャップを埋める。
また、逆関係を利用して対称グラフを作成し、KGCのための強化トレーニングサンプルを提供する。
提案手法は,WN18RRではHit@1が4.2%,FB15k-237ではHit@3が3.4%向上し,優れた性能を示した。
論文 参考訳(メタデータ) (2023-09-26T09:03:25Z) - Knowledge Graph Refinement based on Triplet BERT-Networks [0.0]
本稿では,知識グラフ内のエンティティや関係に関する情報を集約する埋め込み空間を作成するトランスフォーマーベースの三重項ネットワークを採用する。
事実からテキストシーケンスを生成し、事前訓練されたトランスフォーマーベースの言語モデルのトリプルトネットワークを微調整する。
これら2つの改良作業の最先端性能に対して, GilBERT は, より優れた, あるいは同等な結果が得られることを示す。
論文 参考訳(メタデータ) (2022-11-18T19:01:21Z) - Entity-Graph Enhanced Cross-Modal Pretraining for Instance-level Product
Retrieval [152.3504607706575]
本研究の目的は, 細粒度製品カテゴリを対象とした, 弱制御型マルチモーダル・インスタンスレベルの製品検索である。
まず、Product1Mデータセットをコントリビュートし、2つの実際のインスタンスレベルの検索タスクを定義します。
我々は、マルチモーダルデータから重要な概念情報を組み込むことができるより効果的なクロスモーダルモデルを訓練するために活用する。
論文 参考訳(メタデータ) (2022-06-17T15:40:45Z) - Collaborative likelihood-ratio estimation over graphs [55.98760097296213]
グラフに基づく相対的制約のない最小二乗重要度フィッティング(GRULSIF)
我々はこの考え方を、グラフベースの相対的非制約最小二乗重要度フィッティング(GRULSIF)と呼ばれる具体的な非パラメトリック手法で開発する。
我々は、ノード当たりの観測回数、グラフのサイズ、およびグラフ構造がタスク間の類似性をどの程度正確にエンコードしているかといった変数が果たす役割を強調する、協調的なアプローチの収束率を導出する。
論文 参考訳(メタデータ) (2022-05-28T15:37:03Z) - GraphCoCo: Graph Complementary Contrastive Learning [65.89743197355722]
グラフコントラスト学習(GCL)は、手作業によるアノテーションの監督なしに、グラフ表現学習(GRL)において有望な性能を示した。
本稿では,この課題に対処するため,グラフココというグラフ補完型コントラスト学習手法を提案する。
論文 参考訳(メタデータ) (2022-03-24T02:58:36Z) - From Canonical Correlation Analysis to Self-supervised Graph Neural
Networks [99.44881722969046]
本稿では,グラフデータを用いた自己教師付き表現学習のための概念的単純かつ効果的なモデルを提案する。
古典的カノニカル相関解析にインスパイアされた,革新的な特徴レベルの目的を最適化する。
提案手法は、7つの公開グラフデータセット上で競合的に動作する。
論文 参考訳(メタデータ) (2021-06-23T15:55:47Z) - EAGER: Embedding-Assisted Entity Resolution for Knowledge Graphs [4.363674669941547]
EAGER(Embedding-Assisted Knowledge Graph Entity Resolution)と呼ばれる,より包括的なERアプローチを提案する。
異なる大きさの知識グラフと構造化された知識グラフを持つ23のベンチマークデータセットに対するアプローチを評価した。
論文 参考訳(メタデータ) (2021-01-15T14:12:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。