論文の概要: LEAPME: Learning-based Property Matching with Embeddings
- arxiv url: http://arxiv.org/abs/2010.01951v1
- Date: Mon, 5 Oct 2020 12:42:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-10 22:26:44.418022
- Title: LEAPME: Learning-based Property Matching with Embeddings
- Title(参考訳): LEAPME: 埋め込みと学習ベースのプロパティマッチング
- Authors: Daniel Ayala, Inma Hern\'andez, David Ruiz, Erhard Rahm
- Abstract要約: LEAPME(LEArning-based Property Matching with Embeddings)と呼ばれる機械学習による新しいプロパティマッチング手法を提案する。
このアプローチでは、プロパティ名とインスタンス値の両方のドメイン固有のセマンティクスをよりよく活用するために、ワード埋め込みを多用している。
実世界データを用いた複数のマルチソースデータセットに対する5つのベースラインの比較評価により,LEAPMEの有効性が示唆された。
- 参考スコア(独自算出の注目度): 5.2078071454435815
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data integration tasks such as the creation and extension of knowledge graphs
involve the fusion of heterogeneous entities from many sources. Matching and
fusion of such entities require to also match and combine their properties
(attributes). However, previous schema matching approaches mostly focus on two
sources only and often rely on simple similarity measurements. They thus face
problems in challenging use cases such as the integration of heterogeneous
product entities from many sources.
We therefore present a new machine learning-based property matching approach
called LEAPME (LEArning-based Property Matching with Embeddings) that utilizes
numerous features of both property names and instance values. The approach
heavily makes use of word embeddings to better utilize the domain-specific
semantics of both property names and instance values. The use of supervised
machine learning helps exploit the predictive power of word embeddings.
Our comparative evaluation against five baselines for several multi-source
datasets with real-world data shows the high effectiveness of LEAPME. We also
show that our approach is even effective when training data from another domain
(transfer learning) is used.
- Abstract(参考訳): 知識グラフの作成や拡張のようなデータ統合タスクは、多くのソースからの異種エンティティの融合を含む。
このようなエンティティのマッチングと融合には、プロパティ(属性)のマッチングと結合も必要です。
しかし、従来のスキーママッチングアプローチは2つのソースのみに焦点を当てており、単純な類似度測定に依存することが多い。
したがって、多くのソースからの異種製品エンティティの統合など、困難なユースケースで問題に直面します。
そこで我々はLEAPME(LEArning-based Property Matching with Embeddings)と呼ばれる機械学習に基づく新しいプロパティマッチング手法を提案する。
このアプローチでは、プロパティ名とインスタンス値の両方のドメイン固有のセマンティクスをよりよく活用するために、ワード埋め込みを多用している。
教師付き機械学習は、単語埋め込みの予測能力を利用するのに役立つ。
実世界データを用いた複数のマルチソースデータセットに対する5つのベースラインの比較評価により,LEAPMEの有効性が示唆された。
また,このアプローチは,他の領域からのデータ(転校学習)が使用される場合にも有効であることを示した。
関連論文リスト
- Cross-Domain Few-Shot Relation Extraction via Representation Learning
and Domain Adaptation [1.1602089225841632]
短いショット関係抽出は、各関係にラベル付き文がほとんどない新しい関係を認識することを目的としている。
従来の距離法に基づく数ショット関係抽出アルゴリズムは、訓練された距離関数を用いて、クエリ文の埋め込みに埋め込まれた少数のラベル付き文によって生成されたプロトタイプを比較することにより、関係を識別する。
我々は,先行知識からより解釈可能で効率的なプロトタイプを学習し,様々な領域における新たな関係をより効果的に抽出するために,関係の本質的な意味論を学習することを提案する。
論文 参考訳(メタデータ) (2022-12-05T19:34:52Z) - Can I see an Example? Active Learning the Long Tail of Attributes and
Relations [64.50739983632006]
視覚シーンの属性や関係を問う,新たな逐次能動学習フレームワークを提案する。
従来のアクティブな学習手法では、特定の例のラベルを求めるが、エージェントが特定のカテゴリからサンプルを求めることができるように、このフレーミングを反転させる。
このフレーミングを用いて、データ分布の尾からサンプルを求めるアクティブサンプリング手法を導入し、Visual Genomeの古典的アクティブラーニング手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-03-11T19:28:19Z) - Deep Transfer Learning for Multi-source Entity Linkage via Domain
Adaptation [63.24594955429465]
マルチソースエンティティリンクは、データのクリーニングやユーザ縫合といった、高インパクトなアプリケーションにおいて重要である。
AdaMELは、多ソースエンティティリンクを実行するための一般的なハイレベルな知識を学ぶディープトランスファー学習フレームワークである。
本フレームワークは,教師付き学習に基づく平均的手法よりも8.21%向上した最先端の学習結果を実現する。
論文 参考訳(メタデータ) (2021-10-27T15:20:41Z) - Interpretable and Low-Resource Entity Matching via Decoupling Feature
Learning from Decision Making [22.755892575582788]
Entity Matchingは、同じ現実世界のオブジェクトを表すエンティティレコードを認識することを目的としている。
異種情報融合(HIF)とキー属性ツリー(KAT)誘導からなる新しいEMフレームワークを提案する。
提案手法は効率が高く,ほとんどの場合SOTA EMモデルより優れている。
論文 参考訳(メタデータ) (2021-06-08T08:27:31Z) - Few-Shot Named Entity Recognition: A Comprehensive Study [92.40991050806544]
マルチショット設定のモデル一般化能力を向上させるための3つの手法を検討する。
ラベル付きデータの比率の異なる10の公開nerデータセットについて経験的比較を行う。
マルチショットとトレーニングフリーの両方の設定で最新の結果を作成します。
論文 参考訳(メタデータ) (2020-12-29T23:43:16Z) - Learning to Combine: Knowledge Aggregation for Multi-Source Domain
Adaptation [56.694330303488435]
マルチソースドメイン適応(LtC-MSDA)フレームワークを併用する学習法を提案する。
簡単に言うと、知識グラフは様々なドメインのプロトタイプ上に構築され、セマンティックに隣接した表現間の情報伝達を実現する。
我々のアプローチは、既存の手法よりも顕著なマージンで優れています。
論文 参考訳(メタデータ) (2020-07-17T07:52:44Z) - Relation-Guided Representation Learning [53.60351496449232]
本稿では,サンプル関係を明示的にモデル化し,活用する表現学習手法を提案する。
私たちのフレームワークは、サンプル間の関係をよく保存します。
サンプルをサブスペースに埋め込むことにより,本手法が大規模なサンプル外問題に対処可能であることを示す。
論文 参考訳(メタデータ) (2020-07-11T10:57:45Z) - Inferential Text Generation with Multiple Knowledge Sources and
Meta-Learning [117.23425857240679]
本研究では,テキストティフ・エルス関係のような多種多様なコモンセンスのイベントの推論テキストを生成する問題について検討する。
既存のアプローチでは、トレーニング例からの限られた証拠を使用して、個々の関係について学習するのが一般的である。
この研究では、モデルのための燃料として複数の知識ソースを使用します。
論文 参考訳(メタデータ) (2020-04-07T01:49:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。