論文の概要: It's AI Match: A Two-Step Approach for Schema Matching Using Embeddings
- arxiv url: http://arxiv.org/abs/2203.04366v1
- Date: Tue, 8 Mar 2022 19:42:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-11 07:37:37.418773
- Title: It's AI Match: A Two-Step Approach for Schema Matching Using Embeddings
- Title(参考訳): AIマッチング - 埋め込みを用いたスキーママッチングのための2ステップアプローチ
- Authors: Benjamin H\"attasch, Michael Truong-Ngoc, Andreas Schmidt, Carsten
Binnig
- Abstract要約: ニューラル埋め込みに基づくスキーママッチングのための新しいエンドツーエンドアプローチを提案する。
以上の結果から,我々の手法は,堅牢かつ信頼性の高い方法で対応を決定可能であることが示唆された。
- 参考スコア(独自算出の注目度): 10.732163031244646
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Since data is often stored in different sources, it needs to be integrated to
gather a global view that is required in order to create value and derive
knowledge from it. A critical step in data integration is schema matching which
aims to find semantic correspondences between elements of two schemata. In
order to reduce the manual effort involved in schema matching, many solutions
for the automatic determination of schema correspondences have already been
developed.
In this paper, we propose a novel end-to-end approach for schema matching
based on neural embeddings. The main idea is to use a two-step approach
consisting of a table matching step followed by an attribute matching step. In
both steps we use embeddings on different levels either representing the whole
table or single attributes. Our results show that our approach is able to
determine correspondences in a robust and reliable way and compared to
traditional schema matching approaches can find non-trivial correspondences.
- Abstract(参考訳): データはしばしば異なるソースに格納されるため、価値を作成し、そこから知識を引き出すために必要とされるグローバルなビューを集めるために統合する必要がある。
データ統合における重要なステップはスキーママッチングであり、2つのスキーマの要素間の意味的対応を見つけることを目的としている。
スキーママッチングにおける手作業を削減するため,スキーマ対応の自動決定のための多くのソリューションがすでに開発されている。
本稿では,ニューラル埋め込みに基づくスキーママッチングのための新しいエンドツーエンドアプローチを提案する。
主な考え方は、テーブルマッチングステップと属性マッチングステップからなる2段階のアプローチを使用することである。
どちらのステップでも、テーブル全体または単一の属性を表す異なるレベルで埋め込みを使用します。
また,従来のスキーママッチング手法と比較して,非自明な対応を見出すことができることを示した。
関連論文リスト
- ReMatch: Retrieval Enhanced Schema Matching with LLMs [0.9558392439655012]
本稿では,検索強化大言語モデル(LLM)を用いたスキーママッチングのためのReMatchという新しい手法を提案する。
提案手法では,事前定義されたマッピングやモデルトレーニング,あるいはソースデータベースのデータへのアクセスが不要になる。
大規模な実世界のスキーマに関する実験結果から、ReMatchはマッチング機能を大幅に改善し、他の機械学習アプローチよりも優れています。
論文 参考訳(メタデータ) (2024-03-03T17:14:40Z) - Inductive Meta-path Learning for Schema-complex Heterogeneous
Information Networks [38.57840679354466]
Heterogeneous Information Networks (HIN) は、複数のノードとエッジを持つ情報ネットワークである。
メタパスの概念、すなわち2つのエンティティを接続するエンティティタイプと関係型のシーケンスは、様々なHINタスクのためのメタレベル説明可能なセマンティクスを提供するために提案される。
論文 参考訳(メタデータ) (2023-07-08T09:10:43Z) - Open-Domain Hierarchical Event Schema Induction by Incremental Prompting
and Verification [81.17473088621209]
イベントスキーマを,大規模言語モデル(LLM)から導出可能なコモンセンス知識の一形態として扱う。
複雑なイベントグラフの構築を3段階に分割するインクリメンタルなプロンプトおよび検証手法を設計する。
線形化グラフを生成するのにLLMを直接使用するのに比べ、時間関係が7.2%F1、階層関係が31.0%F1の大規模かつ複雑なスキーマを生成することができる。
論文 参考訳(メタデータ) (2023-07-05T01:00:44Z) - Schema-adaptable Knowledge Graph Construction [47.772335354080795]
従来の知識グラフ構築(KGC)アプローチは、通常、事前定義されたスキーマの閉じたセットで静的情報抽出パラダイムに従う。
我々は,スキーマ適応型KGCと呼ばれる新しいタスクを提案する。このタスクは,動的に変化するスキーマグラフに基づいて,再学習せずにエンティティ,リレーション,イベントを継続的に抽出することを目的としている。
論文 参考訳(メタデータ) (2023-05-15T15:06:20Z) - UniKGQA: Unified Retrieval and Reasoning for Solving Multi-hop Question
Answering Over Knowledge Graph [89.98762327725112]
KGQA(Multi-hop Question Answering over Knowledge Graph)は、自然言語の質問で言及されているトピックエンティティから、複数のホップを持つ回答エンティティを見つけることを目的としている。
我々は、モデルアーキテクチャとパラメータ学習の両方において、検索と推論を統合することで、マルチホップKGQAタスクの新しいアプローチであるUniKGQAを提案する。
論文 参考訳(メタデータ) (2022-12-02T04:08:09Z) - Semantic Enhanced Text-to-SQL Parsing via Iteratively Learning Schema
Linking Graph [6.13728903057727]
新しいデータベースへの一般化性は、人間の発話を insql 文を解析することを目的とした Text-to- システムにとって極めて重要である。
本稿では,質問トークンとデータベーススキーマ間のセマンティックなスキーマリンクグラフを反復的に構築するIS ESLというフレームワークを提案する。
3つのベンチマークでの大規模な実験により、IS ESLはベースラインを一貫して上回り、さらなる調査ではその一般化可能性と堅牢性を示している。
論文 参考訳(メタデータ) (2022-08-08T03:59:33Z) - Proton: Probing Schema Linking Information from Pre-trained Language
Models for Text-to-SQL Parsing [66.55478402233399]
本稿では,ポアンカー距離測定に基づく探索手法を用いて,関係構造を抽出する枠組みを提案する。
スキーマリンクの一般的なルールベース手法と比較して,探索関係は意味的対応をしっかりと捉えることができることがわかった。
我々のフレームワークは3つのベンチマークで最先端のパフォーマンスを新たに設定する。
論文 参考訳(メタデータ) (2022-06-28T14:05:25Z) - Improving Multi-task Generalization Ability for Neural Text Matching via
Prompt Learning [54.66399120084227]
最近の最先端のニューラルテキストマッチングモデル(PLM)は、様々なタスクに一般化することが難しい。
我々は、特殊化一般化訓練戦略を採用し、それをMatch-Promptと呼ぶ。
特殊化段階では、異なるマッチングタスクの記述はいくつかのプロンプトトークンにマッピングされる。
一般化段階において、テキストマッチングモデルは、多種多様なマッチングタスクを訓練することにより、本質的なマッチング信号を探索する。
論文 参考訳(メタデータ) (2022-04-06T11:01:08Z) - Contextualizing Meta-Learning via Learning to Decompose [125.76658595408607]
本稿では,メタ学習型サポート・ツー・ターゲット戦略の文脈化を図るために,ネットワーク(LeadNet)を分解する学習を提案する。
LeadNetは、コンテキスト間の比較をポリセムの埋め込みに組み込むことで、右に関連付けられた戦略を自動的に選択することを学ぶ。
論文 参考訳(メタデータ) (2021-06-15T13:10:56Z) - Automated Metadata Harmonization Using Entity Resolution & Contextual
Embedding [0.0]
我々は、Cogntive DatabaseのDb2Vec埋め込みアプローチの助けを借りて、このステップの自動化を実演する。
一致したスキーマとは別に、ターゲットデータモデルの正しい存在論的構造も推測できることを実証する。
論文 参考訳(メタデータ) (2020-10-17T02:14:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。