論文の概要: Tab2KG: Semantic Table Interpretation with Lightweight Semantic Profiles
- arxiv url: http://arxiv.org/abs/2302.01150v1
- Date: Thu, 2 Feb 2023 15:12:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-03 13:33:59.580653
- Title: Tab2KG: Semantic Table Interpretation with Lightweight Semantic Profiles
- Title(参考訳): Tab2KG:軽量セマンティックプロファイルを用いたセマンティックテーブル解釈
- Authors: Simon Gottschalk, Elena Demidova
- Abstract要約: 本稿では,テーブルのセマンティック解釈を意図したTab2KGを提案する。
ドメインの概念と関係を豊かにする独自の意味プロファイルを導入し、ドメインとテーブルの特徴を表現する。
既存のセマンティックテーブルの解釈アプローチとは対照的に、Tab2KGはセマンティックプロファイルのみに依存しており、インスタンスのルックアップを必要としない。
- 参考スコア(独自算出の注目度): 3.655021726150368
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tabular data plays an essential role in many data analytics and machine
learning tasks. Typically, tabular data does not possess any machine-readable
semantics. In this context, semantic table interpretation is crucial for making
data analytics workflows more robust and explainable. This article proposes
Tab2KG - a novel method that targets at the interpretation of tables with
previously unseen data and automatically infers their semantics to transform
them into semantic data graphs. We introduce original lightweight semantic
profiles that enrich a domain ontology's concepts and relations and represent
domain and table characteristics. We propose a one-shot learning approach that
relies on these profiles to map a tabular dataset containing previously unseen
instances to a domain ontology. In contrast to the existing semantic table
interpretation approaches, Tab2KG relies on the semantic profiles only and does
not require any instance lookup. This property makes Tab2KG particularly
suitable in the data analytics context, in which data tables typically contain
new instances. Our experimental evaluation on several real-world datasets from
different application domains demonstrates that Tab2KG outperforms
state-of-the-art semantic table interpretation baselines.
- Abstract(参考訳): 表データは多くのデータ分析や機械学習タスクにおいて重要な役割を果たす。
通常、表データには機械可読セマンティクスがない。
この文脈では、データ分析ワークフローをより堅牢で説明しやすいものにするために、セマンティックテーブル解釈が不可欠です。
本稿では,テーブルを非表示データで解釈し,セマンティクスを自動的に推論して意味データグラフに変換する新しい方法であるTab2KGを提案する。
ドメインオントロジーの概念と関係を豊かにし、ドメインとテーブルの特徴を表現する、オリジナル軽量なセマンティックプロファイルを導入する。
本稿では,これらのプロファイルを用いて,未発見のインスタンスを含む表型データセットをドメインオントロジーにマップする,ワンショット学習手法を提案する。
既存のセマンティックテーブルの解釈アプローチとは対照的に、Tab2KGはセマンティックプロファイルのみに依存しており、インスタンスのルックアップを必要としない。
この特性により、tab2kgは、データテーブルが通常新しいインスタンスを含むデータ分析コンテキストに特に適している。
異なるアプリケーション領域からの複数の実世界のデータセットに対する実験的評価により、Tab2KGは最先端のセマンティックテーブル解釈ベースラインより優れていることが示された。
関連論文リスト
- UniTabNet: Bridging Vision and Language Models for Enhanced Table Structure Recognition [55.153629718464565]
我々は、画像からテキストへのモデルに基づくテーブル構造解析のための新しいフレームワークUniTabNetを紹介する。
UniTabNetは、画像とテキストのモデルを使ってテーブルセルを分離し、物理デコーダと論理デコーダを統合して完全なテーブル構造を再構築する。
論文 参考訳(メタデータ) (2024-09-20T01:26:32Z) - Training-Free Generalization on Heterogeneous Tabular Data via
Meta-Representation [67.30538142519067]
メタ表現(TabPTM)を用いたタブラルデータ事前学習を提案する。
深層ニューラルネットワークは、これらのメタ表現とデータセット固有の分類信頼度を関連付けるように訓練される。
実験により、TabPTMは、数ショットのシナリオであっても、新しいデータセットで有望なパフォーマンスを達成することを確認した。
論文 参考訳(メタデータ) (2023-10-31T18:03:54Z) - SEMv2: Table Separation Line Detection Based on Instance Segmentation [96.36188168694781]
SEMv2(SEM: Split, Embed, Merge)と呼ばれるテーブル構造認識器を提案する。
本稿では,テーブル分離ラインのインスタンスレベルの識別問題に対処し,条件付き畳み込みに基づくテーブル分離ライン検出戦略を提案する。
SEMv2を包括的に評価するために、iFLYTABと呼ばれるテーブル構造認識のためのより困難なデータセットも提示する。
論文 参考訳(メタデータ) (2023-03-08T05:15:01Z) - Data augmentation on graphs for table type classification [1.1859913430860336]
グラフニューラルネットワークを用いてテーブルの分類を行い、使用中のメッセージパッシングアルゴリズムのテーブル構造を利用する。
我々は,グラフベースの表表現に適したデータ拡張手法を提案することで,有望な予備結果を実現する。
論文 参考訳(メタデータ) (2022-08-23T21:54:46Z) - Table Retrieval May Not Necessitate Table-specific Model Design [83.27735758203089]
テーブル検索のタスクに焦点をあてて、"テーブル固有のモデル設計はテーブル検索に必要か?
自然質問データセット (NQ-table) の表に基づく分析の結果, 70%以上の症例では構造が無視できる役割を担っていることがわかった。
次に、テーブル構造、すなわち補助列/カラム埋め込み、ハードアテンションマスク、ソフトリレーションに基づくアテンションバイアスを明示的にエンコードする3つのモジュールを実験する。
いずれも大きな改善は得られず、テーブル固有のモデル設計がテーブル検索に不要である可能性が示唆された。
論文 参考訳(メタデータ) (2022-05-19T20:35:23Z) - TABBIE: Pretrained Representations of Tabular Data [22.444607481407633]
表データのみから学習する単純な事前学習目標を考案する。
競合するアプローチとは異なり、我々のモデル(TABBIE)は全てのテーブルサブストラクチャの埋め込みを提供する。
学習したセル,列,行の表現を定性的に分析した結果,複雑なテーブルの意味や数値的傾向が理解できた。
論文 参考訳(メタデータ) (2021-05-06T11:15:16Z) - Semantic Labeling Using a Deep Contextualized Language Model [9.719972529205101]
本研究では,コラム値と文脈の両方を用いた文脈認識型セマンティックラベリング手法を提案する。
我々の新しい手法はセマンティックラベリングの新しい設定に基づいており、ヘッダーを欠いた入力テーブルのラベルを逐次予測する。
我々の知る限りでは、BERTをセマンティックラベリングタスクの解決に成功させたのは、私たちが初めてです。
論文 参考訳(メタデータ) (2020-10-30T03:04:22Z) - A Graph Representation of Semi-structured Data for Web Question
Answering [96.46484690047491]
本稿では、半構造化データとそれらの関係の構成要素の体系的分類に基づいて、Webテーブルとリストのグラフ表現を提案する。
本手法は,最先端のベースラインに対してF1スコアを3.90ポイント向上させる。
論文 参考訳(メタデータ) (2020-10-14T04:01:54Z) - TabEAno: Table to Knowledge Graph Entity Annotation [7.451544182579802]
本稿では,テーブル行を知識グラフエンティティに意味論的にアノテートするための新しいアプローチであるTabEAnoを提案する。
表の同じ行の2つの閉セル間の知識グラフに既存の論理的関係が存在するという仮定に基づいて、「2セル」のルックアップ戦略を導入する。
アプローチの単純さにもかかわらず、TabEAnoは2つの標準データセットにおけるアートアプローチの状態を上回ります。
論文 参考訳(メタデータ) (2020-10-05T07:39:02Z) - GraPPa: Grammar-Augmented Pre-Training for Table Semantic Parsing [117.98107557103877]
テーブルセマンティック解析のための効果的な事前学習手法GraPPaを提案する。
我々は、同期文脈自由文法を用いて、高自由度テーブル上に合成質問ペアを構築する。
実世界のデータを表現できるモデルの能力を維持するため、マスキング言語モデリングも含んでいる。
論文 参考訳(メタデータ) (2020-09-29T08:17:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。