論文の概要: TabEAno: Table to Knowledge Graph Entity Annotation
- arxiv url: http://arxiv.org/abs/2010.01829v1
- Date: Mon, 5 Oct 2020 07:39:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-10 22:06:40.787555
- Title: TabEAno: Table to Knowledge Graph Entity Annotation
- Title(参考訳): TabEAno: テーブルから知識へのグラフエンティティアノテーション
- Authors: Phuc Nguyen and Natthawut Kertkeidkachorn and Ryutaro Ichise and
Hideaki Takeda
- Abstract要約: 本稿では,テーブル行を知識グラフエンティティに意味論的にアノテートするための新しいアプローチであるTabEAnoを提案する。
表の同じ行の2つの閉セル間の知識グラフに既存の論理的関係が存在するという仮定に基づいて、「2セル」のルックアップ戦略を導入する。
アプローチの単純さにもかかわらず、TabEAnoは2つの標準データセットにおけるアートアプローチの状態を上回ります。
- 参考スコア(独自算出の注目度): 7.451544182579802
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the Open Data era, a large number of table resources have been made
available on the Web and data portals. However, it is difficult to directly
utilize such data due to the ambiguity of entities, name variations,
heterogeneous schema, missing, or incomplete metadata. To address these issues,
we propose a novel approach, namely TabEAno, to semantically annotate table
rows toward knowledge graph entities. Specifically, we introduce a "two-cells"
lookup strategy bases on the assumption that there is an existing logical
relation occurring in the knowledge graph between the two closed cells in the
same row of the table. Despite the simplicity of the approach, TabEAno
outperforms the state of the art approaches in the two standard datasets e.g,
T2D, Limaye with, and in the large-scale Wikipedia tables dataset.
- Abstract(参考訳): Open Dataの時代、多くのテーブルリソースがWebとデータポータルで利用可能になりました。
しかし、エンティティの曖昧さ、名前のバリエーション、異種スキーマ、欠落、あるいは不完全なメタデータのため、そのようなデータを直接利用するのは難しい。
これらの問題に対処するため,知識グラフのエンティティに対してテーブル行を意味的にアノテートするための新しいアプローチであるTabEAnoを提案する。
具体的には、2つの閉セル間の知識グラフに既存の論理的関係が存在するという仮定に基づいて「2セル」のルックアップ戦略をテーブルの同じ行に導入する。
アプローチの単純さにもかかわらず、TabEAnoは2つの標準データセット、例えばT2D、Limaye with、および大規模ウィキペディアのテーブルデータセットにおけるアートアプローチの状態を上回ります。
関連論文リスト
- TRACE: Table Reconstruction Aligned to Corner and Edges [7.536220920052911]
そこで我々は,テーブルがセルで構成され,各セルがエッジからなる境界で構成されているテーブルの自然特性を解析した。
ボトムアップ方式でテーブルを再構築する新しい手法を提案する。
シンプルな設計はモデルを訓練しやすくし、以前の2段階の手法よりも少ない計算を必要とする。
論文 参考訳(メタデータ) (2023-05-01T02:26:15Z) - SEMv2: Table Separation Line Detection Based on Instance Segmentation [96.36188168694781]
SEMv2(SEM: Split, Embed, Merge)と呼ばれるテーブル構造認識器を提案する。
本稿では,テーブル分離ラインのインスタンスレベルの識別問題に対処し,条件付き畳み込みに基づくテーブル分離ライン検出戦略を提案する。
SEMv2を包括的に評価するために、iFLYTABと呼ばれるテーブル構造認識のためのより困難なデータセットも提示する。
論文 参考訳(メタデータ) (2023-03-08T05:15:01Z) - Tab2KG: Semantic Table Interpretation with Lightweight Semantic Profiles [3.655021726150368]
本稿では,テーブルのセマンティック解釈を意図したTab2KGを提案する。
ドメインの概念と関係を豊かにする独自の意味プロファイルを導入し、ドメインとテーブルの特徴を表現する。
既存のセマンティックテーブルの解釈アプローチとは対照的に、Tab2KGはセマンティックプロファイルのみに依存しており、インスタンスのルックアップを必要としない。
論文 参考訳(メタデータ) (2023-02-02T15:12:30Z) - TRUST: An Accurate and End-to-End Table structure Recognizer Using
Splitting-based Transformers [56.56591337457137]
本稿では,TRUSTと呼ばれるテーブル構造認識手法を提案する。
変換器は、大域的な計算、完全メモリ、並列計算のためにテーブル構造認識に適している。
我々はPubTabNetやSynthTableなど,いくつかの人気のあるベンチマークで実験を行い,新しい最先端の結果を得た。
論文 参考訳(メタデータ) (2022-08-31T08:33:36Z) - TGRNet: A Table Graph Reconstruction Network for Table Structure
Recognition [76.06530816349763]
本稿では,表構造認識のためのエンドツーエンドのトレーニング可能な表グラフ再構成ネットワーク(TGRNet)を提案する。
具体的には,異なる細胞の空間的位置と論理的位置を共同で予測するために,細胞検出枝と細胞論理的位置分岐の2つの主枝を有する。
論文 参考訳(メタデータ) (2021-06-20T01:57:05Z) - Retrieving Complex Tables with Multi-Granular Graph Representation
Learning [20.72341939868327]
自然言語テーブル検索の課題は,自然言語クエリに基づいて意味的に関連するテーブルを検索することである。
既存の学習システムは、テーブルがデータフレームとして構成されているという仮定に基づいて、テーブルをプレーンテキストとして扱う。
多粒グラフ表現学習を用いた一般化可能なNLTRフレームワークであるグラフベーステーブル検索(GTR)を提案する。
論文 参考訳(メタデータ) (2021-05-04T20:19:03Z) - TCN: Table Convolutional Network for Web Table Interpretation [52.32515851633981]
テーブル内情報とテーブル間情報の両方を考慮した新しいテーブル表現学習手法を提案する。
カラムタイプ予測ではf1の4.8%、カラム対関係予測ではf1の4.1%で競合ベースラインを上回ることができる。
論文 参考訳(メタデータ) (2021-02-17T02:18:10Z) - A Graph Representation of Semi-structured Data for Web Question
Answering [96.46484690047491]
本稿では、半構造化データとそれらの関係の構成要素の体系的分類に基づいて、Webテーブルとリストのグラフ表現を提案する。
本手法は,最先端のベースラインに対してF1スコアを3.90ポイント向上させる。
論文 参考訳(メタデータ) (2020-10-14T04:01:54Z) - DART: Open-Domain Structured Data Record to Text Generation [91.23798751437835]
82k以上のインスタンス(DART)を持つオープンドメイン構造化DAta Record to Text生成データセットであるDARTを提案する。
本稿では,テーブルヘッダとテーブルタイトル間の意味的依存関係を利用して,その構造を符号化するテーブルから意味的三重項を抽出する手法を提案する。
我々のデータセット構築フレームワークは、オープンドメイン意味解析と対話行動に基づく意味表現タスクからヘテロジニアスソースを効果的に統合する。
論文 参考訳(メタデータ) (2020-07-06T16:35:30Z) - Identifying Table Structure in Documents using Conditional Generative
Adversarial Networks [0.0]
多くの産業や学術研究において、情報は主に構造化されていない文書の形で伝達される。
本稿では,まず,テーブルイメージを標準化されたスケルトンテーブル形式にマッピングするために,条件付き生成逆数ネットワークを用いたトップダウンアプローチを提案する。
次に、xy-cutプロジェクションと遺伝的アルゴリズムを用いた潜在テーブル構造を導出する。
論文 参考訳(メタデータ) (2020-01-13T20:42:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。