論文の概要: Web Table Classification based on Visual Features
- arxiv url: http://arxiv.org/abs/2103.05110v1
- Date: Thu, 25 Feb 2021 07:39:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-05 00:48:18.189990
- Title: Web Table Classification based on Visual Features
- Title(参考訳): 視覚的特徴に基づくWebテーブル分類
- Authors: Babette B\"uhler and Heiko Paulheim
- Abstract要約: テーブルの視覚的な外観を最大限に活用し,web テーブル分類のアプローチを提案する。
ResNet50の微調整によるCNN画像分類の評価は、このアプローチが以前のソリューションに匹敵する結果を達成することを示しています。
- 参考スコア(独自算出の注目度): 1.52292571922932
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tables on the web constitute a valuable data source for many applications,
like factual search and knowledge base augmentation. However, as genuine tables
containing relational knowledge only account for a small proportion of tables
on the web, reliable genuine web table classification is a crucial first step
of table extraction. Previous works usually rely on explicit feature
construction from the HTML code. In contrast, we propose an approach for web
table classification by exploiting the full visual appearance of a table, which
works purely by applying a convolutional neural network on the rendered image
of the web table. Since these visual features can be extracted automatically,
our approach circumvents the need for explicit feature construction. A new hand
labeled gold standard dataset containing HTML source code and images for 13,112
tables was generated for this task. Transfer learning techniques are applied to
well known VGG16 and ResNet50 architectures. The evaluation of CNN image
classification with fine tuned ResNet50 (F1 93.29%) shows that this approach
achieves results comparable to previous solutions using explicitly defined HTML
code based features. By combining visual and explicit features, an F-measure of
93.70% can be achieved by Random Forest classification, which beats current
state of the art methods.
- Abstract(参考訳): web上のテーブルは、事実検索や知識ベース拡張など、多くのアプリケーションにとって貴重なデータソースとなります。
しかし、関係知識を含む真のテーブルは、web上のテーブルのごく一部を占めるため、信頼できる本物のwebテーブルの分類は、テーブル抽出の第一段階である。
以前の作業は通常、htmlコードからの明示的な機能構築に依存している。
対照的に、Webテーブルのレンダリング画像に畳み込みニューラルネットワークを適用することによって純粋に機能するテーブルの完全な視覚的外観を活用することにより、Webテーブル分類のためのアプローチを提案する。
これらの視覚的特徴を自動抽出できるので、明示的な特徴構築の必要性を回避することができる。
このタスクのために、HTMLソースコードと13,112のテーブルの画像を含む新しい手書きゴールド標準データセットが作成された。
転送学習技術はよく知られたVGG16とResNet50アーキテクチャに適用される。
resnet50(f1 93.29%)の微調整によるcnn画像分類の評価は、このアプローチが、htmlコードベースの明示的に定義された機能を使用して、以前のソリューションに匹敵する結果が得られることを示している。
視覚的特徴と明示的な特徴を組み合わせることで、93.70%のF尺度をランダムフォレスト分類によって達成することができる。
関連論文リスト
- UniTabNet: Bridging Vision and Language Models for Enhanced Table Structure Recognition [55.153629718464565]
我々は、画像からテキストへのモデルに基づくテーブル構造解析のための新しいフレームワークUniTabNetを紹介する。
UniTabNetは、画像とテキストのモデルを使ってテーブルセルを分離し、物理デコーダと論理デコーダを統合して完全なテーブル構造を再構築する。
論文 参考訳(メタデータ) (2024-09-20T01:26:32Z) - TabPedia: Towards Comprehensive Visual Table Understanding with Concept Synergy [81.76462101465354]
本稿では,概念相乗効果機構を備えた新しい大型視触覚モデルTabPediaを提案する。
この統合されたフレームワークにより、TabPediaはテーブル検出、テーブル構造認識、テーブルクエリ、テーブル質問応答などのVTUタスクをシームレスに統合できる。
実世界のシナリオにおけるVTUタスクをよりよく評価するために、新しい総合的なテーブルVQAベンチマークComTQAを構築した。
論文 参考訳(メタデータ) (2024-06-03T13:54:05Z) - Rethinking Image-based Table Recognition Using Weakly Supervised Methods [3.9993134366218857]
本稿では,WSTabNet というテーブル認識のための弱教師付きモデルを提案する。
深層学習によるテーブル認識を容易にするため、ウィキペディアから構築された最大規模の表画像ベースデータセットであるWikiTableSetを作成した。
論文 参考訳(メタデータ) (2023-03-14T06:03:57Z) - Data augmentation on graphs for table type classification [1.1859913430860336]
グラフニューラルネットワークを用いてテーブルの分類を行い、使用中のメッセージパッシングアルゴリズムのテーブル構造を利用する。
我々は,グラフベースの表表現に適したデータ拡張手法を提案することで,有望な予備結果を実現する。
論文 参考訳(メタデータ) (2022-08-23T21:54:46Z) - Generating Table Vector Representations [11.092714216647245]
本稿では,テーブル・ツー・クラスアノテーションの手法の評価を行う。
テーブル分類を機械学習タスクとして形式的に定義する。
論文 参考訳(メタデータ) (2021-10-28T14:05:21Z) - TGRNet: A Table Graph Reconstruction Network for Table Structure
Recognition [76.06530816349763]
本稿では,表構造認識のためのエンドツーエンドのトレーニング可能な表グラフ再構成ネットワーク(TGRNet)を提案する。
具体的には,異なる細胞の空間的位置と論理的位置を共同で予測するために,細胞検出枝と細胞論理的位置分岐の2つの主枝を有する。
論文 参考訳(メタデータ) (2021-06-20T01:57:05Z) - Multi-Type-TD-TSR -- Extracting Tables from Document Images using a
Multi-stage Pipeline for Table Detection and Table Structure Recognition:
from OCR to Structured Table Representations [63.98463053292982]
テーブルの認識は、テーブル検出とテーブル構造認識という2つの主要なタスクから構成される。
最近の研究は、テーブル構造認識のタスクにトランスファーラーニングを併用したディープラーニングアプローチへの明確な傾向を示している。
本稿では,テーブル認識問題に対するエンドツーエンドのソリューションを提供するMulti-Type-TD-TSRというマルチステージパイプラインを提案する。
論文 参考訳(メタデータ) (2021-05-23T21:17:18Z) - TCN: Table Convolutional Network for Web Table Interpretation [52.32515851633981]
テーブル内情報とテーブル間情報の両方を考慮した新しいテーブル表現学習手法を提案する。
カラムタイプ予測ではf1の4.8%、カラム対関係予測ではf1の4.1%で競合ベースラインを上回ることができる。
論文 参考訳(メタデータ) (2021-02-17T02:18:10Z) - A Graph Representation of Semi-structured Data for Web Question
Answering [96.46484690047491]
本稿では、半構造化データとそれらの関係の構成要素の体系的分類に基づいて、Webテーブルとリストのグラフ表現を提案する。
本手法は,最先端のベースラインに対してF1スコアを3.90ポイント向上させる。
論文 参考訳(メタデータ) (2020-10-14T04:01:54Z) - TURL: Table Understanding through Representation Learning [29.6016859927782]
TURLは、リレーショナルWebテーブルに事前トレーニング/ファインタニングパラダイムを導入する新しいフレームワークである。
事前学習中、我々のフレームワークは教師なしの方法で関係表上の深い文脈化された表現を学習する。
我々は,TURLがすべてのタスクを一般化し,既存のメソッドをほぼすべてのインスタンスで大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2020-06-26T05:44:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。