論文の概要: Data augmentation on graphs for table type classification
- arxiv url: http://arxiv.org/abs/2208.11210v1
- Date: Tue, 23 Aug 2022 21:54:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-25 12:40:53.231824
- Title: Data augmentation on graphs for table type classification
- Title(参考訳): 表型分類のためのグラフ上のデータ拡張
- Authors: Davide del Bimbo and Andrea Gemelli and Simone Marinai
- Abstract要約: グラフニューラルネットワークを用いてテーブルの分類を行い、使用中のメッセージパッシングアルゴリズムのテーブル構造を利用する。
我々は,グラフベースの表表現に適したデータ拡張手法を提案することで,有望な予備結果を実現する。
- 参考スコア(独自算出の注目度): 1.1859913430860336
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Tables are widely used in documents because of their compact and structured
representation of information. In particular, in scientific papers, tables can
sum up novel discoveries and summarize experimental results, making the
research comparable and easily understandable by scholars. Since the layout of
tables is highly variable, it would be useful to interpret their content and
classify them into categories. This could be helpful to directly extract
information from scientific papers, for instance comparing performance of some
models given their paper result tables. In this work, we address the
classification of tables using a Graph Neural Network, exploiting the table
structure for the message passing algorithm in use. We evaluate our model on a
subset of the Tab2Know dataset. Since it contains few examples manually
annotated, we propose data augmentation techniques directly on the table graph
structures. We achieve promising preliminary results, proposing a data
augmentation method suitable for graph-based table representation.
- Abstract(参考訳): テーブルはコンパクトで構造化された情報の表現のため、ドキュメントで広く使われている。
特に科学論文では、新しい発見をまとめ、実験結果を要約し、研究者による研究に匹敵し、容易に理解できるようにすることができる。
テーブルのレイアウトは非常に可変であるため、それらの内容を解釈してカテゴリに分類することは有用だろう。
これは科学論文から情報を直接抽出するのに役立ち、例えば、論文結果表を与えられたいくつかのモデルのパフォーマンスを比較するのに役立ちます。
本研究では,グラフニューラルネットワークを用いて表の分類を行い,使用中のメッセージパッシングアルゴリズムのテーブル構造を利用する。
我々はTab2Knowデータセットのサブセットでモデルを評価する。
手動でアノテートした例がほとんどないため,テーブルグラフ構造上で直接データ拡張手法を提案する。
本稿では,グラフに基づく表表現に適したデータ拡張手法を提案する。
関連論文リスト
- TabGraphs: A Benchmark and Strong Baselines for Learning on Graphs with Tabular Node Features [17.277932238538302]
タブラル機械学習はグラフ機械学習の手法の恩恵を受けるかもしれない。
グラフニューラルネットワーク(GNN)は、予測性能が向上することが多い。
単純な機能前処理により、GNNと競合し、さらに性能も向上する。
論文 参考訳(メタデータ) (2024-09-22T15:53:19Z) - UniTabNet: Bridging Vision and Language Models for Enhanced Table Structure Recognition [55.153629718464565]
我々は、画像からテキストへのモデルに基づくテーブル構造解析のための新しいフレームワークUniTabNetを紹介する。
UniTabNetは、画像とテキストのモデルを使ってテーブルセルを分離し、物理デコーダと論理デコーダを統合して完全なテーブル構造を再構築する。
論文 参考訳(メタデータ) (2024-09-20T01:26:32Z) - StructChart: Perception, Structuring, Reasoning for Visual Chart
Understanding [58.38480335579541]
現在のチャート関連タスクは、視覚チャートから情報を抽出することを参照するチャート認識か、抽出されたデータから推論を行うかに焦点を当てている。
本稿では,共同認識と推論タスクのための統一的でラベル効率のよい学習パラダイムを確立することを目的とする。
各種のチャート関連タスクで実験を行い、統合されたチャート認識推論パラダイムの有効性と有望な可能性を実証した。
論文 参考訳(メタデータ) (2023-09-20T12:51:13Z) - TabGSL: Graph Structure Learning for Tabular Data Prediction [10.66048003460524]
本稿では,グラフ構造学習(Tabular Graph Structure Learning, TabGSL)という新しい手法を提案する。
30のベンチマークデータセットで実施された実験では、TabGSLがツリーベースモデルと最近のディープラーニングベースモデルの両方を著しく上回っていることが示されている。
論文 参考訳(メタデータ) (2023-05-25T08:33:48Z) - Doc2SoarGraph: Discrete Reasoning over Visually-Rich Table-Text
Documents via Semantic-Oriented Hierarchical Graphs [79.0426838808629]
視覚的にリッチなテーブルテキスト文書に答えるTAT-DQAを提案する。
具体的には、離散推論機能を強化した新しいDoc2SoarGraphフレームワークを提案する。
我々は,TAT-DQAデータセットに関する広範な実験を行い,提案したフレームワークは,テストセット上でのエクサクティマッチ(EM)とF1スコアでそれぞれ17.73%,F1スコアで16.91%の最高のベースラインモデルを上回る結果を得た。
論文 参考訳(メタデータ) (2023-05-03T07:30:32Z) - Graph Neural Networks and Representation Embedding for Table Extraction
in PDF Documents [1.1859913430860336]
この研究の主な貢献は、グラフニューラルネットワークを利用したテーブル抽出の問題に取り組むことである。
PubLayNetおよびPubTables-1Mデータセットに提供される情報をマージして得られた新しいデータセットに対する提案手法を実験的に評価した。
論文 参考訳(メタデータ) (2022-08-23T21:36:01Z) - Table Retrieval May Not Necessitate Table-specific Model Design [83.27735758203089]
テーブル検索のタスクに焦点をあてて、"テーブル固有のモデル設計はテーブル検索に必要か?
自然質問データセット (NQ-table) の表に基づく分析の結果, 70%以上の症例では構造が無視できる役割を担っていることがわかった。
次に、テーブル構造、すなわち補助列/カラム埋め込み、ハードアテンションマスク、ソフトリレーションに基づくアテンションバイアスを明示的にエンコードする3つのモジュールを実験する。
いずれも大きな改善は得られず、テーブル固有のモデル設計がテーブル検索に不要である可能性が示唆された。
論文 参考訳(メタデータ) (2022-05-19T20:35:23Z) - Generating Table Vector Representations [11.092714216647245]
本稿では,テーブル・ツー・クラスアノテーションの手法の評価を行う。
テーブル分類を機械学習タスクとして形式的に定義する。
論文 参考訳(メタデータ) (2021-10-28T14:05:21Z) - TGRNet: A Table Graph Reconstruction Network for Table Structure
Recognition [76.06530816349763]
本稿では,表構造認識のためのエンドツーエンドのトレーニング可能な表グラフ再構成ネットワーク(TGRNet)を提案する。
具体的には,異なる細胞の空間的位置と論理的位置を共同で予測するために,細胞検出枝と細胞論理的位置分岐の2つの主枝を有する。
論文 参考訳(メタデータ) (2021-06-20T01:57:05Z) - Retrieving Complex Tables with Multi-Granular Graph Representation
Learning [20.72341939868327]
自然言語テーブル検索の課題は,自然言語クエリに基づいて意味的に関連するテーブルを検索することである。
既存の学習システムは、テーブルがデータフレームとして構成されているという仮定に基づいて、テーブルをプレーンテキストとして扱う。
多粒グラフ表現学習を用いた一般化可能なNLTRフレームワークであるグラフベーステーブル検索(GTR)を提案する。
論文 参考訳(メタデータ) (2021-05-04T20:19:03Z) - A Graph Representation of Semi-structured Data for Web Question
Answering [96.46484690047491]
本稿では、半構造化データとそれらの関係の構成要素の体系的分類に基づいて、Webテーブルとリストのグラフ表現を提案する。
本手法は,最先端のベースラインに対してF1スコアを3.90ポイント向上させる。
論文 参考訳(メタデータ) (2020-10-14T04:01:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。