論文の概要: Metric-Type Identification for Multi-Level Header Numerical Tables in
Scientific Papers
- arxiv url: http://arxiv.org/abs/2102.00819v1
- Date: Mon, 1 Feb 2021 15:09:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-03 05:12:38.234064
- Title: Metric-Type Identification for Multi-Level Header Numerical Tables in
Scientific Papers
- Title(参考訳): 科学論文におけるマルチレベルヘッダ数値表のメトリック型同定
- Authors: Lya Hulliyyatus Suadaa, Hidetaka Kamigaito, Manabu Okumura, Hiroya
Takamura
- Abstract要約: マルチレベルヘッダ数値テーブルから距離型識別を行う新しい情報抽出タスクを提案する。
ヘッダテーブル,キャプション,メトリックタイプからなる科学論文から抽出したデータセットを提供する。
実験の結果,関節モデルでは,頭部内および頭部外距離型識別の両問題に対処できることがわかった。
- 参考スコア(独自算出の注目度): 28.13435437149847
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Numerical tables are widely used to present experimental results in
scientific papers. For table understanding, a metric-type is essential to
discriminate numbers in the tables. We introduce a new information extraction
task, metric-type identification from multi-level header numerical tables, and
provide a dataset extracted from scientific papers consisting of header tables,
captions, and metric-types. We then propose two joint-learning neural
classification and generation schemes featuring pointer-generator-based and
BERT-based models. Our results show that the joint models can handle both
in-header and out-of-header metric-type identification problems.
- Abstract(参考訳): 数値表は科学論文に実験結果を示すために広く使われている。
テーブル理解のためには、テーブル内の数値を識別するためにメトリクス型が不可欠です。
本稿では,新しい情報抽出タスク,多レベルヘッダ数値表からのメトリックタイプ識別,ヘッダテーブル,キャプション,メトリックタイプからなる科学論文から抽出したデータセットを提案する。
そこで我々は,ポインタ生成モデルとBERTモデルを用いた2つの共同学習型ニューラル分類と生成方式を提案する。
その結果, 共同モデルは, ヘッド内とヘッド外の両方のメトリック型識別問題に対処できることが示された。
関連論文リスト
- Making Pre-trained Language Models Great on Tabular Prediction [50.70574370855663]
ディープニューラルネットワーク(DNN)の転送性は、画像および言語処理において著しく進歩している。
本稿では,表型データ予測のための訓練済みLMであるTP-BERTaを提案する。
新たな相対等級トークン化では、スカラー数値の特徴値を細分化した高次元トークンに変換し、特徴値と対応する特徴名を統合する。
論文 参考訳(メタデータ) (2024-03-04T08:38:56Z) - arXiVeri: Automatic table verification with GPT [44.388120096898554]
自動表検証(AutoTV)の新たな課題を提案する。
本研究の目的は,参照ソースを相互参照することで,テーブル内の数値データの精度を検証することである。
現代の大規模言語モデル(LLM)の柔軟性を活用して,テーブル検証のためのシンプルなベースラインを提案する。
論文 参考訳(メタデータ) (2023-06-13T17:59:57Z) - STUNT: Few-shot Tabular Learning with Self-generated Tasks from
Unlabeled Tables [64.0903766169603]
我々は,Unlabeled Tables (STUNT) からの自己生成タスクを作成した,数発のセミ教師付き学習のためのフレームワークを提案する。
私たちのキーとなるアイデアは、ランダムに選択された列をターゲットラベルとして扱うことで、多様なショットタスクを自己生成することです。
次に、メタラーニング手法を用いて、構築されたタスクで一般化可能な知識を学習する。
論文 参考訳(メタデータ) (2023-03-02T02:37:54Z) - TabLLM: Few-shot Classification of Tabular Data with Large Language
Models [66.03023402174138]
大規模言語モデルのゼロショットおよび少数ショット分類への応用について検討する。
テンプレートやテーブル・ツー・テキストモデル,大規模言語モデルなど,いくつかのシリアライズ手法を評価する。
このアプローチは、勾配木のような強力な伝統的なベースラインとも競合する。
論文 参考訳(メタデータ) (2022-10-19T17:08:13Z) - Table Detection in the Wild: A Novel Diverse Table Detection Dataset and
Method [1.3814823347690746]
テーブル検出のための大規模データセットを7万以上のサンプルで紹介する。
また、文書中のテーブル構造を検出する畳み込みニューラルネットワークを用いたベースライン結果も提示する。
論文 参考訳(メタデータ) (2022-08-31T14:20:30Z) - Data augmentation on graphs for table type classification [1.1859913430860336]
グラフニューラルネットワークを用いてテーブルの分類を行い、使用中のメッセージパッシングアルゴリズムのテーブル構造を利用する。
我々は,グラフベースの表表現に適したデータ拡張手法を提案することで,有望な予備結果を実現する。
論文 参考訳(メタデータ) (2022-08-23T21:54:46Z) - Graph Neural Networks and Representation Embedding for Table Extraction
in PDF Documents [1.1859913430860336]
この研究の主な貢献は、グラフニューラルネットワークを利用したテーブル抽出の問題に取り組むことである。
PubLayNetおよびPubTables-1Mデータセットに提供される情報をマージして得られた新しいデータセットに対する提案手法を実験的に評価した。
論文 参考訳(メタデータ) (2022-08-23T21:36:01Z) - Tab2Know: Building a Knowledge Base from Tables in Scientific Papers [6.514665180383298]
本稿では,学術論文の表から知識ベースを構築するための,新たなエンドツーエンドシステムであるTab2Knowを紹介する。
統計に基づく分類器と論理に基づく推論の両方を利用するパイプラインを提案する。
コンピュータサイエンス分野における論文のコーパスを用いたアプローチの実証評価は,満足度を回復した。
論文 参考訳(メタデータ) (2021-07-28T11:56:53Z) - TGRNet: A Table Graph Reconstruction Network for Table Structure
Recognition [76.06530816349763]
本稿では,表構造認識のためのエンドツーエンドのトレーニング可能な表グラフ再構成ネットワーク(TGRNet)を提案する。
具体的には,異なる細胞の空間的位置と論理的位置を共同で予測するために,細胞検出枝と細胞論理的位置分岐の2つの主枝を有する。
論文 参考訳(メタデータ) (2021-06-20T01:57:05Z) - Multi-Type-TD-TSR -- Extracting Tables from Document Images using a
Multi-stage Pipeline for Table Detection and Table Structure Recognition:
from OCR to Structured Table Representations [63.98463053292982]
テーブルの認識は、テーブル検出とテーブル構造認識という2つの主要なタスクから構成される。
最近の研究は、テーブル構造認識のタスクにトランスファーラーニングを併用したディープラーニングアプローチへの明確な傾向を示している。
本稿では,テーブル認識問題に対するエンドツーエンドのソリューションを提供するMulti-Type-TD-TSRというマルチステージパイプラインを提案する。
論文 参考訳(メタデータ) (2021-05-23T21:17:18Z) - A Graph Representation of Semi-structured Data for Web Question
Answering [96.46484690047491]
本稿では、半構造化データとそれらの関係の構成要素の体系的分類に基づいて、Webテーブルとリストのグラフ表現を提案する。
本手法は,最先端のベースラインに対してF1スコアを3.90ポイント向上させる。
論文 参考訳(メタデータ) (2020-10-14T04:01:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。