論文の概要: Generating Table Vector Representations
- arxiv url: http://arxiv.org/abs/2110.15132v1
- Date: Thu, 28 Oct 2021 14:05:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-30 00:08:51.263858
- Title: Generating Table Vector Representations
- Title(参考訳): テーブルベクトル表現の生成
- Authors: Aneta Koleva, Martin Ringsquandl, Mitchell Joblin, Volker Tresp
- Abstract要約: 本稿では,テーブル・ツー・クラスアノテーションの手法の評価を行う。
テーブル分類を機械学習タスクとして形式的に定義する。
- 参考スコア(独自算出の注目度): 11.092714216647245
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: High-quality Web tables are rich sources of information that can be used to
populate Knowledge Graphs (KG). The focus of this paper is an evaluation of
methods for table-to-class annotation, which is a sub-task of Table
Interpretation (TI). We provide a formal definition for table classification as
a machine learning task. We propose an experimental setup and we evaluate 5
fundamentally different approaches to find the best method for generating
vector table representations. Our findings indicate that although transfer
learning methods achieve high F1 score on the table classification task,
dedicated table encoding models are a promising direction as they appear to
capture richer semantics.
- Abstract(参考訳): 高品質なwebテーブルは、知識グラフ(kg)の投入に使用できる豊富な情報ソースである。
本稿では,表解釈(ti)のサブタスクである表からクラスへのアノテーション手法の評価を行う。
機械学習タスクとして,テーブル分類の形式的定義を提案する。
実験的な設定を提案し,ベクトルテーブル表現を生成する最良の方法を見つけるために,基本的に異なる5つのアプローチを評価する。
提案手法は, 表分類作業において高いF1スコアを達成するが, よりリッチなセマンティクスを捉えるために, 専用テーブル符号化モデルは有望な方向であることが示唆された。
関連論文リスト
- UniTabNet: Bridging Vision and Language Models for Enhanced Table Structure Recognition [55.153629718464565]
我々は、画像からテキストへのモデルに基づくテーブル構造解析のための新しいフレームワークUniTabNetを紹介する。
UniTabNetは、画像とテキストのモデルを使ってテーブルセルを分離し、物理デコーダと論理デコーダを統合して完全なテーブル構造を再構築する。
論文 参考訳(メタデータ) (2024-09-20T01:26:32Z) - ClusterTabNet: Supervised clustering method for table detection and table structure recognition [0.0]
文書中の単語をクラスタリングする深層学習に基づく新しい手法を提案する。
表構造ボトムアップを一対の単語間の関係グラフとして解釈し、変圧器エンコーダモデルを用いてその隣接行列を予測する。
DETRやFaster R-CNNのような現在の最先端検出手法と比較して,本手法は比較的小さなモデルを必要とするが,類似性や精度が向上する。
論文 参考訳(メタデータ) (2024-02-12T09:10:24Z) - A Review On Table Recognition Based On Deep Learning [0.0]
テーブル認識は、コンピュータを使用してテーブルを自動的に理解しています。
ディープラーニング技術の発展は、この分野に新しいパラダイムをもたらした。
本稿では,5つの側面から表認識の問題について議論する。
論文 参考訳(メタデータ) (2023-12-08T02:58:00Z) - HeLM: Highlighted Evidence augmented Language Model for Enhanced Table-to-Text Generation [7.69801337810352]
LLaMA2モデル上でパラメータ効率の良い微調整を行う。
我々のアプローチは、テーブル固有の行データを強調することにより、推論情報を入力に注入することである。
FetaQAデータセットとQTSummデータセットの両方で、我々のアプローチは最先端の結果を得た。
論文 参考訳(メタデータ) (2023-11-15T12:02:52Z) - Data augmentation on graphs for table type classification [1.1859913430860336]
グラフニューラルネットワークを用いてテーブルの分類を行い、使用中のメッセージパッシングアルゴリズムのテーブル構造を利用する。
我々は,グラフベースの表表現に適したデータ拡張手法を提案することで,有望な予備結果を実現する。
論文 参考訳(メタデータ) (2022-08-23T21:54:46Z) - Table Retrieval May Not Necessitate Table-specific Model Design [83.27735758203089]
テーブル検索のタスクに焦点をあてて、"テーブル固有のモデル設計はテーブル検索に必要か?
自然質問データセット (NQ-table) の表に基づく分析の結果, 70%以上の症例では構造が無視できる役割を担っていることがわかった。
次に、テーブル構造、すなわち補助列/カラム埋め込み、ハードアテンションマスク、ソフトリレーションに基づくアテンションバイアスを明示的にエンコードする3つのモジュールを実験する。
いずれも大きな改善は得られず、テーブル固有のモデル設計がテーブル検索に不要である可能性が示唆された。
論文 参考訳(メタデータ) (2022-05-19T20:35:23Z) - TGRNet: A Table Graph Reconstruction Network for Table Structure
Recognition [76.06530816349763]
本稿では,表構造認識のためのエンドツーエンドのトレーニング可能な表グラフ再構成ネットワーク(TGRNet)を提案する。
具体的には,異なる細胞の空間的位置と論理的位置を共同で予測するために,細胞検出枝と細胞論理的位置分岐の2つの主枝を有する。
論文 参考訳(メタデータ) (2021-06-20T01:57:05Z) - Tab.IAIS: Flexible Table Recognition and Semantic Interpretation System [84.39812458417246]
完全テーブル認識処理を行い、最も頻繁なテーブル形式をサポートする2つのルールベースのアルゴリズムを開発する。
意味情報の抽出をテーブル認識プロセスに組み込むため,グラフに基づくテーブル解釈法を開発した。
我々のテーブル認識アプローチは、最先端のアプローチと競合する結果を得る。
論文 参考訳(メタデータ) (2021-05-25T12:31:02Z) - A Graph Representation of Semi-structured Data for Web Question
Answering [96.46484690047491]
本稿では、半構造化データとそれらの関係の構成要素の体系的分類に基づいて、Webテーブルとリストのグラフ表現を提案する。
本手法は,最先端のベースラインに対してF1スコアを3.90ポイント向上させる。
論文 参考訳(メタデータ) (2020-10-14T04:01:54Z) - Understanding tables with intermediate pre-training [11.96734018295146]
我々は、テーブルベースのBERTモデルであるTAPAASを適用して、エンターテイメントを認識する。
我々は,テーブルプルーニングを前処理ステップとして評価し,トレーニングと予測効率を大幅に向上させる。
論文 参考訳(メタデータ) (2020-10-01T17:43:27Z) - GraPPa: Grammar-Augmented Pre-Training for Table Semantic Parsing [117.98107557103877]
テーブルセマンティック解析のための効果的な事前学習手法GraPPaを提案する。
我々は、同期文脈自由文法を用いて、高自由度テーブル上に合成質問ペアを構築する。
実世界のデータを表現できるモデルの能力を維持するため、マスキング言語モデリングも含んでいる。
論文 参考訳(メタデータ) (2020-09-29T08:17:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。