論文の概要: Towards End-to-End Semi-Supervised Table Detection with Deformable
Transformer
- arxiv url: http://arxiv.org/abs/2305.02769v2
- Date: Sun, 7 May 2023 20:06:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-09 11:23:03.226902
- Title: Towards End-to-End Semi-Supervised Table Detection with Deformable
Transformer
- Title(参考訳): 変形可能な変圧器を用いた端端端端の半監督テーブル検出に向けて
- Authors: Tahira Shehzadi, Khurram Azeem Hashmi, Didier Stricker, Marcus Liwicki
and Muhammad Zeshan Afzal
- Abstract要約: テーブル検出は、ドキュメントイメージ内のテーブルオブジェクトを分類し、ローカライズするタスクである。
多くの半教師付きアプローチが、大量のラベルデータの必要性を軽減するために導入されている。
本稿では,テーブルオブジェクトの検出にデフォルマブルトランスを用いた,エンド・ツー・エンドの半教師付きテーブル検出手法を提案する。
- 参考スコア(独自算出の注目度): 11.648151981111436
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Table detection is the task of classifying and localizing table objects
within document images. With the recent development in deep learning methods,
we observe remarkable success in table detection. However, a significant amount
of labeled data is required to train these models effectively. Many
semi-supervised approaches are introduced to mitigate the need for a
substantial amount of label data. These approaches use CNN-based detectors that
rely on anchor proposals and post-processing stages such as NMS. To tackle
these limitations, this paper presents a novel end-to-end semi-supervised table
detection method that employs the deformable transformer for detecting table
objects. We evaluate our semi-supervised method on PubLayNet, DocBank, ICADR-19
and TableBank datasets, and it achieves superior performance compared to
previous methods. It outperforms the fully supervised method (Deformable
transformer) by +3.4 points on 10\% labels of TableBank-both dataset and the
previous CNN-based semi-supervised approach (Soft Teacher) by +1.8 points on
10\% labels of PubLayNet dataset. We hope this work opens new possibilities
towards semi-supervised and unsupervised table detection methods.
- Abstract(参考訳): テーブル検出は、ドキュメントイメージ内のテーブルオブジェクトを分類し、ローカライズするタスクである。
近年の深層学習手法の発展に伴い,テーブル検出の著しい成功が観察されている。
しかし、これらのモデルを効果的に訓練するには、かなりの量のラベル付きデータが必要である。
多くの半教師付きアプローチが、大量のラベルデータの必要性を軽減するために導入されている。
これらのアプローチでは、アンカー提案やNMSのような後処理段階に依存するCNNベースの検出器を使用する。
そこで本稿では, テーブルオブジェクトの検出に変形可能な変換器を用いた, エンドツーエンドの半教師付きテーブル検出手法を提案する。
我々はPubLayNet,DocBank,ICADR-19,TableBankの半教師付き手法を評価し,従来の手法と比較して優れた性能を実現する。
これは、TableBank-bothデータセットの10\%ラベルで+3.4ポイント、PubLayNetデータセットの10\%ラベルで+1.8ポイントで、完全に教師された方法(Deformable transformer)よりも優れている。
この研究が、半教師なしおよび教師なしのテーブル検出方法への新たな可能性を開くことを願っている。
関連論文リスト
- TrajSSL: Trajectory-Enhanced Semi-Supervised 3D Object Detection [59.498894868956306]
Pseudo-labeling approach to semi-supervised learning は教師-学生の枠組みを採用する。
我々は、事前学習した動き予測モデルを活用し、擬似ラベル付きデータに基づいて物体軌跡を生成する。
提案手法は2つの異なる方法で擬似ラベル品質を向上する。
論文 参考訳(メタデータ) (2024-09-17T05:35:00Z) - End-to-End Semi-Supervised approach with Modulated Object Queries for Table Detection in Documents [12.042768320132694]
本研究では,革新的な変圧器を用いた半教師付きテーブル検出器を提案する。
これは、新しいマッチング戦略によって擬似ラベルの品質を向上させる。
mAPは95.7%、97.9%がTableBank(ワード)とPubLaynetで30%のラベルデータで達成されている。
論文 参考訳(メタデータ) (2024-05-08T11:24:57Z) - Towards End-to-End Semi-Supervised Table Detection with Semantic Aligned Matching Transformer [12.042768320132694]
文書画像内のテーブル検出は、テーブルの識別とローカライゼーションを含む文書処理において重要なタスクである。
ディープラーニングの最近の進歩は、このタスクの精度を大幅に向上させたが、それでも効果的なトレーニングには大きなラベル付きデータセットに依存している。
本稿では, SAM-DETRを用いた半教師付きアプローチを提案する。
論文 参考訳(メタデータ) (2024-04-30T20:25:57Z) - ClusterTabNet: Supervised clustering method for table detection and table structure recognition [0.0]
文書中の単語をクラスタリングする深層学習に基づく新しい手法を提案する。
表構造ボトムアップを一対の単語間の関係グラフとして解釈し、変圧器エンコーダモデルを用いてその隣接行列を予測する。
DETRやFaster R-CNNのような現在の最先端検出手法と比較して,本手法は比較的小さなモデルを必要とするが,類似性や精度が向上する。
論文 参考訳(メタデータ) (2024-02-12T09:10:24Z) - Table Detection in the Wild: A Novel Diverse Table Detection Dataset and
Method [1.3814823347690746]
テーブル検出のための大規模データセットを7万以上のサンプルで紹介する。
また、文書中のテーブル構造を検出する畳み込みニューラルネットワークを用いたベースライン結果も提示する。
論文 参考訳(メタデータ) (2022-08-31T14:20:30Z) - W2N:Switching From Weak Supervision to Noisy Supervision for Object
Detection [64.10643170523414]
弱い監督からうるさい監督(W2N)に切り替える新しいパラダイムを持つ新しいWSODフレームワークを提案する。
ローカライズ適応モジュールでは、元の擬似接地構造における識別部分の割合を減らすために正規化損失を提案する。
我々のW2Nは、既存の純粋なWSODメソッドや転送学習メソッドよりも優れています。
論文 参考訳(メタデータ) (2022-07-25T12:13:48Z) - Attentive Prototypes for Source-free Unsupervised Domain Adaptive 3D
Object Detection [85.11649974840758]
3Dオブジェクト検出ネットワークは、トレーニングされたデータに対してバイアスを受ける傾向がある。
そこで本研究では,ライダーを用いた3次元物体検出器のソースレス・教師なし領域適応のための単一フレーム手法を提案する。
論文 参考訳(メタデータ) (2021-11-30T18:42:42Z) - Scientific evidence extraction [0.0]
我々は新しいデータセットである Tables One Million (PubTables-1M) と新しいメトリクスのクラスである PubMed grid table similarity (GriTS) を提案する。
PubTables-1Mは、これまでで最大のデータセットの約2倍の大きさである。
PubTables-1Mでトレーニングしたオブジェクト検出モデルは,検出,構造認識,機能解析の3つのタスクすべてに対して,アウト・オブ・ザ・ボックスで優れた結果が得られることを示す。
論文 参考訳(メタデータ) (2021-09-30T19:42:07Z) - WSSOD: A New Pipeline for Weakly- and Semi-Supervised Object Detection [75.80075054706079]
弱機能および半教師付きオブジェクト検出フレームワーク(WSSOD)を提案する。
エージェント検出器は、まず関節データセット上でトレーニングされ、弱注釈画像上で擬似境界ボックスを予測するために使用される。
提案フレームワークはPASCAL-VOC と MSCOCO のベンチマークで顕著な性能を示し,完全教師付き環境で得られたものと同等の性能を達成している。
論文 参考訳(メタデータ) (2021-05-21T11:58:50Z) - 3DIoUMatch: Leveraging IoU Prediction for Semi-Supervised 3D Object
Detection [76.42897462051067]
3DIoUMatchは屋内および屋外の場面両方に適当3D目的の検出のための新しい半監視された方法です。
教師と教師の相互学習の枠組みを活用し,ラベル付けされていない列車の情報を擬似ラベルの形で伝達する。
本手法は,ScanNetとSUN-RGBDのベンチマークにおける最先端の手法を,全てのラベル比で有意差で継続的に改善する。
論文 参考訳(メタデータ) (2020-12-08T11:06:26Z) - Meta-Learned Confidence for Few-shot Learning [60.6086305523402]
数ショットのメトリックベースのアプローチのための一般的なトランスダクティブ推論手法は、最も確実なクエリ例の平均で、各クラスのプロトタイプを更新することである。
本稿では,各クエリの信頼度をメタラーニングして,ラベルのないクエリに最適な重みを割り当てる手法を提案する。
4つのベンチマークデータセットに対してメタ学習の信頼度で、少数ショットの学習モデルを検証した。
論文 参考訳(メタデータ) (2020-02-27T10:22:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。