論文の概要: CHARTER: heatmap-based multi-type chart data extraction
- arxiv url: http://arxiv.org/abs/2111.14103v1
- Date: Sun, 28 Nov 2021 11:01:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-01 10:40:10.677022
- Title: CHARTER: heatmap-based multi-type chart data extraction
- Title(参考訳): CHARTER:熱マップに基づくマルチタイプチャートデータ抽出
- Authors: Joseph Shtok, Sivan Harary, Ophir Azulai, Adi Raz Goldfarb, Assaf
Arbelle, Leonid Karlinsky
- Abstract要約: 本稿では,文書チャートを機械可読データ形式に変換する手法とシステムを提案する。
提案手法では,グラフの抽出と解析,グラフィカルな要素の抽出と構造解析を行う。
我々の検出システムはニューラルネットワークに基づいており、合成データのみに基づいて訓練されている。
- 参考スコア(独自算出の注目度): 7.838284602257369
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The digital conversion of information stored in documents is a great source
of knowledge. In contrast to the documents text, the conversion of the embedded
documents graphics, such as charts and plots, has been much less explored. We
present a method and a system for end-to-end conversion of document charts into
machine readable tabular data format, which can be easily stored and analyzed
in the digital domain. Our approach extracts and analyses charts along with
their graphical elements and supporting structures such as legends, axes,
titles, and captions. Our detection system is based on neural networks, trained
solely on synthetic data, eliminating the limiting factor of data collection.
As opposed to previous methods, which detect graphical elements using
bounding-boxes, our networks feature auxiliary domain specific heatmaps
prediction enabling the precise detection of pie charts, line and scatter plots
which do not fit the rectangular bounding-box presumption. Qualitative and
quantitative results show high robustness and precision, improving upon
previous works on popular benchmarks
- Abstract(参考訳): ドキュメントに格納された情報のデジタル変換は、大きな知識の源泉です。
文書テキストとは対照的に、チャートやプロットといった埋め込みドキュメントのグラフィックの変換は、あまり研究されていない。
本稿では,ドキュメントチャートのエンドツーエンド変換を機械可読性表型データ形式に変換する方法とシステムを提案する。
提案手法は,図形要素とともにチャートを抽出,解析し,伝説,軸,タイトル,キャプションなどの構造を支援する。
検出システムはニューラルネットワークに基づいて,データ収集の制限要因を排除し,合成データのみを訓練する。
境界ボックスを用いてグラフィカル要素を検出する従来の手法とは対照的に,我々のネットワークは,矩形境界ボックス推定に適合しないパイチャート,ラインおよび散乱プロットの正確な検出を可能にする,補助領域固有のヒートマップを特徴付ける。
定性的および定量的な結果は、一般的なベンチマークにおける以前の研究よりも高い堅牢性と精度を示す
関連論文リスト
- GraphKD: Exploring Knowledge Distillation Towards Document Object
Detection with Structured Graph Creation [14.511401955827875]
ドキュメントにおけるオブジェクト検出は、構造的要素の識別プロセスを自動化するための重要なステップである。
文書画像中の文書オブジェクトを正しく識別し,ローカライズするための,グラフベースの知識蒸留フレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-17T23:08:32Z) - Enhancing Visually-Rich Document Understanding via Layout Structure
Modeling [91.07963806829237]
レイアウトの知識をモデルに注入する新しい文書理解モデルであるGraphLMを提案する。
我々は、FUNSD、XFUND、CORDなど様々なベンチマークでモデルを評価し、最先端の結果を得た。
論文 参考訳(メタデータ) (2023-08-15T13:53:52Z) - Line Graphics Digitization: A Step Towards Full Automation [29.017383766914406]
5つの粗いカテゴリと10の細かいカテゴリのピクセルワイズアノテーションを含むLine Graphics (LG)データセットを提示する。
我々のデータセットは、異なる分野から450の文書から収集された数学図形の520の画像を網羅している。
提案するデータセットは、セマンティックセグメンテーションとオブジェクト検出という、2つの異なるコンピュータビジョンタスクをサポートすることができる。
論文 参考訳(メタデータ) (2023-07-05T07:08:58Z) - Augraphy: A Data Augmentation Library for Document Images [59.457999432618614]
Augraphyはデータ拡張パイプラインを構築するためのPythonライブラリである。
標準的なオフィス操作によって変更されたように見えるクリーンなドキュメントイメージの拡張版を作成するための戦略を提供する。
論文 参考訳(メタデータ) (2022-08-30T22:36:19Z) - Weakly Supervised Change Detection Using Guided Anisotropic Difusion [97.43170678509478]
我々は、このようなデータセットを変更検出の文脈で活用するのに役立つ独自のアイデアを提案する。
まず,意味的セグメンテーション結果を改善する誘導異方性拡散(GAD)アルゴリズムを提案する。
次に、変化検出に適した2つの弱い教師付き学習戦略の可能性を示す。
論文 参考訳(メタデータ) (2021-12-31T10:03:47Z) - DocScanner: Robust Document Image Rectification with Progressive
Learning [162.03694280524084]
この研究はDocScannerという、文書画像の修正のための新しいディープネットワークアーキテクチャを提示する。
DocScannerは、修正されたイメージの1つの見積を維持し、再帰的なアーキテクチャで徐々に修正される。
反復的な改善によりDocScannerは堅牢で優れたパフォーマンスに収束し、軽量なリカレントアーキテクチャにより実行効率が保証される。
論文 参考訳(メタデータ) (2021-10-28T09:15:02Z) - Learning to Generate Scene Graph from Natural Language Supervision [52.18175340725455]
シーングラフと呼ばれる画像内の局所化オブジェクトとその関係をグラフィカルに表現するために,画像と文のペアから学習する最初の方法の1つを提案する。
既製のオブジェクト検出器を利用してオブジェクトのインスタンスを識別し、ローカライズし、検出された領域のラベルとキャプションから解析された概念をマッチングし、シーングラフを学習するための"擬似ラベル"を作成する。
論文 参考訳(メタデータ) (2021-09-06T03:38:52Z) - Plot2Spectra: an Automatic Spectra Extraction Tool [10.64947007982639]
本稿では,プロットデジタイザであるPlot2Spectraを開発し,自動で分光グラフ画像からデータポイントを抽出する。
第1軸アライメント段階では、プロット領域を検出し、検出された境界ボックスを洗練するためにアンカーフリー検出器を採用する。
第2のプロットデータ抽出段階では、まずセマンティックセグメンテーションを用いて、プロット線に属する画素を背景から分離する。
論文 参考訳(メタデータ) (2021-07-06T18:17:28Z) - Towards an efficient framework for Data Extraction from Chart Images [27.114170963444074]
データマイニングシステムにおいて,データ抽出段階において最先端のコンピュータビジョン技術を採用する。
堅牢な点検出器を構築するには、特徴融合モジュールを備えた完全な畳み込みネットワークを採用する。
データ変換では,検出した要素を意味値でデータに変換する。
論文 参考訳(メタデータ) (2021-05-05T13:18:53Z) - Scene Graph Modification Based on Natural Language Commands [90.0662899539489]
グラフやパースツリーのような構造化表現は多くの自然言語処理システムにおいて重要な役割を果たす。
本稿では,新しい利用者の指示に応じて既存のグラフの更新方法を学ぶ必要がある,グラフ修正の新たな課題について考察する。
論文 参考訳(メタデータ) (2020-10-06T10:01:19Z) - OCR Graph Features for Manipulation Detection in Documents [11.193867567895353]
OCR(Optical Character Recognition)を用いたグラフ特徴量を利用したモデルを提案する。
本モデルは,OCR特徴量に基づいてランダムな森林分類器を訓練することにより,変化を検出するためのデータ駆動型手法に依存している。
我々は,本アルゴリズムの偽造検出性能を,若干の偽造不完全な実業務文書から構築したデータセット上で評価した。
論文 参考訳(メタデータ) (2020-09-10T21:50:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。