論文の概要: Towards an efficient framework for Data Extraction from Chart Images
- arxiv url: http://arxiv.org/abs/2105.02039v1
- Date: Wed, 5 May 2021 13:18:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-06 12:47:10.623590
- Title: Towards an efficient framework for Data Extraction from Chart Images
- Title(参考訳): グラフ画像からの効率的なデータ抽出フレームワークを目指して
- Authors: Weihong Ma, Hesuo Zhang, Shuang Yan, Guangshun Yao, Yichao Huang, Hui
Li, Yaqiang Wu, Lianwen Jin
- Abstract要約: データマイニングシステムにおいて,データ抽出段階において最先端のコンピュータビジョン技術を採用する。
堅牢な点検出器を構築するには、特徴融合モジュールを備えた完全な畳み込みネットワークを採用する。
データ変換では,検出した要素を意味値でデータに変換する。
- 参考スコア(独自算出の注目度): 27.114170963444074
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we fill the research gap by adopting state-of-the-art computer
vision techniques for the data extraction stage in a data mining system. As
shown in Fig.1, this stage contains two subtasks, namely, plot element
detection and data conversion. For building a robust box detector, we
comprehensively compare different deep learning-based methods and find a
suitable method to detect box with high precision. For building a robust point
detector, a fully convolutional network with feature fusion module is adopted,
which can distinguish close points compared to traditional methods. The
proposed system can effectively handle various chart data without making
heuristic assumptions. For data conversion, we translate the detected element
into data with semantic value. A network is proposed to measure feature
similarities between legends and detected elements in the legend matching
phase. Furthermore, we provide a baseline on the competition of Harvesting raw
tables from Infographics. Some key factors have been found to improve the
performance of each stage. Experimental results demonstrate the effectiveness
of the proposed system.
- Abstract(参考訳): 本稿では,データマイニングシステムにおけるデータ抽出段階に最先端のコンピュータビジョン技術を適用することで,研究のギャップを埋める。
図1に示すように、このステージはプロット要素の検出とデータ変換という2つのサブタスクを含む。
頑健な箱検出装置を構築するためには,様々な深層学習手法を総合的に比較し,高精度な箱検出に適した方法を見つける。
頑健な点検出器を構築するには、従来の手法と比較して近接点を区別できる特徴融合モジュールを備えた完全畳み込みネットワークを採用する。
提案システムは,ヒューリスティックな仮定を伴わずに,様々なチャートデータを効果的に処理できる。
データ変換では,検出した要素を意味値でデータに変換する。
伝説マッチングフェーズにおける伝説と検出要素の特徴的類似性を測定するネットワークを提案する。
さらに,インフォグラフィックから生のテーブルを収穫する競争のベースラインを提供する。
各ステージのパフォーマンス向上には,いくつかの重要な要因がある。
実験の結果,本システムの有効性が示された。
関連論文リスト
- Leveraging Mixture of Experts for Improved Speech Deepfake Detection [53.69740463004446]
スピーチのディープフェイクは、個人のセキュリティとコンテンツの信頼性に重大な脅威をもたらす。
本研究では,Mixture of Expertsアーキテクチャを用いた音声深度検出性能の向上のための新しい手法を提案する。
論文 参考訳(メタデータ) (2024-09-24T13:24:03Z) - Efficient Segmentation with Texture in Ore Images Based on
Box-supervised Approach [6.6773975364173]
完全な鉱石と独立した鉱石を識別するために, テクスチャを特徴とするボックス管理手法を提案する。
提案手法は,21.6MBの小型モデルサイズで毎秒50フレーム以上を実現する。
この手法は、鉱石画像データセットの最先端アプローチと比較して高い精度を維持している。
論文 参考訳(メタデータ) (2023-11-10T08:28:22Z) - DiffusionEngine: Diffusion Model is Scalable Data Engine for Object
Detection [41.436817746749384]
Diffusion Modelはオブジェクト検出のためのスケーラブルなデータエンジンである。
DiffusionEngine(DE)は、高品質な検出指向のトレーニングペアを単一のステージで提供する。
論文 参考訳(メタデータ) (2023-09-07T17:55:01Z) - Knowledge Distillation for Object Detection: from generic to remote
sensing datasets [7.872075562968697]
汎用コンピュータビジョンデータセット上で開発された既成のオブジェクト知識蒸留法について検討した。
特に、xViewとVEDAIデータセットとしてよく知られたベンチマークを用いて、ロジットと機能模倣の両方のアプローチをカバーする手法を車両検出に適用する。
論文 参考訳(メタデータ) (2023-07-18T13:49:00Z) - Detection Hub: Unifying Object Detection Datasets via Query Adaptation
on Language Embedding [137.3719377780593]
新しいデザイン(De Detection Hubという名前)は、データセット認識とカテゴリ整列である。
データセットの不整合を緩和し、検出器が複数のデータセットをまたいで学習するための一貫性のあるガイダンスを提供する。
データセット間のカテゴリは、ワンホットなカテゴリ表現を単語埋め込みに置き換えることで、意味的に統一された空間に整列される。
論文 参考訳(メタデータ) (2022-06-07T17:59:44Z) - Real-Time Scene Text Detection with Differentiable Binarization and
Adaptive Scale Fusion [62.269219152425556]
セグメンテーションに基づくシーンテキスト検出手法はシーンテキスト検出分野において大きな注目を集めている。
本稿では,二項化処理をセグメンテーションネットワークに統合する分散二項化(DB)モジュールを提案する。
アダプティブ・スケール・フュージョン (ASF) モジュールは, 異なるスケールの特徴を適応的に融合させることにより, スケールのロバスト性を向上させる。
論文 参考訳(メタデータ) (2022-02-21T15:30:14Z) - Weakly Supervised Change Detection Using Guided Anisotropic Difusion [97.43170678509478]
我々は、このようなデータセットを変更検出の文脈で活用するのに役立つ独自のアイデアを提案する。
まず,意味的セグメンテーション結果を改善する誘導異方性拡散(GAD)アルゴリズムを提案する。
次に、変化検出に適した2つの弱い教師付き学習戦略の可能性を示す。
論文 参考訳(メタデータ) (2021-12-31T10:03:47Z) - Pretrained equivariant features improve unsupervised landmark discovery [69.02115180674885]
我々は、この課題を克服する2段階の教師なしアプローチを、強力なピクセルベースの特徴を初めて学習することによって定式化する。
本手法は,いくつかの難解なランドマーク検出データセットにおいて最先端の結果を生成する。
論文 参考訳(メタデータ) (2021-04-07T05:42:11Z) - Ensembling object detectors for image and video data analysis [98.26061123111647]
本稿では,複数の物体検出器の出力をアンサンブルすることで,画像データ上の境界ボックスの検出性能と精度を向上させる手法を提案する。
本研究では,2段階追跡に基づく検出精度向上手法を提案することで,映像データに拡張する。
論文 参考訳(メタデータ) (2021-02-09T12:38:16Z) - Efficient and accurate object detection with simultaneous classification
and tracking [1.4620086904601473]
本稿では,ポイントストリーム内の同時分類と追跡に基づく検出フレームワークを提案する。
このフレームワークでは、トラッカーが点雲のシーケンスでデータアソシエーションを行い、冗長な処理を避けるために検出器を誘導する。
ベンチマーク・データセットを用いて実験を行い,提案手法が従来のトラッキング・バイ・ディテクト・アプローチより優れていることを示した。
論文 参考訳(メタデータ) (2020-07-04T10:22:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。