論文の概要: An extensible point-based method for data chart value detection
- arxiv url: http://arxiv.org/abs/2308.11788v1
- Date: Tue, 22 Aug 2023 21:03:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-24 16:48:17.355672
- Title: An extensible point-based method for data chart value detection
- Title(参考訳): データチャート値検出のための拡張可能な点ベース手法
- Authors: Carlos Soto, Shinjae Yoo
- Abstract要約: 本稿では,リバースエンジニアリングデータチャートに意味点を識別する手法を提案する。
提案手法では,グラフ上の関心点の位置を直接予測するために,ポイント提案ネットワークを用いる。
我々は科学文献において,0.8705 F1の精度で有意な点を検出できる複雑なバーチャートに注目した。
- 参考スコア(独自算出の注目度): 7.9137747195666455
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present an extensible method for identifying semantic points to reverse
engineer (i.e. extract the values of) data charts, particularly those in
scientific articles. Our method uses a point proposal network (akin to region
proposal networks for object detection) to directly predict the position of
points of interest in a chart, and it is readily extensible to multiple chart
types and chart elements. We focus on complex bar charts in the scientific
literature, on which our model is able to detect salient points with an
accuracy of 0.8705 F1 (@1.5-cell max deviation); it achieves 0.9810 F1 on
synthetically-generated charts similar to those used in prior works. We also
explore training exclusively on synthetic data with novel augmentations,
reaching surprisingly competent performance in this way (0.6621 F1) on real
charts with widely varying appearance, and we further demonstrate our unchanged
method applied directly to synthetic pie charts (0.8343 F1). Datasets, trained
models, and evaluation code are available at
https://github.com/BNLNLP/PPN_model.
- Abstract(参考訳): 本稿では,逆エンジニア(すなわち,データチャートの値の抽出)に対する意味点を識別する拡張可能な手法について述べる。
提案手法では,ポイント提案ネットワーク(オブジェクト検出のための領域提案ネットワーク)を用いて,グラフ上のポイントの位置を直接予測し,複数のチャートタイプやチャート要素に対して容易に拡張できる。
我々は科学文献の複雑なバーチャートに注目し、我々のモデルは0.8705 F1 (@1.5-cell max deviation) の精度で正解点を検出できる。
また,新たに拡張した合成データのみによるトレーニングも検討し,実際のチャート上での驚くほど優れた性能 (0.6621 F1) を実現するとともに,合成パイチャート(0.8343 F1)に直接適用した変化のない手法をさらに実証する。
データセット、トレーニングされたモデル、評価コードはhttps://github.com/BNLNLP/PPN_modelで入手できる。
関連論文リスト
- ChartEye: A Deep Learning Framework for Chart Information Extraction [2.4936576553283287]
本研究では,グラフ情報抽出パイプラインにおける重要なステップに対するソリューションを提供する,ディープラーニングベースのフレームワークを提案する。
提案フレームワークは階層型視覚変換器をグラフ型およびテキストロール分類のタスクに用い,YOLOv7はテキスト検出に用いた。
提案手法は,F1スコアが0.97,テキストロール分類が0.91,テキスト検出が平均0.95,各段階において優れた性能を実現している。
論文 参考訳(メタデータ) (2024-08-28T20:22:39Z) - Deep Generative Models for Subgraph Prediction [10.56335881963895]
本稿では,深層グラフ学習のための新しい課題として,サブグラフクエリを提案する。
サブグラフクエリは、観測されたサブグラフで表される証拠に基づいて、ターゲットサブグラフのコンポーネントを共同で予測する。
我々は,確率論的深部グラフ生成モデルを用いて,サブグラフクエリに回答する。
論文 参考訳(メタデータ) (2024-08-07T19:24:02Z) - ChartDETR: A Multi-shape Detection Network for Visual Chart Recognition [33.89209291115389]
現在の手法はキーポイント検出に頼り、チャート内のデータ要素の形状を推定するが、後処理のエラーをグループ化する。
本稿では, 変圧器を用いたマルチ形状検出器であるChartDETRを提案し, 正規形状の角のキーポイントをローカライズして, 複数のデータ要素を1枚のチャート画像に再構成する。
提案手法は,クエリグループをセット予測に導入することにより,全てのデータ要素の形状を同時に予測する。
論文 参考訳(メタデータ) (2023-08-15T12:50:06Z) - CorrMatch: Label Propagation via Correlation Matching for
Semi-Supervised Semantic Segmentation [73.89509052503222]
本稿では、CorrMatchと呼ばれる、単純だが実行可能な半教師付きセマンティックセマンティックセマンティックセマンティクス手法を提案する。
相関写像は、同一カテゴリのクラスタリングピクセルを容易に実現できるだけでなく、良好な形状情報も含んでいることを観察する。
我々は,高信頼画素を拡大し,さらに掘り出すために,画素の対の類似性をモデル化して画素伝搬を行う。
そして、相関地図から抽出した正確なクラス非依存マスクを用いて、領域伝搬を行い、擬似ラベルを強化する。
論文 参考訳(メタデータ) (2023-06-07T10:02:29Z) - ChartReader: A Unified Framework for Chart Derendering and Comprehension
without Heuristic Rules [89.75395046894809]
ChartReaderは、チャートのデレンダリングと理解タスクをシームレスに統合する統合フレームワークです。
提案手法には,トランスフォーマーに基づくチャートコンポーネント検出モジュールと,チャートからXまでのタスクに対する事前学習型視覚言語モデルが組み込まれている。
提案するフレームワークは,チャート解析に係わる作業を大幅に削減し,ユニバーサルチャート理解モデルへの一歩を踏み出すことができる。
論文 参考訳(メタデータ) (2023-04-05T00:25:27Z) - Learnable Graph Matching: A Practical Paradigm for Data Association [74.28753343714858]
これらの問題に対処するための一般的な学習可能なグラフマッチング法を提案する。
提案手法は,複数のMOTデータセット上での最先端性能を実現する。
画像マッチングでは,一般的な屋内データセットであるScanNetで最先端の手法より優れている。
論文 参考訳(メタデータ) (2023-03-27T17:39:00Z) - VizExtract: Automatic Relation Extraction from Data Visualizations [7.2241069295727955]
本稿では,統計チャートから比較変数を自動的に抽出する枠組みを提案する。
コンピュータビジョンベースのフレームワークを活用して,線グラフや散布プロット,バーグラフなどの視覚化ファセットを自動的に識別し,ローカライズする。
制御された実験では、87.5%の精度で、グラフごとに1-3級数を持つグラフの変数間の相関、色の変化、およびラインスタイルを分類することができる。
論文 参考訳(メタデータ) (2021-12-07T04:27:08Z) - Learnable Graph Matching: Incorporating Graph Partitioning with Deep
Feature Learning for Multiple Object Tracking [58.30147362745852]
フレーム間のデータアソシエーションは、Multiple Object Tracking(MOT)タスクの中核にある。
既存の手法は、主にトラックレットとフレーム内検出の間のコンテキスト情報を無視する。
そこで本研究では,学習可能なグラフマッチング手法を提案する。
論文 参考訳(メタデータ) (2021-03-30T08:58:45Z) - Robust Optimization as Data Augmentation for Large-scale Graphs [117.2376815614148]
学習中に勾配に基づく逆方向摂動を伴うノード特徴を反復的に拡張するFLAG(Free Large-scale Adversarial Augmentation on Graphs)を提案する。
FLAGはグラフデータに対する汎用的なアプローチであり、ノード分類、リンク予測、グラフ分類タスクで普遍的に機能する。
論文 参考訳(メタデータ) (2020-10-19T21:51:47Z) - Graph-PCNN: Two Stage Human Pose Estimation with Graph Pose Refinement [54.29252286561449]
グラフPCNNと呼ばれる2段階のグラフベースおよびモデルに依存しないフレームワークを提案する。
第1段階では、粗局化結果を得るために熱マップ回帰ネットワークを適用し、ガイドポイントと呼ばれる一連の提案キーポイントをサンプリングする。
第2段階では、各案内点について、ローカライゼーションにより異なる視覚特徴を抽出する。
ガイドされた点間の関係は、より正確なローカライゼーション結果を得るためにグラフポーズ精製モジュールによって探索される。
論文 参考訳(メタデータ) (2020-07-21T04:59:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。