論文の概要: Tensor Fields for Data Extraction from Chart Images: Bar Charts and
Scatter Plots
- arxiv url: http://arxiv.org/abs/2010.02319v1
- Date: Mon, 5 Oct 2020 20:19:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-10 22:35:25.811421
- Title: Tensor Fields for Data Extraction from Chart Images: Bar Charts and
Scatter Plots
- Title(参考訳): チャート画像からのデータ抽出のためのテンソル場:バーチャートと散乱プロット
- Authors: Jaya Sreevalsan-Nair and Komal Dadhich and Siri Chandana Daggubati
- Abstract要約: 自動チャート読み込みは、データ抽出とグラフ画像からのデータのコンテキスト理解を含む。
適切なテンソル場をモデルとして同定し,その縮退点抽出をグラフ画像からのデータ抽出に用いる手法を提案する。
その結果, テンソル投票はバーチャートや散布図, ヒストグラムからのデータ抽出に有効であることが示唆された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Charts are an essential part of both graphicacy (graphical literacy), and
statistical literacy. As chart understanding has become increasingly relevant
in data science, automating chart analysis by processing raster images of the
charts has become a significant problem. Automated chart reading involves data
extraction and contextual understanding of the data from chart images. In this
paper, we perform the first step of determining the computational model of
chart images for data extraction for selected chart types, namely, bar charts,
and scatter plots. We demonstrate the use of positive semidefinite second-order
tensor fields as an effective model. We identify an appropriate tensor field as
the model and propose a methodology for the use of its degenerate point
extraction for data extraction from chart images. Our results show that tensor
voting is effective for data extraction from bar charts and scatter plots, and
histograms, as a special case of bar charts.
- Abstract(参考訳): グラフはグラフィック・リテラシー(グラフィック・リテラシー)と統計リテラシーの両方の重要な部分である。
データ科学においてチャート理解がますます重要になっているため、グラフのラスタ画像処理によるチャート解析の自動化が大きな問題となっている。
自動チャート読み込みは、データ抽出とグラフ画像からのデータのコンテキスト理解を含む。
本稿では,選択したチャートタイプ,すなわちバーチャートと散布プロットのデータ抽出のためのチャート画像の計算モデルを決定する第一歩を実行する。
正半定値二階テンソル場を有効モデルとして用いることを実証する。
適切なテンソル場をモデルとして同定し,その縮退点抽出をグラフ画像からのデータ抽出に用いる手法を提案する。
その結果、テンソル投票は、バーチャートの特別な場合として、バーチャート、散乱プロット、ヒストグラムからのデータ抽出に有効であることがわかった。
関連論文リスト
- ChartKG: A Knowledge-Graph-Based Representation for Chart Images [9.781118203308438]
本稿では,グラフ画像の視覚的要素と意味的関係をモデル化可能な知識グラフ(KG)に基づくグラフ表現を提案する。
一連の画像処理技術を統合して視覚要素と関係を識別する。例えば、CNNはチャートを分類し、ヨロフ5、光学文字認識はチャートを解析する。
本稿では,知識グラフに基づく表現が,グラフの詳細な視覚的要素と意味的関係をどうモデル化できるかを示す4つの事例を示す。
論文 参考訳(メタデータ) (2024-10-13T07:38:44Z) - On Pre-training of Multimodal Language Models Customized for Chart Understanding [83.99377088129282]
本稿では,MLLMのチャート理解を改善するために必要な学習過程について考察する。
詳細なチャート理解に適したMLLMであるCHOPINLLMを紹介する。
論文 参考訳(メタデータ) (2024-07-19T17:58:36Z) - ChartAssisstant: A Universal Chart Multimodal Language Model via
Chart-to-Table Pre-training and Multitask Instruction Tuning [54.89249749894061]
ChartAssistantは、ユニバーサルチャートの理解と推論のためのビジョン言語モデルである。
2段階のトレーニングプロセスを経て、チャートとテキストの調整のために、チャートからテーブルへのパースを事前トレーニングする。
実験により, 最先端UniChart法とChartllama法に比較して, 顕著な性能向上が得られた。
論文 参考訳(メタデータ) (2024-01-04T17:51:48Z) - StructChart: Perception, Structuring, Reasoning for Visual Chart
Understanding [58.38480335579541]
現在のチャート関連タスクは、視覚チャートから情報を抽出することを参照するチャート認識か、抽出されたデータから推論を行うかに焦点を当てている。
本稿では,共同認識と推論タスクのための統一的でラベル効率のよい学習パラダイムを確立することを目的とする。
各種のチャート関連タスクで実験を行い、統合されたチャート認識推論パラダイムの有効性と有望な可能性を実証した。
論文 参考訳(メタデータ) (2023-09-20T12:51:13Z) - GenPlot: Increasing the Scale and Diversity of Chart Derendering Data [0.0]
我々は、合成データを用いて、チャートデレンダリングのための何十億ものプロットを生成するプロットジェネレータであるGenPlotを提案する。
OCR-free chart-to-text translation は視覚言語タスクの最先端の結果を得た。
論文 参考訳(メタデータ) (2023-06-20T17:25:53Z) - Enhanced Chart Understanding in Vision and Language Task via Cross-modal
Pre-training on Plot Table Pairs [71.55796212450055]
本稿では、プロットテーブルペア上でのクロスモーダル事前学習を通じて、チャート画像からテーブル情報を解釈する方法を学ぶV+LモデルであるChartT5を紹介する。
具体的には,MHP(Masked Header Prediction)とMVP(Masked Value Prediction)の2つの新しい事前学習目標を提案する。
論文 参考訳(メタデータ) (2023-05-29T22:29:03Z) - UniChart: A Universal Vision-language Pretrained Model for Chart
Comprehension and Reasoning [29.947053208614246]
We present UniChart, a pretrained model for chart comprehension and reasoning。
UniChartは、チャートの関連するテキスト、データ、および視覚要素をエンコードし、その後、チャートグラウンドのテキストデコーダを使用して、自然言語で期待される出力を生成する。
i) チャートから視覚要素(バーや線など)とデータを抽出する低レベルタスク、(ii) チャート理解と推論のスキルを得るための高レベルタスクなどである。
論文 参考訳(メタデータ) (2023-05-24T06:11:17Z) - ChartReader: A Unified Framework for Chart Derendering and Comprehension
without Heuristic Rules [89.75395046894809]
ChartReaderは、チャートのデレンダリングと理解タスクをシームレスに統合する統合フレームワークです。
提案手法には,トランスフォーマーに基づくチャートコンポーネント検出モジュールと,チャートからXまでのタスクに対する事前学習型視覚言語モデルが組み込まれている。
提案するフレームワークは,チャート解析に係わる作業を大幅に削減し,ユニバーサルチャート理解モデルへの一歩を踏み出すことができる。
論文 参考訳(メタデータ) (2023-04-05T00:25:27Z) - Chart-to-Text: A Large-Scale Benchmark for Chart Summarization [9.647079534077472]
2つのデータセットと44,096のチャートを持つ大規模ベンチマークであるChart-to-textを提示する。
データセット構築プロセスを説明し、データセットを解析する。
論文 参考訳(メタデータ) (2022-03-12T17:01:38Z) - Line Graph Neural Networks for Link Prediction [71.00689542259052]
実世界の多くのアプリケーションにおいて古典的なグラフ解析問題であるグラフリンク予測タスクについて検討する。
このフォーマリズムでは、リンク予測問題をグラフ分類タスクに変換する。
本稿では,線グラフをグラフ理論に用いて,根本的に異なる新しい経路を求めることを提案する。
特に、線グラフの各ノードは、元のグラフのユニークなエッジに対応するため、元のグラフのリンク予測問題は、グラフ分類タスクではなく、対応する線グラフのノード分類問題として等価に解決できる。
論文 参考訳(メタデータ) (2020-10-20T05:54:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。