論文の概要: GenPlot: Increasing the Scale and Diversity of Chart Derendering Data
- arxiv url: http://arxiv.org/abs/2306.11699v1
- Date: Tue, 20 Jun 2023 17:25:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-21 13:15:56.313253
- Title: GenPlot: Increasing the Scale and Diversity of Chart Derendering Data
- Title(参考訳): GenPlot: チャートデータのスケールと多様性の向上
- Authors: Brendan Artley
- Abstract要約: 我々は、合成データを用いて、チャートデレンダリングのための何十億ものプロットを生成するプロットジェネレータであるGenPlotを提案する。
OCR-free chart-to-text translation は視覚言語タスクの最先端の結果を得た。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Vertical bars, horizontal bars, dot, scatter, and line plots provide a
diverse set of visualizations to represent data. To understand these plots, one
must be able to recognize textual components, locate data points in a plot, and
process diverse visual contexts to extract information. In recent works such as
Pix2Struct, Matcha, and Deplot, OCR-free chart-to-text translation has achieved
state-of-the-art results on visual language tasks. These results outline the
importance of chart-derendering as a pre-training objective, yet existing
datasets provide a fixed set of training examples. In this paper, we propose
GenPlot; a plot generator that can generate billions of additional plots for
chart-derendering using synthetic data.
- Abstract(参考訳): 垂直バー、水平バー、ドット、散乱、線プロットは、データを表現するための様々な視覚化セットを提供する。
これらのプロットを理解するためには、テキストコンポーネントを認識し、プロット内のデータポイントを特定し、様々な視覚的コンテキストを処理して情報を抽出する必要がある。
Pix2Struct、Matcha、Deplotといった最近の研究で、OCRなしのチャート・トゥ・テキスト翻訳は視覚言語タスクにおける最先端の結果を得た。
これらの結果は、事前学習対象としてチャートデレンダリングの重要性を概説するが、既存のデータセットはトレーニング例の固定セットを提供する。
本稿では,合成データを用いたチャートデペンダリングのために,数十億のプロットを生成するプロット生成器genplotを提案する。
関連論文リスト
- Text2Chart31: Instruction Tuning for Chart Generation with Automatic Feedback [37.275533538711436]
階層的なパイプラインとグラフ生成のための新しいデータセットを提案する。
私たちのデータセットであるText2Chart31には、Matplotlibライブラリを参照する31のユニークなプロットタイプが含まれています。
本稿では,人間からのフィードバックを必要とせず,グラフ生成タスクのための強化学習に基づく指導指導手法を提案する。
論文 参考訳(メタデータ) (2024-10-05T07:25:56Z) - ChartAssisstant: A Universal Chart Multimodal Language Model via
Chart-to-Table Pre-training and Multitask Instruction Tuning [54.89249749894061]
ChartAssistantは、ユニバーサルチャートの理解と推論のためのビジョン言語モデルである。
2段階のトレーニングプロセスを経て、チャートとテキストの調整のために、チャートからテーブルへのパースを事前トレーニングする。
実験により, 最先端UniChart法とChartllama法に比較して, 顕著な性能向上が得られた。
論文 参考訳(メタデータ) (2024-01-04T17:51:48Z) - ChartLlama: A Multimodal LLM for Chart Understanding and Generation [70.1393163657813]
GPT-4を利用した高品質な命令チューニングデータセットを作成する。
次に、生成したデータセットを使ってトレーニングしたマルチモーダルな大規模言語モデルであるChartLlamaを紹介します。
論文 参考訳(メタデータ) (2023-11-27T15:20:23Z) - StructChart: Perception, Structuring, Reasoning for Visual Chart
Understanding [58.38480335579541]
現在のチャート関連タスクは、視覚チャートから情報を抽出することを参照するチャート認識か、抽出されたデータから推論を行うかに焦点を当てている。
本稿では,共同認識と推論タスクのための統一的でラベル効率のよい学習パラダイムを確立することを目的とする。
各種のチャート関連タスクで実験を行い、統合されたチャート認識推論パラダイムの有効性と有望な可能性を実証した。
論文 参考訳(メタデータ) (2023-09-20T12:51:13Z) - UniChart: A Universal Vision-language Pretrained Model for Chart
Comprehension and Reasoning [29.947053208614246]
We present UniChart, a pretrained model for chart comprehension and reasoning。
UniChartは、チャートの関連するテキスト、データ、および視覚要素をエンコードし、その後、チャートグラウンドのテキストデコーダを使用して、自然言語で期待される出力を生成する。
i) チャートから視覚要素(バーや線など)とデータを抽出する低レベルタスク、(ii) チャート理解と推論のスキルを得るための高レベルタスクなどである。
論文 参考訳(メタデータ) (2023-05-24T06:11:17Z) - ChartReader: A Unified Framework for Chart Derendering and Comprehension
without Heuristic Rules [89.75395046894809]
ChartReaderは、チャートのデレンダリングと理解タスクをシームレスに統合する統合フレームワークです。
提案手法には,トランスフォーマーに基づくチャートコンポーネント検出モジュールと,チャートからXまでのタスクに対する事前学習型視覚言語モデルが組み込まれている。
提案するフレームワークは,チャート解析に係わる作業を大幅に削減し,ユニバーサルチャート理解モデルへの一歩を踏み出すことができる。
論文 参考訳(メタデータ) (2023-04-05T00:25:27Z) - DePlot: One-shot visual language reasoning by plot-to-table translation [50.28850068391312]
本稿では,視覚言語推論における最初のワンショットソリューションを提案する。
DePlotと名付けられたモダリティ変換モジュールは、プロットやチャートのイメージを線形化されたテーブルに変換する。
次に、DePlotの出力を直接使用して、事前訓練された大きな言語モデルをプロンプトすることができる。
論文 参考訳(メタデータ) (2022-12-20T18:20:50Z) - VizExtract: Automatic Relation Extraction from Data Visualizations [7.2241069295727955]
本稿では,統計チャートから比較変数を自動的に抽出する枠組みを提案する。
コンピュータビジョンベースのフレームワークを活用して,線グラフや散布プロット,バーグラフなどの視覚化ファセットを自動的に識別し,ローカライズする。
制御された実験では、87.5%の精度で、グラフごとに1-3級数を持つグラフの変数間の相関、色の変化、およびラインスタイルを分類することができる。
論文 参考訳(メタデータ) (2021-12-07T04:27:08Z) - Learning to Generate Scene Graph from Natural Language Supervision [52.18175340725455]
シーングラフと呼ばれる画像内の局所化オブジェクトとその関係をグラフィカルに表現するために,画像と文のペアから学習する最初の方法の1つを提案する。
既製のオブジェクト検出器を利用してオブジェクトのインスタンスを識別し、ローカライズし、検出された領域のラベルとキャプションから解析された概念をマッチングし、シーングラフを学習するための"擬似ラベル"を作成する。
論文 参考訳(メタデータ) (2021-09-06T03:38:52Z) - Tensor Fields for Data Extraction from Chart Images: Bar Charts and
Scatter Plots [0.0]
自動チャート読み込みは、データ抽出とグラフ画像からのデータのコンテキスト理解を含む。
適切なテンソル場をモデルとして同定し,その縮退点抽出をグラフ画像からのデータ抽出に用いる手法を提案する。
その結果, テンソル投票はバーチャートや散布図, ヒストグラムからのデータ抽出に有効であることが示唆された。
論文 参考訳(メタデータ) (2020-10-05T20:19:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。