論文の概要: Generating Statistical Charts with Validation-Driven LLM Workflows
- arxiv url: http://arxiv.org/abs/2605.00800v1
- Date: Fri, 01 May 2026 17:39:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 17:43:29.02998
- Title: Generating Statistical Charts with Validation-Driven LLM Workflows
- Title(参考訳): 検証駆動型LLMワークフローによる統計チャートの生成
- Authors: Pavlin G. Poličar, Andraž Pevcin, Blaž Zupan,
- Abstract要約: Flowwayは、チャート生成をデータセットのスクリーニング、プロット提案、コード合成、レンダリング、バリデーション駆動の洗練、記述生成、質問応答生成に分解する。
チャート生成をワンショットのプロンプト・ツー・コードタスクではなく、インスペクタブルなプロセスとして扱い、各チャートをコード、データセットコンテキスト、説明、質問応答ペアで保持する。
結果から, チャート・シンタクス問題はほぼ飽和しているが, 値抽出, 比較, 推論は依然として困難であることが示唆された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generating diverse, readable statistical charts from tabular data remains challenging for LLMs, as many failures become apparent after rendering and are not detectable from data or code alone. Existing chart datasets also rarely provide fully aligned artifacts, such as executable code, dataset context, and question-answer pairs. We present a structured LLM-based workflow that decomposes chart generation into dataset screening, plot proposal, code synthesis, rendering, validation-driven refinement, description generation, and question-answer generation. By incorporating rendered-output validation, the workflow addresses visualization-specific failure modes such as readability and semantic mismatch. It treats chart generation as an inspectable process rather than a one-shot prompt-to-code task, retaining each chart with its code, dataset context, description, and question-answer pairs. Applied to UCI datasets, the workflow produces 1,500 charts from 74 datasets, spanning 24 chart families and paired with 30,003 question-answer pairs. We evaluate 16 multimodal LLMs (MLLMs) on these chart-question pairs. The results show that chart-syntax questions are nearly saturated, while value extraction, comparison, and reasoning remain more challenging, illustrating the workflow's utility for diagnostic studies of chart-grounded multimodal reasoning.
- Abstract(参考訳): グラフデータから多種多様な可読性統計チャートを生成することは、レンダリング後に多くの障害が明らかになり、データやコードだけでは検出できないため、LLMにとって依然として困難である。
既存のグラフデータセットは、実行可能なコード、データセットコンテキスト、質問と回答のペアなど、完全に整合したアーティファクトも、ほとんど提供しない。
グラフ生成をデータセットスクリーニング,プロット提案,コード合成,レンダリング,バリデーション駆動の改良,記述生成,質問応答生成に分解する構造化LCMベースのワークフローを提案する。
描画出力検証を導入することで、ワークフローは可読性やセマンティックミスマッチといった可視化固有の障害モードに対処する。
チャート生成をワンショットのプロンプト・ツー・コードタスクではなく、インスペクタブルなプロセスとして扱い、各チャートをコード、データセットコンテキスト、説明、質問応答ペアで保持する。
UCIデータセットに適用されたワークフローは、74のデータセットから1,500のチャートを生成し、24のチャートファミリにまたがり、30,003の質問応答ペアとペアリングする。
16個のMLLM(Multimodal LLM)をこれらのチャート検索ペアで評価した。
結果から, グラフ-構文問題はほぼ飽和しているが, 値抽出, 比較, 推論は依然として困難であり, グラフ基底型マルチモーダル推論の診断研究におけるワークフローの有用性について考察した。
関連論文リスト
- BRIDGES: Bridging Graph Modality and Large Language Models within EDA Tasks [12.683482535955314]
LLMのパフォーマンスは、グラフがシーケンシャルテキストとして表現されるときに悩む。
EDAタスクのための LLM にグラフモダリティを組み込むためのフレームワークBRIDGES を紹介する。
その結果、テキストのみのベースラインに比べて、複数のタスクで2倍から10倍の改善が見られた。
論文 参考訳(メタデータ) (2025-04-07T15:27:32Z) - Distill Visual Chart Reasoning Ability from LLMs to MLLMs [64.32993770646165]
マルチモーダル大言語モデル(MLLM)における複雑なチャートQ&Aタスクの解決には高度な視覚的推論能力が必要である
我々は,LLMからMLLMへの視覚的推論能力を蒸留するための費用効率,効率,スケーラブルなデータ合成手法であるCode-as-Intermediary Translation (CIT)を提案する。
ReachQAは、MLLMの認識と推論能力を高めるために、3kの推論集約チャートと20kのQ&Aペアを含むデータセットである。
論文 参考訳(メタデータ) (2024-10-24T14:50:42Z) - Text2Chart31: Instruction Tuning for Chart Generation with Automatic Feedback [37.275533538711436]
階層的なパイプラインとグラフ生成のための新しいデータセットを提案する。
私たちのデータセットであるText2Chart31には、Matplotlibライブラリを参照する31のユニークなプロットタイプが含まれています。
本稿では,人間からのフィードバックを必要とせず,グラフ生成タスクのための強化学習に基づく指導指導手法を提案する。
論文 参考訳(メタデータ) (2024-10-05T07:25:56Z) - FlowLearn: Evaluating Large Vision-Language Models on Flowchart Understanding [52.35520385083425]
FlowLearnデータセットは、フローチャートの理解を強化するために設計されたリソースである。
科学的サブセットは、科学文献から得られた3,858のフローチャートを含んでいる。
シミュレーションされたサブセットには、カスタマイズ可能なスクリプトを使用して作成された10,000のフローチャートが含まれている。
論文 参考訳(メタデータ) (2024-07-06T20:58:51Z) - ChartInstruct: Instruction Tuning for Chart Comprehension and Reasoning [28.204261069650897]
71Kチャートで生成した191K命令からなる新しいチャート固有視覚言語インストラクションフォローデータセットであるChartInstructを紹介した。
4つの下流タスクの実験において、まずモデルの有効性を示す。
論文 参考訳(メタデータ) (2024-03-14T01:40:23Z) - ChartAssisstant: A Universal Chart Multimodal Language Model via
Chart-to-Table Pre-training and Multitask Instruction Tuning [54.89249749894061]
ChartAssistantは、ユニバーサルチャートの理解と推論のためのビジョン言語モデルである。
2段階のトレーニングプロセスを経て、チャートとテキストの調整のために、チャートからテーブルへのパースを事前トレーニングする。
実験により, 最先端UniChart法とChartllama法に比較して, 顕著な性能向上が得られた。
論文 参考訳(メタデータ) (2024-01-04T17:51:48Z) - Do LLMs Work on Charts? Designing Few-Shot Prompts for Chart Question
Answering and Summarization [27.913656283822483]
大規模言語モデル(LLM)は、目に見えないタスクに対して印象的な一般化能力を示している。
本稿では,チャート関連アプリケーションのための LLM を用いたマルチモーダルな複数ショットプロンプトフレームワーク PromptChart を提案する。
3つの異なるチャート関連情報消費タスクに関する実験により、適切に設計されたプロンプトにより、LLMがベンチマーク上で優れることを示す。
論文 参考訳(メタデータ) (2023-12-17T05:13:58Z) - ChartLlama: A Multimodal LLM for Chart Understanding and Generation [70.1393163657813]
GPT-4を利用した高品質な命令チューニングデータセットを作成する。
次に、生成したデータセットを使ってトレーニングしたマルチモーダルな大規模言語モデルであるChartLlamaを紹介します。
論文 参考訳(メタデータ) (2023-11-27T15:20:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。