論文の概要: ChartDesign: Towards LLM Designer of Data Visualization
- arxiv url: http://arxiv.org/abs/2605.16274v1
- Date: Mon, 06 Apr 2026 20:07:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 12:34:33.843516
- Title: ChartDesign: Towards LLM Designer of Data Visualization
- Title(参考訳): ChartDesign: データビジュアライゼーションのLLMデザイナを目指して
- Authors: Mohammed Afaan Ansari, Aniruddh Bansal, Tianyi Zhou,
- Abstract要約: 視覚言語モデルは、チャートからデータ設計属性を抽出するために使用される。
そして、データから設計仕様へのマッピングを学ぶためにLoRA3、Qwen3、InternVLを微調整します。
ChartDesignは、強力なベースラインよりもチャート設計のパフォーマンスを大幅に改善する。
- 参考スコア(独自算出の注目度): 13.678871864240358
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Charts are the dominant medium for visualizing data, discovering patterns and trends, and communicating data driven insights, yet designing them still requires expensive human effort and expertise, such as selecting appropriate chart types, axis orientations, font sizes, and layouts. Most automatic visualization systems rely on handcrafted heuristics or simple rule matching and therefore struggle to generalize across domains. This work explores the potential of large language models (LLMs) as chart designers. We propose ChartDesign, which post-trains LLMs to imitate human experts and generate chart design attributes given tabular data. To this end, we curate a diverse training corpus of data design pairs from charts in public surveys (PewResearch) and academic repositories (CharXiV). Vision language models are used to extract data and design attributes from these charts, including chart type, sub type, alignment, titles, axis labels, and bar spacing, formatted as JSON. We then fine tune LoRA adapters on Phi3, Qwen3, and InternVL2.5 to learn a mapping from data to design specifications. ChartDesign significantly improves chart design performance over strong baselines, achieving up to 84% accuracy on a held-out test set (vs. 53% for the best baseline) and generalizing to unseen domains. We further show that charts rendered from ChartDesign generated specifications are visually appealing and human preferred, narrowing the human AI gap in data visualization.
- Abstract(参考訳): チャートは、データを視覚化し、パターンやトレンドを発見し、データ駆動の洞察を伝達する主要な媒体であるが、それを設計するには、適切なチャートタイプ、軸方向、フォントサイズ、レイアウトを選択するなど、高価な人的努力と専門知識が必要である。
ほとんどの自動可視化システムは、手作りのヒューリスティックや単純なルールマッチングに依存しているため、ドメイン間の一般化に苦慮している。
本研究は,チャートデザイナとしての大規模言語モデル(LLM)の可能性を探るものである。
グラフデータに対して,人間の専門家を模倣し,チャート設計属性を生成するため,LLMのポストトレーニングを行うChartDesignを提案する。
この目的のために、パブリックサーベイ(PewResearch)と学術リポジトリ(CharXiV)のチャートから、さまざまなデータデザインペアのトレーニングコーパスをキュレートする。
ビジョン言語モデルは、チャートタイプ、サブタイプ、アライメント、タイトル、軸ラベル、およびJSON形式でフォーマットされたバー間隔を含む、これらのチャートからデータと設計属性を抽出するために使用される。
次に、Phi3、Qwen3、InternVL2.5のLoRAアダプタを微調整して、データから設計仕様へのマッピングを学習します。
ChartDesignは、強力なベースラインよりもチャート設計のパフォーマンスを大幅に改善し、ホールドアウトテストセット(ベストベースラインでは53%)で最大84%の精度を実現し、目に見えないドメインに一般化する。
さらに、ChartDesignが生成した仕様のグラフは視覚的に魅力的であり、人間が好むものであり、データの視覚化における人間のAIギャップを狭めていることを示す。
関連論文リスト
- ChartGemma: Visual Instruction-tuning for Chart Reasoning in the Wild [28.643565008567172]
本稿では,PaliGemma上で開発された新しいチャート理解と推論モデルであるChartGemmaを紹介する。
基礎となるデータテーブルに頼るのではなく、ChartGemmaは、チャートイメージから直接生成されたインストラクションチューニングデータに基づいて訓練される。
我々の単純なアプローチは、チャートの要約、質問応答、ファクトチェックにまたがる5ドルのベンチマークで最先端の結果を得る。
論文 参考訳(メタデータ) (2024-07-04T22:16:40Z) - ChartAssisstant: A Universal Chart Multimodal Language Model via
Chart-to-Table Pre-training and Multitask Instruction Tuning [54.89249749894061]
ChartAssistantは、ユニバーサルチャートの理解と推論のためのビジョン言語モデルである。
2段階のトレーニングプロセスを経て、チャートとテキストの調整のために、チャートからテーブルへのパースを事前トレーニングする。
実験により, 最先端UniChart法とChartllama法に比較して, 顕著な性能向上が得られた。
論文 参考訳(メタデータ) (2024-01-04T17:51:48Z) - StructChart: On the Schema, Metric, and Augmentation for Visual Chart Understanding [54.45681512355684]
現在のチャート関連タスクは、ビジュアルチャートから情報を抽出するチャート認識か、抽出されたデータに基づいてチャート推論にフォーカスする。
我々はStructChartを紹介した。StructChartはStruct Triplet Representations(STR)を利用して、統一的でラベル効率のよいアプローチを実現する新しいフレームワークである。
論文 参考訳(メタデータ) (2023-09-20T12:51:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。