論文の概要: ChartEditor: A Reinforcement Learning Framework for Robust Chart Editing
- arxiv url: http://arxiv.org/abs/2511.15266v1
- Date: Wed, 19 Nov 2025 09:27:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-20 15:51:28.728367
- Title: ChartEditor: A Reinforcement Learning Framework for Robust Chart Editing
- Title(参考訳): ChartEditor:ロバストチャート編集のための強化学習フレームワーク
- Authors: Liangyu Chen, Yichen Xu, Jianzhe Ma, Yuqi Liu, Donglu Yang, Liang Zhang, Wenxuan Wang, Qin Jin,
- Abstract要約: 私たちは、31のチャートカテゴリにまたがる7,964のサンプルからなる総合的なベンチマークであるChartEditVistaを紹介します。
ChartEditVistaのインプットには、オリジナルのチャートコードなしで、オリジナルのチャートイメージと自然言語編集命令のみが含まれている。
また、コード実行可能性と視覚的忠実性を同時に実施するために、新しいレンダリング報酬を含む強化学習フレームワークを使用してトレーニングされたモデルであるChartEditorも提示する。
- 参考スコア(独自算出の注目度): 46.847377471580366
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Chart editing reduces manual effort in visualization design. Typical benchmarks limited in data diversity and assume access to complete chart code, which is seldom in real-world scenarios. To address this gap, we present ChartEditVista, a comprehensive benchmark consisting of 7,964 samples spanning 31 chart categories. It encompasses diverse editing instructions and covers nearly all editable chart elements. The inputs in ChartEditVista include only the original chart image and natural language editing instructions, without the original chart codes. ChartEditVista is generated through a fully automated pipeline that produces, edits, and verifies charts, ensuring high-quality chart editing data. Besides, we introduce two novel fine-grained, rule-based evaluation metrics: the layout metric, which evaluates the position, size and color of graphical components; and the text metric, which jointly assesses textual content and font styling. Building on top of ChartEditVista, we present ChartEditor, a model trained using a reinforcement learning framework that incorporates a novel rendering reward to simultaneously enforce code executability and visual fidelity. Through extensive experiments and human evaluations, we demonstrate that ChartEditVista provides a robust evaluation, while ChartEditor consistently outperforms models with similar-scale and larger-scale on chart editing tasks.
- Abstract(参考訳): チャート編集は、視覚化設計における手作業を減らす。
典型的なベンチマークはデータの多様性に制限があり、実際のシナリオではめったにない完全なチャートコードへのアクセスを前提としている。
このギャップに対処するため、31のチャートカテゴリにまたがる7,964のサンプルからなる総合的なベンチマークであるChartEditVistaを紹介します。
多様な編集命令を含み、ほぼ全ての編集可能なチャート要素をカバーする。
ChartEditVistaのインプットには、オリジナルのチャートコードなしで、オリジナルのチャートイメージと自然言語編集命令のみが含まれている。
ChartEditVistaは完全な自動化パイプラインを通じて生成され、チャートの生成、編集、検証を行い、高品質なチャート編集データを保証する。
さらに、グラフィカルコンポーネントの位置、サイズ、色を評価するレイアウトメトリックと、テキストコンテンツとフォントスタイリングを併用して評価するテキストメトリックという、2つの新しいきめ細かなルールベースの評価指標を導入する。
ChartEditVistaの上に構築されたChartEditorは、新しいレンダリング報酬を組み込んだ強化学習フレームワークを使用してトレーニングされたモデルで、コードの実行性と視覚的忠実性を同時に実施する。
大規模な実験と人的評価を通じて、ChartEditVistaが堅牢な評価を提供するのに対し、ChartEditorはグラフ編集タスクにおいて、同様のスケールでより大規模なモデルよりも一貫して優れています。
関連論文リスト
- ChartLens: Fine-grained Visual Attribution in Charts [106.44872805609673]
Post-Hoc Visual Attribution for Chartsは、所定のチャート関連応答を検証する詳細なチャート要素を特定する。
グラフオブジェクトの識別にセグメンテーションに基づく手法を用いた新しいチャート属性アルゴリズムであるChartLensを提案する。
評価の結果,ChartLensの微粒化属性は26-66%向上した。
論文 参考訳(メタデータ) (2025-05-25T23:17:32Z) - ChartEdit: How Far Are MLLMs From Automating Chart Analysis? Evaluating MLLMs' Capability via Chart Editing [6.671042213908933]
マルチモーダルな大言語モデル(MLLM)は、チャートレンダリングコードを生成する際の約束を示すが、コードによるチャートの編集はより難しい課題である。
グラフ編集タスク用に設計された新しいベンチマークであるtextscChartEditを提案する。
コードレベルとチャートレベルの2種類の実験で10種類のMLLMの性能を評価した。
論文 参考訳(メタデータ) (2025-05-17T09:47:15Z) - AskChart: Universal Chart Understanding through Textual Enhancement [20.075911012193494]
最先端のアプローチは、主にチャートイメージからの視覚的手がかりに焦点を当て、チャート内に埋め込まれたリッチテキスト情報を明示的に組み込むことができない。
AskChartは、Mixture of Experts (MoE)アーキテクチャを用いて、チャートからテキストと視覚の両方のキューを明示的に統合するユニバーサルモデルである。
論文 参考訳(メタデータ) (2024-12-26T09:59:43Z) - ChartReformer: Natural Language-Driven Chart Image Editing [0.1712670816823812]
提案するChartReformerは自然言語駆動のチャート画像編集ソリューションで,入力画像から直接,所定の命令プロンプトでチャートを編集する。
ChartReformerを一般化するために、様々な種類のチャート編集、スタイル、レイアウト、フォーマット、データ中心の編集を定義し、標準化する。
論文 参考訳(メタデータ) (2024-03-01T00:59:50Z) - ChartAssisstant: A Universal Chart Multimodal Language Model via
Chart-to-Table Pre-training and Multitask Instruction Tuning [54.89249749894061]
ChartAssistantは、ユニバーサルチャートの理解と推論のためのビジョン言語モデルである。
2段階のトレーニングプロセスを経て、チャートとテキストの調整のために、チャートからテーブルへのパースを事前トレーニングする。
実験により, 最先端UniChart法とChartllama法に比較して, 顕著な性能向上が得られた。
論文 参考訳(メタデータ) (2024-01-04T17:51:48Z) - ChartReader: A Unified Framework for Chart Derendering and Comprehension
without Heuristic Rules [89.75395046894809]
ChartReaderは、チャートのデレンダリングと理解タスクをシームレスに統合する統合フレームワークです。
提案手法には,トランスフォーマーに基づくチャートコンポーネント検出モジュールと,チャートからXまでのタスクに対する事前学習型視覚言語モデルが組み込まれている。
提案するフレームワークは,チャート解析に係わる作業を大幅に削減し,ユニバーサルチャート理解モデルへの一歩を踏み出すことができる。
論文 参考訳(メタデータ) (2023-04-05T00:25:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。