論文の概要: Infogen: Generating Complex Statistical Infographics from Documents
- arxiv url: http://arxiv.org/abs/2507.20046v1
- Date: Sat, 26 Jul 2025 19:38:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-29 16:23:56.770373
- Title: Infogen: Generating Complex Statistical Infographics from Documents
- Title(参考訳): Infogen: ドキュメントから複雑な統計的インフォグラフィックを生成する
- Authors: Akash Ghosh, Aparna Garimella, Pritika Ramu, Sambaran Bandyopadhyay, Sriparna Saha,
- Abstract要約: 本稿では,複数のサブチャート(ライン,バー,パイなど)からなるインフォグラフィックを生成するタスクを紹介する。
そこで我々は,そのタイトルやテキストのインサイトを含むインフォグラフィックメタデータと,対応するデータやアライメントなどのサブチャート固有の詳細を定義する。
また、Infodatは、テキストとインフォグラフィックのメタデータ生成のための最初のベンチマークデータセットである。
- 参考スコア(独自算出の注目度): 29.46917658452633
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Statistical infographics are powerful tools that simplify complex data into visually engaging and easy-to-understand formats. Despite advancements in AI, particularly with LLMs, existing efforts have been limited to generating simple charts, with no prior work addressing the creation of complex infographics from text-heavy documents that demand a deep understanding of the content. We address this gap by introducing the task of generating statistical infographics composed of multiple sub-charts (e.g., line, bar, pie) that are contextually accurate, insightful, and visually aligned. To achieve this, we define infographic metadata that includes its title and textual insights, along with sub-chart-specific details such as their corresponding data and alignment. We also present Infodat, the first benchmark dataset for text-to-infographic metadata generation, where each sample links a document to its metadata. We propose Infogen, a two-stage framework where fine-tuned LLMs first generate metadata, which is then converted into infographic code. Extensive evaluations on Infodat demonstrate that Infogen achieves state-of-the-art performance, outperforming both closed and open-source LLMs in text-to-statistical infographic generation.
- Abstract(参考訳): 統計的インフォグラフィックは、複雑なデータを視覚的に魅力的で分かりやすいフォーマットに単純化する強力なツールである。
AI、特にLLMの進歩にもかかわらず、既存の取り組みは単純なチャートの作成に限られており、コンテンツに対する深い理解を必要とするテキストの多いドキュメントからの複雑なインフォグラフィックの作成に対処する以前の作業は行われていない。
我々は,複数のサブチャート(例えば,行,バー,パイ)からなる,文脈的,洞察的,視覚的に整合した統計インフォグラフィックを生成するタスクを導入することで,このギャップに対処する。
そこで我々は,そのタイトルやテキストのインサイトを含むインフォグラフィックメタデータと,対応するデータやアライメントなどのサブチャート固有の詳細を定義する。
また、Infodatは、テキストとインフォグラフィックのメタデータ生成のための最初のベンチマークデータセットであり、各サンプルがそのメタデータにドキュメントをリンクする。
本稿では,2段階のフレームワークであるInfogenを提案する。このフレームワークでは,微調整 LLM がまずメタデータを生成し,それをインフォグラフィックコードに変換する。
Infodatの大規模な評価は、Infogenが最先端のパフォーマンスを達成し、テキストから統計インフォグラフィック生成において、クローズドおよびオープンソース両方のLLMよりも優れていることを示している。
関連論文リスト
- Doc2Chart: Intent-Driven Zero-Shot Chart Generation from Documents [7.616682226138909]
文書から意図に基づくチャート生成の課題を紹介する。
ゴールは、意図に忠実なチャートを生成し、ゼロショット設定でドキュメントに基盤を置くことです。
本稿では,チャートの構造化テキスト表現を用いた属性に基づくメトリクスを提案する。
論文 参考訳(メタデータ) (2025-07-20T04:34:59Z) - ChartLens: Fine-grained Visual Attribution in Charts [106.44872805609673]
Post-Hoc Visual Attribution for Chartsは、所定のチャート関連応答を検証する詳細なチャート要素を特定する。
グラフオブジェクトの識別にセグメンテーションに基づく手法を用いた新しいチャート属性アルゴリズムであるChartLensを提案する。
評価の結果,ChartLensの微粒化属性は26-66%向上した。
論文 参考訳(メタデータ) (2025-05-25T23:17:32Z) - ChartGalaxy: A Dataset for Infographic Chart Understanding and Generation [16.452660608535002]
インフォグラフィックチャートの理解を促進するために設計された100万規模のデータセットであるChartGalaxyを紹介する。
データセットは、実際のインフォグラフィックチャートから75のチャートタイプ、330のチャートバリエーション、68のテンプレートを識別するインダクティブプロセスによって構築される。
1)微調整によるインフォグラフィックチャート理解の改善,2)インフォグラフィックチャートのベンチマークコード生成,3)インフォグラフィックチャート生成の実現。
論文 参考訳(メタデータ) (2025-05-24T12:06:22Z) - BRIDGES: Bridging Graph Modality and Large Language Models within EDA Tasks [12.683482535955314]
LLMのパフォーマンスは、グラフがシーケンシャルテキストとして表現されるときに悩む。
EDAタスクのための LLM にグラフモダリティを組み込むためのフレームワークBRIDGES を紹介する。
その結果、テキストのみのベースラインに比べて、複数のタスクで2倍から10倍の改善が見られた。
論文 参考訳(メタデータ) (2025-04-07T15:27:32Z) - ChartCoder: Advancing Multimodal Large Language Model for Chart-to-Code Generation [62.88742217569754]
textbfChartCoderは、最初の専用チャートからコードへのMLLMである。
textbfChart2Code-160kは、チャート・ツー・コード生成のための、最初の大規模かつ多様なデータセットである。
実験によると、ChartCoderは7Bパラメータしか持たないが、チャート・トゥ・コードベンチマークで既存のオープンソースのMLLMを超えている。
論文 参考訳(メタデータ) (2025-01-11T17:52:22Z) - ChartAdapter: Large Vision-Language Model for Chart Summarization [13.499376163294816]
ChartAdapterは、チャートとテキスト要約の間のギャップを埋めるために設計された軽量トランスフォーマーモジュールである。
LLMとChartAdapterを統合することで、エンドツーエンドのトレーニングと効率的なチャート要約を可能にします。
論文 参考訳(メタデータ) (2024-12-30T05:07:34Z) - Large Language Models on Graphs: A Comprehensive Survey [77.16803297418201]
グラフ上の大規模言語モデルに関連するシナリオとテクニックを体系的にレビューする。
まず,LLMをグラフに適用する可能性シナリオを,純グラフ,テキスト分散グラフ,テキストペアグラフの3つのカテゴリにまとめる。
本稿では,そのような手法の現実的な応用について論じ,オープンソースコードとベンチマークデータセットを要約する。
論文 参考訳(メタデータ) (2023-12-05T14:14:27Z) - DiagrammerGPT: Generating Open-Domain, Open-Platform Diagrams via LLM Planning [62.51232333352754]
テキスト・ツー・イメージ(T2I)世代はここ数年で著しい成長を遂げている。
それにもかかわらず、T2Iモデルでダイアグラムを生成する作業はほとんど行われていない。
本稿では,新しい2段階のテキスト・ツー・ダイアグラム生成フレームワークであるDiagrammerGPTを紹介する。
我々のフレームワークは、既存のT2Iモデルを上回る精度で、より正確なダイアグラムを生成する。
論文 参考訳(メタデータ) (2023-10-18T17:37:10Z) - Leveraging Large Language Models for Node Generation in Few-Shot Learning on Text-Attributed Graphs [5.587264586806575]
本稿では,Large Language Models (LLMs) を用いたノード生成によるテキスト分散グラフの強化のためのプラグイン・アンド・プレイ手法を提案する。
LLMはラベルから意味情報を抽出し、模範としてカテゴリに属するサンプルを生成する。
エッジ予測器を用いて、生のデータセットに固有の構造情報をキャプチャし、新たに生成されたサンプルを元のグラフに統合する。
論文 参考訳(メタデータ) (2023-10-15T16:04:28Z) - Integrating Graphs with Large Language Models: Methods and Prospects [68.37584693537555]
大規模言語モデル (LLMs) が最前線として登場し、様々なアプリケーションにおいて非並列の長所を示している。
LLMとグラフ構造化データを組み合わせることは、非常に興味深いトピックです。
本稿では、そのような統合を2つの主要なカテゴリに分岐する。
論文 参考訳(メタデータ) (2023-10-09T07:59:34Z) - Scientific Paper Extractive Summarization Enhanced by Citation Graphs [50.19266650000948]
我々は、引用グラフを活用して、異なる設定下での科学的論文の抽出要約を改善することに重点を置いている。
予備的な結果は、単純な教師なしフレームワークであっても、引用グラフが有用であることを示している。
そこで我々は,大規模ラベル付きデータが利用可能である場合のタスクにおいて,より正確な結果を得るために,グラフベースのスーパービジョン・サムライゼーション・モデル(GSS)を提案する。
論文 参考訳(メタデータ) (2022-12-08T11:53:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。