論文の概要: ChartSumm: A Comprehensive Benchmark for Automatic Chart Summarization
of Long and Short Summaries
- arxiv url: http://arxiv.org/abs/2304.13620v3
- Date: Sun, 11 Jun 2023 04:07:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-14 00:23:29.483433
- Title: ChartSumm: A Comprehensive Benchmark for Automatic Chart Summarization
of Long and Short Summaries
- Title(参考訳): ChartSumm: 長文と短文の自動チャート要約のための総合ベンチマーク
- Authors: Raian Rahman, Rizvi Hasan, Abdullah Al Farhad, Md Tahmid Rahman
Laskar, Md. Hamjajul Ashmafee, Abu Raihan Mostofa Kamal
- Abstract要約: テキスト要約の自動チャートは視覚障害者に有効なツールである。
本稿では,84,363個のグラフからなる大規模ベンチマークデータセットであるChartSummを提案する。
- 参考スコア(独自算出の注目度): 0.26097841018267615
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automatic chart to text summarization is an effective tool for the visually
impaired people along with providing precise insights of tabular data in
natural language to the user. A large and well-structured dataset is always a
key part for data driven models. In this paper, we propose ChartSumm: a
large-scale benchmark dataset consisting of a total of 84,363 charts along with
their metadata and descriptions covering a wide range of topics and chart types
to generate short and long summaries. Extensive experiments with strong
baseline models show that even though these models generate fluent and
informative summaries by achieving decent scores in various automatic
evaluation metrics, they often face issues like suffering from hallucination,
missing out important data points, in addition to incorrect explanation of
complex trends in the charts. We also investigated the potential of expanding
ChartSumm to other languages using automated translation tools. These make our
dataset a challenging benchmark for future research.
- Abstract(参考訳): テキスト要約への自動チャートは、視覚障害者に有効なツールであり、自然言語による表データの正確な洞察をユーザに提供します。
大規模で構造化されたデータセットは、データ駆動モデルにとって常に重要な部分です。
本稿では,トータル84,363のチャートからなる大規模ベンチマークデータセットであるchartsummを提案する。
強力なベースラインモデルによる大規模な実験は、これらのモデルが様々な自動評価指標で十分なスコアを達成して流動的で情報的な要約を生成するにもかかわらず、しばしば幻覚に苦しむこと、重要なデータポイントを欠いていること、チャートの複雑な傾向の誤った説明といった問題に直面していることを示している。
また、自動翻訳ツールを用いてChartSummを他の言語に拡張する可能性についても検討した。
これらのデータセットは、将来の研究のための挑戦的なベンチマークになります。
関連論文リスト
- Automatic Histograms: Leveraging Language Models for Text Dataset
Exploration [6.273685997216551]
本稿では,大規模言語モデルを活用した可視化ツールAutoHistogramsを紹介する。
AutoHistogramsは、関連する機能を自動的に識別し、ヒストグラムで視覚化する。
10人のデータワーカーによるユーザスタディでは、参加者はインサイトを素早く識別し、AutoHistogramsを使ってデータを探索することができる。
論文 参考訳(メタデータ) (2024-02-21T22:29:16Z) - ChartAssisstant: A Universal Chart Multimodal Language Model via
Chart-to-Table Pre-training and Multitask Instruction Tuning [54.89249749894061]
ChartAssistantは、ユニバーサルチャートの理解と推論のためのビジョン言語モデルである。
2段階のトレーニングプロセスを経て、チャートとテキストの調整のために、チャートからテーブルへのパースを事前トレーニングする。
実験により, 最先端UniChart法とChartllama法に比較して, 顕著な性能向上が得られた。
論文 参考訳(メタデータ) (2024-01-04T17:51:48Z) - ChartLlama: A Multimodal LLM for Chart Understanding and Generation [70.1393163657813]
GPT-4を利用した高品質な命令チューニングデータセットを作成する。
次に、生成したデータセットを使ってトレーニングしたマルチモーダルな大規模言語モデルであるChartLlamaを紹介します。
論文 参考訳(メタデータ) (2023-11-27T15:20:23Z) - StructChart: Perception, Structuring, Reasoning for Visual Chart
Understanding [58.38480335579541]
現在のチャート関連タスクは、視覚チャートから情報を抽出することを参照するチャート認識か、抽出されたデータから推論を行うかに焦点を当てている。
本稿では,共同認識と推論タスクのための統一的でラベル効率のよい学習パラダイムを確立することを目的とする。
各種のチャート関連タスクで実験を行い、統合されたチャート認識推論パラダイムの有効性と有望な可能性を実証した。
論文 参考訳(メタデータ) (2023-09-20T12:51:13Z) - UniChart: A Universal Vision-language Pretrained Model for Chart
Comprehension and Reasoning [29.947053208614246]
We present UniChart, a pretrained model for chart comprehension and reasoning。
UniChartは、チャートの関連するテキスト、データ、および視覚要素をエンコードし、その後、チャートグラウンドのテキストデコーダを使用して、自然言語で期待される出力を生成する。
i) チャートから視覚要素(バーや線など)とデータを抽出する低レベルタスク、(ii) チャート理解と推論のスキルを得るための高レベルタスクなどである。
論文 参考訳(メタデータ) (2023-05-24T06:11:17Z) - QTSumm: Query-Focused Summarization over Tabular Data [58.62152746690958]
人々は主に、データ分析を行うか、特定の質問に答えるためにテーブルをコンサルティングします。
そこで本研究では,テキスト生成モデルに人間的な推論を行なわなければならない,クエリ中心のテーブル要約タスクを新たに定義する。
このタスクには,2,934テーブル上の7,111の人間注釈付きクエリ-サマリーペアを含む,QTSummという新しいベンチマークを導入する。
論文 参考訳(メタデータ) (2023-05-23T17:43:51Z) - Scientific Paper Extractive Summarization Enhanced by Citation Graphs [50.19266650000948]
我々は、引用グラフを活用して、異なる設定下での科学的論文の抽出要約を改善することに重点を置いている。
予備的な結果は、単純な教師なしフレームワークであっても、引用グラフが有用であることを示している。
そこで我々は,大規模ラベル付きデータが利用可能である場合のタスクにおいて,より正確な結果を得るために,グラフベースのスーパービジョン・サムライゼーション・モデル(GSS)を提案する。
論文 参考訳(メタデータ) (2022-12-08T11:53:12Z) - Chart-to-Text: A Large-Scale Benchmark for Chart Summarization [9.647079534077472]
2つのデータセットと44,096のチャートを持つ大規模ベンチマークであるChart-to-textを提示する。
データセット構築プロセスを説明し、データセットを解析する。
論文 参考訳(メタデータ) (2022-03-12T17:01:38Z) - AutoChart: A Dataset for Chart-to-Text Generation Task [5.083249258048361]
本稿では,グラフの分析記述のための大規模データセットであるtextsfAutoChartを提案する。
グラフとその分析記述を自動的に生成する新しいフレームワークを提供する。
論文 参考訳(メタデータ) (2021-08-16T05:01:46Z) - Chart-to-Text: Generating Natural Language Descriptions for Charts by
Adapting the Transformer Model [6.320141734801679]
我々は,新しいデータセットを導入し,グラフの自然言語要約を自動的に生成するニューラルモデルを提案する。
生成された要約は、チャートの解釈を提供し、そのチャートで見られる重要な洞察を伝える。
論文 参考訳(メタデータ) (2020-10-18T23:57:33Z) - Open Graph Benchmark: Datasets for Machine Learning on Graphs [86.96887552203479]
スケーラブルで堅牢で再現可能なグラフ機械学習(ML)の研究を容易にするために,Open Graph Benchmark(OGB)を提案する。
OGBデータセットは大規模で、複数の重要なグラフMLタスクを含み、さまざまなドメインをカバーする。
各データセットに対して,有意義なアプリケーション固有のデータ分割と評価指標を用いた統一評価プロトコルを提供する。
論文 参考訳(メタデータ) (2020-05-02T03:09:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。