論文の概要: Assessing Y-Axis Influence: Bias in Multimodal Language Models on Chart-to-Table Translation
- arxiv url: http://arxiv.org/abs/2604.24987v1
- Date: Mon, 27 Apr 2026 20:47:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-29 16:49:17.594073
- Title: Assessing Y-Axis Influence: Bias in Multimodal Language Models on Chart-to-Table Translation
- Title(参考訳): Y軸の影響評価:チャート・ツー・テイブル翻訳における多モーダル言語モデルのバイアス
- Authors: Seok Hwan Song, Azher Ahmed Efat, Wallapak Tavanapong,
- Abstract要約: 公開チャートデータセットにおけるy軸情報の様々な側面の画像を観察する。
主要なTick値の桁長、大きなTickの個数、値の範囲、およびTick値フォーマットに関連する大きなy軸バイアスがある。
y軸情報によるプロンプティングは、一部の人のパフォーマンスを著しく向上させることができる。
- 参考スコア(独自算出の注目度): 3.2880869992413246
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Chart-to-table translation converts chart images into structured tabular data. Accurate translation is crucial for Multimodal Language Model (MLM) to answer complex queries. We observe imbalances in the number of images across different aspects of the y-axis information in public chart datasets. Such imbalances can introduce unintended biases, causing uneven MLM performance. Previous works have not systematically examined these biases. To address this gap, we propose a new framework, FairChart2Table, for analyzing y-axis-related bias on five state-of-the-art models. Key Findings: (1) There are significant y-axis biases related to the digit length of the major tick values, the number of major ticks, the range of values, and the tick value format (e.g., abbreviation or scientific format). (2) The number of legends/entities in chart images impacts MLM performance. (3) Prompting MLM with y-axis information can significantly enhance the performance for some MLMs.
- Abstract(参考訳): Chart-to-table変換は、チャート画像を構造化された表データに変換する。
マルチモーダル言語モデル(MLM)では,複雑なクエリに対する正確な翻訳が不可欠である。
公開チャートデータセットにおけるy軸情報の様々な側面における画像数の不均衡を観察する。
このような不均衡は意図しないバイアスをもたらし、不均一なMLM性能を引き起こす。
以前の研究はこれらのバイアスを体系的に調べていない。
このギャップに対処するために,5つの最先端モデルのy軸関連バイアスを解析するための新しいフレームワークであるFairChart2Tableを提案する。
主な発見点: 1) 主要ティッチ値の桁長、主要ティック数、値の範囲、およびティック値フォーマット(例:略語または科学形式)に関連する重要なy軸バイアスが存在する。
2) チャート画像における伝説・物語の数はMLMのパフォーマンスに影響を及ぼす。
3) y軸情報を用いたMLMのプロンプティングは, 一部のMLMの性能を著しく向上させることができる。
関連論文リスト
- On Pre-training of Multimodal Language Models Customized for Chart Understanding [83.99377088129282]
本稿では,MLLMのチャート理解を改善するために必要な学習過程について考察する。
詳細なチャート理解に適したMLLMであるCHOPINLLMを紹介する。
論文 参考訳(メタデータ) (2024-07-19T17:58:36Z) - ChartX & ChartVLM: A Versatile Benchmark and Foundation Model for Complicated Chart Reasoning [55.22996841790139]
我々は、チャート領域における既製のマルチモーダル言語モデル(MLLM)の能力をベンチマークする。
ChartXは18種類のチャートタイプ,7つのチャートタスク,22のディシプリナトピック,高品質なチャートデータを含むマルチモーダルな評価セットである。
我々は、解釈可能なパターンに強く依存するマルチモーダルタスクに対する新しい視点を提供するため、ChartVLMを開発した。
論文 参考訳(メタデータ) (2024-02-19T14:48:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。