論文の概要: From Charts to Fair Narratives: Uncovering and Mitigating Geo-Economic Biases in Chart-to-Text
- arxiv url: http://arxiv.org/abs/2508.09450v1
- Date: Wed, 13 Aug 2025 03:09:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-14 20:42:00.735266
- Title: From Charts to Fair Narratives: Uncovering and Mitigating Geo-Economic Biases in Chart-to-Text
- Title(参考訳): グラフからフェアナラティブへ:チャートからテキストへのジオエコノミクスの解明と緩和
- Authors: Ridwan Mahbub, Mohammed Saidul Islam, Mir Tafseer Nayeem, Md Tahmid Rahman Laskar, Mizanur Rahman, Shafiq Joty, Enamul Hoque,
- Abstract要約: 本稿では,VLM(Vision-Language Models)が,チャートの要約を生成する際に,地球経済のバイアスを増幅する方法について検討する。
6,000のチャート・カントリー・ペアにまたがるVLM生成チャートにおける地理的・経済的バイアスの大規模評価を行う。
分析の結果,既存のVLMでは,中所得国や低所得国と比較して,高所得国の方が肯定的な説明が得られやすいことが明らかとなった。
- 参考スコア(独自算出の注目度): 26.872469954141067
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Charts are very common for exploring data and communicating insights, but extracting key takeaways from charts and articulating them in natural language can be challenging. The chart-to-text task aims to automate this process by generating textual summaries of charts. While with the rapid advancement of large Vision-Language Models (VLMs), we have witnessed great progress in this domain, little to no attention has been given to potential biases in their outputs. This paper investigates how VLMs can amplify geo-economic biases when generating chart summaries, potentially causing societal harm. Specifically, we conduct a large-scale evaluation of geo-economic biases in VLM-generated chart summaries across 6,000 chart-country pairs from six widely used proprietary and open-source models to understand how a country's economic status influences the sentiment of generated summaries. Our analysis reveals that existing VLMs tend to produce more positive descriptions for high-income countries compared to middle- or low-income countries, even when country attribution is the only variable changed. We also find that models such as GPT-4o-mini, Gemini-1.5-Flash, and Phi-3.5 exhibit varying degrees of bias. We further explore inference-time prompt-based debiasing techniques using positive distractors but find them only partially effective, underscoring the complexity of the issue and the need for more robust debiasing strategies. Our code and dataset are publicly available here.
- Abstract(参考訳): グラフはデータの探索や洞察の伝達に非常に一般的なものですが、チャートから重要な特徴を抽出し、自然言語で表現することは困難です。
chart-to-textタスクは、チャートのテキスト要約を生成することによって、このプロセスを自動化することを目的としている。
VLM(Varge Vision-Language Models)の急速な進歩とともに、我々はこの領域における大きな進歩を目撃してきたが、その出力の潜在的なバイアスにはほとんど、ほとんど、あるいは全く注意を払わなかった。
本稿では,VLMがグラフ要約を生成する際の地理的・経済的バイアスを増幅し,社会的な害をもたらす可能性について検討する。
具体的には、VLMが生成した6つのプロプライエタリおよびオープンソースモデルから、6,000のチャート・カウンタからなるグラフ・サマリーの地理的・経済的バイアスを大規模に評価し、国の経済状態が生成されたサマリーの感情にどのように影響するかを理解する。
分析の結果,既存のVLMは,中所得国や低所得国と比較して,国の属性が変化しても,高所得国の方が肯定的な説明が得られやすいことが明らかとなった。
また, GPT-4o-mini, Gemini-1.5-Flash, Phi-3.5などのモデルでは, バイアスの程度が異なることがわかった。
さらに、ポジティブな気晴らしを用いた推論時プロンプトベースのデバイアス技術について検討するが、それは部分的に有効であり、問題の複雑さとより堅牢なデバイアス戦略の必要性を裏付けるものである。
私たちのコードとデータセットはこちらで公開されています。
関連論文リスト
- BigCharts-R1: Enhanced Chart Reasoning with Visual Reinforcement Finetuning [51.472854950300416]
視覚的に多様なチャート画像を生成するデータセット生成パイプラインであるBigChartsを提案する。
純粋な合成データセットとは異なり、BigChartsは現実世界のデータを取り込んで、信頼性と視覚的多様性を保証する。
チャート推論に特化して設計された新たな報酬信号を導入することにより,モデルの堅牢性と一般化が促進される。
論文 参考訳(メタデータ) (2025-08-13T13:39:17Z) - Geopolitical biases in LLMs: what are the "good" and the "bad" countries according to contemporary language models [52.00270888041742]
我々は、中立なイベント記述と異なる国からの視点を対比した新しいデータセットを導入する。
以上の結果から,特定の民族的物語のモデルが好まれる,重要な地政学的偏見がみられた。
単純なデバイアスのプロンプトはこれらのバイアスを減らすのに限られた効果があった。
論文 参考訳(メタデータ) (2025-06-07T10:45:17Z) - ChartLens: Fine-grained Visual Attribution in Charts [106.44872805609673]
Post-Hoc Visual Attribution for Chartsは、所定のチャート関連応答を検証する詳細なチャート要素を特定する。
グラフオブジェクトの識別にセグメンテーションに基づく手法を用いた新しいチャート属性アルゴリズムであるChartLensを提案する。
評価の結果,ChartLensの微粒化属性は26-66%向上した。
論文 参考訳(メタデータ) (2025-05-25T23:17:32Z) - CharXiv: Charting Gaps in Realistic Chart Understanding in Multimodal LLMs [62.84082370758761]
CharXivは、arXiv論文の2,323のチャートを含む総合的な評価スイートである。
品質を確保するために、すべてのチャートと質問は、人間の専門家によって手書きされ、キュレーションされ、検証されます。
その結果、最強のプロプライエタリモデルの推論スキルの間に、かなり過小評価されていたギャップが明らかとなった。
論文 参考訳(メタデータ) (2024-06-26T17:50:11Z) - ChartSumm: A Comprehensive Benchmark for Automatic Chart Summarization
of Long and Short Summaries [0.26097841018267615]
テキスト要約の自動チャートは視覚障害者に有効なツールである。
本稿では,84,363個のグラフからなる大規模ベンチマークデータセットであるChartSummを提案する。
論文 参考訳(メタデータ) (2023-04-26T15:25:24Z) - Chart-to-Text: A Large-Scale Benchmark for Chart Summarization [9.647079534077472]
2つのデータセットと44,096のチャートを持つ大規模ベンチマークであるChart-to-textを提示する。
データセット構築プロセスを説明し、データセットを解析する。
論文 参考訳(メタデータ) (2022-03-12T17:01:38Z) - Chart-to-Text: Generating Natural Language Descriptions for Charts by
Adapting the Transformer Model [6.320141734801679]
我々は,新しいデータセットを導入し,グラフの自然言語要約を自動的に生成するニューラルモデルを提案する。
生成された要約は、チャートの解釈を提供し、そのチャートで見られる重要な洞察を伝える。
論文 参考訳(メタデータ) (2020-10-18T23:57:33Z) - Investigating Pretrained Language Models for Graph-to-Text Generation [55.55151069694146]
Graph-to-text生成は、グラフベースのデータから流動的なテキストを生成することを目的としている。
本稿では,3つのグラフ領域,つまり表現,ウィキペディア知識グラフ(KG),科学的なKGについて検討する。
我々は, PLM の BART と T5 が新たな最先端の成果を達成し, タスク適応型事前学習戦略が性能をさらに向上することを示す。
論文 参考訳(メタデータ) (2020-07-16T16:05:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。