論文の概要: ChartZero: Synthetic Priors Enable Zero Shot Chart Data Extraction
- arxiv url: http://arxiv.org/abs/2605.05820v1
- Date: Thu, 07 May 2026 07:57:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.610733
- Title: ChartZero: Synthetic Priors Enable Zero Shot Chart Data Extraction
- Title(参考訳): ChartZero: ゼロショットチャートデータの抽出を可能にするシンセティックプライオリティ
- Authors: Md Touhidul Islam, Yasir Mahmud, Sujan Kumar Saha, Mark Tehranipoor, Farimah Farahmandi,
- Abstract要約: 合成先行情報を活用する解析フレームワークであるChartZeroを導入し,ロバストなゼロショットチャートデータ抽出を実現する。
我々は,Global Orthogonal Instance (GOI) の損失によって曲線の断片化を克服し,不安定な空間ルールをオープン語彙であるVLM(Vision-Language Model)に置き換える。
- 参考スコア(独自算出の注目度): 2.825872203744638
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Automated data extraction from line charts remains fundamentally bottlenecked by extreme stylistic diversity and a severe scarcity of comprehensively annotated, real-world datasets. Current end-to-end pipelines depend heavily on costly manual annotations, crippling their ability to generalize across arbitrary aesthetics and grid layouts. Furthermore, existing models suffer from two critical failure modes during reconstruction. First, extracting thin, intersecting curves frequently causes structural fragmentation and the erasure of fine visual details, as standard architectures struggle against complex backgrounds. Second, semantic association is notoriously error-prone; current pipelines rely on rigid spatial heuristics that easily break down against the unpredictable legend placements of in-the-wild charts. Finally, measuring true progress is hindered by evaluation protocols that assess isolated sub-tasks rather than holistic, end-to-end data reconstruction. To address these foundational issues, we introduce ChartZero, a parsing framework that leverages synthetic priors to enable robust zero-shot chart data extraction. By training exclusively on a purely synthetic dataset of simple mathematical functions, our model completely bypasses the real-world annotation bottleneck. We overcome curve fragmentation via a novel Global Orthogonal Instance (GOI) loss, and replace brittle spatial rules with an open-vocabulary, Vision-Language Model (VLM)-guided legend matching strategy. Accompanied by a new metric and benchmark specifically designed for full end-to-end reconstruction, our evaluations demonstrate that ChartZero significantly advances generalized plot digitization without requiring real-world supervision. Code and dataset will be released upon acceptance.
- Abstract(参考訳): ラインチャートからの自動データ抽出は、極端なスタイリスティックな多様性と、包括的な注釈付き実世界のデータセットの不足によって、基本的にボトルネックになっている。
現在のエンドツーエンドパイプラインは、コストのかかる手作業によるアノテーションに大きく依存しており、任意の美学とグリッドレイアウトをまたいで一般化する能力を制限している。
さらに、既存モデルは再建時に2つの重要な障害モードに悩まされる。
まず、細く交差する曲線を抽出すると、しばしば構造的な断片化や、標準的なアーキテクチャが複雑な背景と戦っているため、細かな視覚的詳細が消去される。
第二に、セマンティック・アソシエーションはエラーを起こしやすいことで知られており、現在のパイプラインは、予測不能な伝説的なチャートの配置に容易に逆らう、厳密な空間的ヒューリスティックに依存している。
最後に、完全なエンドツーエンドのデータ再構成ではなく、孤立したサブタスクを評価する評価プロトコルによって、真の進捗を測定することが妨げられる。
このような基礎的な問題に対処するために、我々は、ゼロショットチャートデータの堅牢な抽出を可能にするために、合成先行値を活用する解析フレームワークであるChartZeroを紹介した。
単純な数学的関数の純粋に合成されたデータセットのみをトレーニングすることにより、われわれのモデルは実世界のアノテーションボトルネックを完全に回避する。
我々は,Global Orthogonal Instance (GOI) の損失によって曲線の断片化を克服し,不安定な空間ルールをオープン語彙であるVLM(Vision-Language Model)に置き換える。
実世界の監視を必要とせずに,ChartZeroが一般化されたプロットのデジタル化を著しく向上させることを示す。
コードとデータセットは受理時にリリースされる。
関連論文リスト
- Self-Improving Tabular Language Models via Iterative Group Alignment [76.43372236405664]
自動フィードバックによるデータ生成のための,最初の自己改善フレームワークであるTabGRAAを紹介する。
新たに生成されたサンプルを高品質なグループと低品質なグループに分割し、グループ相対的な有利な目標を優先順位付けする。
実験では、TabGRAAは、忠実さ、ユーティリティ、プライバシにおいて、既存のメソッドよりも優れています。
論文 参考訳(メタデータ) (2026-04-21T01:29:52Z) - Glocal Information Bottleneck for Time Series Imputation [70.41814118117311]
Time Series Imputationは、時間データの欠落した値を復元することを目的としている。
既存のモデルは、通常、数値(ローカル情報)の回復に焦点をあてて、ポイントワイズ復元損失を最適化する。
我々はGlocal Information Bottleneck(Glocal-IB)という新たなトレーニングパラダイムを提案する。
論文 参考訳(メタデータ) (2025-10-06T15:24:44Z) - BigCharts-R1: Enhanced Chart Reasoning with Visual Reinforcement Finetuning [51.472854950300416]
視覚的に多様なチャート画像を生成するデータセット生成パイプラインであるBigChartsを提案する。
純粋な合成データセットとは異なり、BigChartsは現実世界のデータを取り込んで、信頼性と視覚的多様性を保証する。
チャート推論に特化して設計された新たな報酬信号を導入することにより,モデルの堅牢性と一般化が促進される。
論文 参考訳(メタデータ) (2025-08-13T13:39:17Z) - Not All Data are Good Labels: On the Self-supervised Labeling for Time Series Forecasting [37.189362258417624]
本稿では,候補データセットを自然に構築することで,時系列データセットを再ラベルする新たな自己教師型アプローチについて検討する。
単純な再構成ネットワークの最適化において、中間体は自己管理パラダイムの擬似ラベルとして使用される。
実世界の11のデータセットの実験では、SCAMは様々なバックボーンモデルの性能を一貫して改善している。
論文 参考訳(メタデータ) (2025-02-20T16:29:37Z) - Deep Loss Convexification for Learning Iterative Models [11.36644967267829]
点雲登録のための反復的最近点(ICP)のような反復的手法は、しばしば悪い局所最適性に悩まされる。
我々は,各地真実の周囲に凸景観を形成する学習を提案する。
論文 参考訳(メタデータ) (2024-11-16T01:13:04Z) - SINDER: Repairing the Singular Defects of DINOv2 [61.98878352956125]
大規模なデータセットでトレーニングされたビジョントランスフォーマーモデルは、抽出したパッチトークンにアーティファクトを表示することが多い。
本稿では,小さなデータセットのみを用いて構造欠陥を補正するスムーズなスムーズな正規化を提案する。
論文 参考訳(メタデータ) (2024-07-23T20:34:23Z) - Deep Manifold Graph Auto-Encoder for Attributed Graph Embedding [51.75091298017941]
本稿では,属性付きグラフデータに対する新しいDeep Manifold (Variational) Graph Auto-Encoder (DMVGAE/DMGAE)を提案する。
提案手法は,最先端のベースラインアルゴリズムを,一般的なデータセット間でのダウンストリームタスクの差を大きく越える。
論文 参考訳(メタデータ) (2024-01-12T17:57:07Z) - The Devil in the Details: Simple and Effective Optical Flow Synthetic
Data Generation [19.945859289278534]
本稿では,光学フローデータセットの要求特性が比較的単純であり,簡易な合成データ生成法を提案する。
2次元動きに基づくデータセットでは、合成データセットを生成するための最も単純だが重要な要素を体系的に分析する。
論文 参考訳(メタデータ) (2023-08-14T18:01:45Z) - Better Patch Stitching for Parametric Surface Reconstruction [100.55842629739574]
ローカルマッピングのグローバルな一貫性を明示的に促進するアプローチを導入する。
第一項は表面の正規性を利用しており、個々の写像内および全体にわたって推定された場合、局所的に一貫した状態を保つことを要求する。
第2項はさらに、新しい縫合誤差を最小化することにより、マッピングの空間構成を改善する。
論文 参考訳(メタデータ) (2020-10-14T12:37:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。