論文の概要: From Pen to Pixel: Translating Hand-Drawn Plots into Graphical APIs via a Novel Benchmark and Efficient Adapter
- arxiv url: http://arxiv.org/abs/2603.26356v1
- Date: Fri, 27 Mar 2026 12:27:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-30 21:49:48.499739
- Title: From Pen to Pixel: Translating Hand-Drawn Plots into Graphical APIs via a Novel Benchmark and Efficient Adapter
- Title(参考訳): PenからPixelへ:新しいベンチマークと効率的なアダプタを使って手書きのプロットをグラフィカルなAPIに変換する
- Authors: Zhenghao Xu, Mengning Yang,
- Abstract要約: 我々はHDpy-13という手書きプロットデータセットを導入し、手書きプロット画像のグラフィカルAPIレコメンデーションの性能を向上させる。
また、Plot-Adapterは、各言語やドメインのモデル全体を必要とせず、個別のアダプタのトレーニングと保存を可能にする。
- 参考スコア(独自算出の注目度): 2.98885096929089
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As plots play a critical role in modern data visualization and analysis, Plot2API is launched to help non-experts and beginners create their desired plots by directly recommending graphical APIs from reference plot images by neural networks. However, previous works on Plot2API have primarily focused on the recommendation for standard plot images, while overlooking the hand-drawn plot images that are more accessible to non-experts and beginners. To make matters worse, both Plot2API models trained on standard plot images and powerful multi-modal large language models struggle to effectively recommend APIs for hand-drawn plot images due to the domain gap and lack of expertise. To facilitate non-experts and beginners, we introduce a hand-drawn plot dataset named HDpy-13 to improve the performance of graphical API recommendations for hand-drawn plot images. Additionally, to alleviate the considerable strain of parameter growth and computational resource costs arising from multi-domain and multi-language challenges in Plot2API, we propose Plot-Adapter that allows for the training and storage of separate adapters rather than requiring an entire model for each language and domain. In particular, Plot-Adapter incorporates a lightweight CNN block to improve the ability to capture local features and implements projection matrix sharing to reduce the number of fine-tuning parameters further. Experimental results demonstrate both the effectiveness of HDpy-13 and the efficiency of Plot-Adapter.
- Abstract(参考訳): プロットが現代のデータビジュアライゼーションと分析において重要な役割を果たしているため、Plot2APIは、非専門家や初心者が、ニューラルネットワークによる参照プロットイメージからグラフィカルAPIを直接推奨することで、望ましいプロットの作成を支援するためにローンチされる。
しかしながら、Plot2APIの以前の研究は主に標準的なプロットイメージの推奨に焦点を合わせており、非専門家や初心者によりアクセスしやすい手書きプロットイメージを見下ろしている。
さらに悪いことに、標準的なプロットイメージに基づいてトレーニングされたPlot2APIモデルと強力なマルチモーダルな大規模言語モデルの両方では、ドメインギャップと専門知識の欠如により、手書きプロットイメージ用のAPIを効果的に推奨するのは難しい。
非専門家や初心者を支援するために,HDpy-13という手書きプロットデータセットを導入し,手書きプロット画像のグラフィカルAPIレコメンデーションの性能を向上させる。
さらに,Plot2APIのマルチドメイン問題や多言語問題に起因するパラメータ成長や計算資源コストのかなりの負担を軽減するため,各言語やドメインのモデル全体を必要とせず,個別のアダプタのトレーニングと格納を可能にするPlot-Adapterを提案する。
特に、Plot-Adapterは、ローカル機能をキャプチャする機能を改善するために、軽量なCNNブロックを組み込んでおり、プロジェクションマトリックス共有を実装して、微調整パラメータの数をさらに削減している。
実験により,HDpy-13の有効性とPlot-Adapterの有効性が示された。
関連論文リスト
- BigCharts-R1: Enhanced Chart Reasoning with Visual Reinforcement Finetuning [51.472854950300416]
視覚的に多様なチャート画像を生成するデータセット生成パイプラインであるBigChartsを提案する。
純粋な合成データセットとは異なり、BigChartsは現実世界のデータを取り込んで、信頼性と視覚的多様性を保証する。
チャート推論に特化して設計された新たな報酬信号を導入することにより,モデルの堅牢性と一般化が促進される。
論文 参考訳(メタデータ) (2025-08-13T13:39:17Z) - Statistical Confidence Rescoring for Robust 3D Scene Graph Generation from Multi-View Images [56.134885746889026]
セマンティックシーングラフ推定法は, 対象物, 述語, 関係性を正確に予測するために, 3Dアノテーションを利用する。
我々は、予測深度マップから、ノイズの多い擬似点ベース形状を克服し、マルチビュー画像の特徴に現れる背景雑音の量を削減した。
提案手法は,初期入力としてマルチビュー画像を純粋に用いた現在の手法より優れている。
論文 参考訳(メタデータ) (2025-08-05T21:25:50Z) - PointVDP: Learning View-Dependent Projection by Fireworks Rays for 3D Point Cloud Segmentation [66.00721801098574]
本稿では,ポイントクラウドのセグメンテーションを容易にするために,ビュー依存プロジェクション(VDP)を提案する。
VDPは3Dポイント分布からデータ駆動プロジェクションを生成する。
フレームワークを最適化するために色規則化を構築します。
論文 参考訳(メタデータ) (2025-07-09T07:44:00Z) - TraGraph-GS: Trajectory Graph-based Gaussian Splatting for Arbitrary Large-Scale Scene Rendering [22.856356474506168]
既存の方法は、通常、大きなシーンを複数の領域に分割し、各領域のガウススプラッティングを用いて3D表現を再構成し、最終的にそれらを新しいビューレンダリングのためにマージする。
任意の大規模シーンの高精度レンダリングを実現するためにトラジェクトリグラフを利用するトラグラフ-GSを提案する。
提案手法は, 地上データセットにおけるPSNRの1.86dB, 地上データセットにおける1.62dBを, 最先端のアプローチと比較して平均的に改善する。
論文 参考訳(メタデータ) (2025-06-10T11:43:04Z) - T-Graph: Enhancing Sparse-view Camera Pose Estimation by Pairwise Translation Graph [3.3301244688278078]
T-Graphは軽量でプラグアンドプレイのモジュールで、スパースビュー設定でのカメラポーズ推定を強化する。
入力としてペア画像の特徴を取り込み、MLP(Multilayer Perceptron)を通してそれらをマップする。
その後、完全に接続された翻訳グラフを構築し、ノードはカメラとエッジを表現し、翻訳関係を符号化する。
論文 参考訳(メタデータ) (2025-05-02T11:50:48Z) - GenPlot: Increasing the Scale and Diversity of Chart Derendering Data [0.0]
我々は、合成データを用いて、チャートデレンダリングのための何十億ものプロットを生成するプロットジェネレータであるGenPlotを提案する。
OCR-free chart-to-text translation は視覚言語タスクの最先端の結果を得た。
論文 参考訳(メタデータ) (2023-06-20T17:25:53Z) - Diffusion-Based Scene Graph to Image Generation with Masked Contrastive
Pre-Training [112.94542676251133]
画像とのアライメントを直接最適化することで,シーングラフの埋め込みを学習する。
具体的には,シーングラフからグローバル情報とローカル情報の両方を抽出するエンコーダを事前訓練する。
SGDiffと呼ばれる結果の方法は、シーングラフノードと接続を変更することによって生成された画像のセマンティックな操作を可能にする。
論文 参考訳(メタデータ) (2022-11-21T01:11:19Z) - Plot2API: Recommending Graphic API from Plot via Semantic Parsing Guided
Neural Network [13.936788648883068]
PlotベースのGraphic APIレコメンデーション(Plot2API)は、研究されていないが意味のある問題です。
Semantic Parsing Guided Neural Network (SPGNN) という新しい深層マルチタスク学習手法を提案する。
SPGNNでは、最近開発されたConvolutional Neural Network(CNN)であるEfficientNetがAPI推奨のバックボーンネットワークとして採用されている。
論文 参考訳(メタデータ) (2021-04-02T13:08:56Z) - APEX-Net: Automatic Plot Extractor Network [24.299931323012757]
プロット抽出問題を解決するために,新しい損失関数を持つ深層学習型フレームワークapex-netを提案する。
プロット画像と生データの両方を含む新しい大規模データセットAPEX-1Mを紹介します。
提案手法では,プロット画像上でネットワークの視覚的な結果を示し,プロットの形状をかなり抽出できることを実証する。
論文 参考訳(メタデータ) (2021-01-15T17:02:36Z) - Graph-PCNN: Two Stage Human Pose Estimation with Graph Pose Refinement [54.29252286561449]
グラフPCNNと呼ばれる2段階のグラフベースおよびモデルに依存しないフレームワークを提案する。
第1段階では、粗局化結果を得るために熱マップ回帰ネットワークを適用し、ガイドポイントと呼ばれる一連の提案キーポイントをサンプリングする。
第2段階では、各案内点について、ローカライゼーションにより異なる視覚特徴を抽出する。
ガイドされた点間の関係は、より正確なローカライゼーション結果を得るためにグラフポーズ精製モジュールによって探索される。
論文 参考訳(メタデータ) (2020-07-21T04:59:15Z) - A Grid-based Method for Removing Overlaps of Dimensionality Reduction
Scatterplot Layouts [40.11095094521714]
Distance Grid (DGrid) は、DDR(Diality Reduction) scatterplotレイアウトのオーバーラップを取り除くための新しい後処理戦略である。
元のレイアウトの特徴を忠実に保存し、最小のグリフサイズを束縛する。
論文 参考訳(メタデータ) (2019-03-08T18:20:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。