論文の概要: SciFlow-Bench: Evaluating Structure-Aware Scientific Diagram Generation via Inverse Parsing
- arxiv url: http://arxiv.org/abs/2602.09809v1
- Date: Tue, 10 Feb 2026 14:15:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-11 20:17:43.572908
- Title: SciFlow-Bench: Evaluating Structure-Aware Scientific Diagram Generation via Inverse Parsing
- Title(参考訳): SciFlow-Bench: 逆解析による構造認識科学図作成の評価
- Authors: Tong Zhang, Honglin Lin, Zhou Liu, Chong Chen, Wentao Zhang,
- Abstract要約: SciFlow-Benchは,画素レベルの出力から直接科学的図を生成するための,構造第一のベンチマークである。
実際の科学的PDFから構築されたSciFlow-Benchは、各ソースフレームワークのフィギュアを標準の接地木グラフと組み合わせ、ブラックボックスイメージジェネレータとしてモデルを評価する。
- 参考スコア(独自算出の注目度): 21.314888925181886
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Scientific diagrams convey explicit structural information, yet modern text-to-image models often produce visually plausible but structurally incorrect results. Existing benchmarks either rely on image-centric or subjective metrics insensitive to structure, or evaluate intermediate symbolic representations rather than final rendered images, leaving pixel-based diagram generation underexplored. We introduce SciFlow-Bench, a structure-first benchmark for evaluating scientific diagram generation directly from pixel-level outputs. Built from real scientific PDFs, SciFlow-Bench pairs each source framework figure with a canonical ground-truth graph and evaluates models as black-box image generators under a closed-loop, round-trip protocol that inverse-parses generated diagram images back into structured graphs for comparison. This design enforces evaluation by structural recoverability rather than visual similarity alone, and is enabled by a hierarchical multi-agent system that coordinates planning, perception, and structural reasoning. Experiments show that preserving structural correctness remains a fundamental challenge, particularly for diagrams with complex topology, underscoring the need for structure-aware evaluation.
- Abstract(参考訳): 科学図は明示的な構造情報を伝達するが、現代のテキスト・画像モデルはしばしば視覚的に可視であるが構造的に不正確な結果を生成する。
既存のベンチマークは、構造に敏感なイメージ中心または主観的なメトリクスに依存するか、最終レンダリング画像ではなく中間シンボル表現を評価するかのいずれかであり、ピクセルベースの図生成は未探索のままである。
SciFlow-Benchは,画素レベルの出力から直接科学的図を生成するための,構造第一のベンチマークである。
実際の科学的PDFから構築されたSciFlow-Benchは、各ソースフレームワークのフィギュアを標準の基底構造グラフとペアリングし、モデルをクローズドループのラウンドトリッププロトコルの下でブラックボックスイメージジェネレータとして評価する。
この設計は、視覚的類似性のみでなく、構造的復元性による評価を強制し、計画、知覚、構造的推論を協調する階層的マルチエージェントシステムによって実現される。
実験により、構造的正当性を維持することは、特に複雑なトポロジーを持つ図にとって、構造的評価の必要性を裏付ける基本的な課題であることが示された。
関連論文リスト
- Few-Shot Learning of a Graph-Based Neural Network Model Without Backpropagation [0.0]
バックプロパゲーションを使わずに数発の撮影方式で輪郭画像を分類する構造グラフ手法を提案する。
画像は属性付きグラフ(幾何学的属性を持つノードとして表される臨界点と線)として符号化され、概念的誘引子の形成によって一般化される。
論文 参考訳(メタデータ) (2025-12-20T16:23:51Z) - Hierarchical Process Reward Models are Symbolic Vision Learners [56.94353087007494]
記号型コンピュータビジョンは、明示的な論理規則と構造化された表現を通して図を表現し、機械ビジョンの解釈可能な理解を可能にする。
これは、ピクセルベースのビジュアルモデルと根本的に異なる学習パラダイムを必要とする。
本稿では, インプットダイアグラムをプリミティブにエンコードし, インプットダイアグラムを再構築する自己教師型オートエンコーダを提案する。
論文 参考訳(メタデータ) (2025-12-02T18:46:40Z) - Learning Structured Representations with Hyperbolic Embeddings [22.95613852886361]
ラベル階層を学習表現に正確に埋め込むハイパーボリック構造正規化手法HypStructureを提案する。
いくつかの大規模ビジョンベンチマークの実験では、歪みを低減するためのHypStructureの有効性が示されている。
構造化された表現をよりよく理解するために、表現幾何学と改善されたout-of-Distribution(OOD)検出性能をリンクする固有値解析を行う。
論文 参考訳(メタデータ) (2024-12-02T00:56:44Z) - Learning to Model Graph Structural Information on MLPs via Graph Structure Self-Contrasting [50.181824673039436]
本稿では,グラフ構造情報をメッセージパッシングなしで学習するグラフ構造自己コントラスト(GSSC)フレームワークを提案する。
提案するフレームワークは,構造情報を事前知識として暗黙的にのみ組み込む,MLP(Multi-Layer Perceptrons)に基づいている。
これはまず、近傍の潜在的非形式的あるいはノイズの多いエッジを取り除くために構造的スペーシングを適用し、その後、スペーシングされた近傍で構造的自己コントラストを行い、ロバストなノード表現を学ぶ。
論文 参考訳(メタデータ) (2024-09-09T12:56:02Z) - An Efficient Loop and Clique Coarsening Algorithm for Graph Classification [14.602474387096244]
本稿では,GTアーキテクチャ上でのグラフ分類(LCC4GC)の線形複雑度を考慮した効率的なループおよび斜め粗大化アルゴリズムを提案する。
具体的には、完全な構造表現を学ぶために、オリジナル、粗い、変換の3つのユニークなビューを構築します。
8つの実世界のデータセットの実験では、さまざまなアーキテクチャから31のベースラインを越えるLCC4GCの改善が示されている。
論文 参考訳(メタデータ) (2024-04-18T03:03:37Z) - Bayesian Unsupervised Disentanglement of Anatomy and Geometry for Deep Groupwise Image Registration [59.062085785106234]
本稿では,マルチモーダル群画像登録のための一般ベイズ学習フレームワークを提案する。
本稿では,潜在変数の推論手順を実現するために,新しい階層的変分自動符号化アーキテクチャを提案する。
心臓、脳、腹部の医療画像から4つの異なるデータセットを含む,提案された枠組みを検証する実験を行った。
論文 参考訳(メタデータ) (2024-01-04T08:46:39Z) - TranSG: Transformer-Based Skeleton Graph Prototype Contrastive Learning
with Structure-Trajectory Prompted Reconstruction for Person
Re-Identification [63.903237777588316]
3Dスケルトンデータによる人物再識別(re-ID)は、顕著な優位性を持つ新興トピックである。
既存の方法は通常、生の関節を持つ骨格記述子を設計するか、あるいは骨格配列表現学習を行う。
本稿では,構造軌道を誘導する再構成によるコントラスト学習(TranSG)手法を提案する。
論文 参考訳(メタデータ) (2023-03-13T02:27:45Z) - GraphiT: Encoding Graph Structure in Transformers [37.33808493548781]
古典的グラフニューラルネットワーク(GNN)を用いて学習した表現を,ノードの特徴と構造的および位置的情報の集合として見ることにより,より優れた表現を実現できることを示す。
我々のモデルであるGraphiTは,グラフ上の正定値カーネルに基づく自己注意スコアにおける相対的な位置符号化戦略と,短距離パスなどの局所的なサブ構造を列挙して符号化することで,そのような情報を符号化する。
論文 参考訳(メタデータ) (2021-06-10T11:36:22Z) - Self-Learning with Rectification Strategy for Human Parsing [73.06197841003048]
擬似ラベルの2つの典型的な誤りを補正する訓練可能なグラフ推論法を提案する。
再構成された特徴は、人体のトポロジー構造を表現する能力が強い。
本手法は、教師付き人間の解析作業において、他の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2020-04-17T03:51:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。