論文の概要: Follow the Flow: Fine-grained Flowchart Attribution with Neurosymbolic Agents
- arxiv url: http://arxiv.org/abs/2506.01344v1
- Date: Mon, 02 Jun 2025 06:02:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-05 04:22:50.725458
- Title: Follow the Flow: Fine-grained Flowchart Attribution with Neurosymbolic Agents
- Title(参考訳): フローのフォロー:ニューロシンボリック剤による微粒フローチャートの寄与
- Authors: Manan Suri, Puneet Mathur, Nedim Lipka, Franck Dernoncourt, Ryan A. Rossi, Vivek Gupta, Dinesh Manocha,
- Abstract要約: フローチャートは意思決定プロセスを視覚化するための重要なツールです。
視覚言語モデルは、これらの図を分析する際に、存在しない接続や決定経路を幻覚させる。
LLM応答を参照してフローチャートを接地する特定の成分をトレースするフローチャートについて紹介する。
本稿では, グラフベースの推論により微細なホック帰属を行うニューロシンボリック・エージェントであるFlowPathAgentを提案する。
- 参考スコア(独自算出の注目度): 106.04963073116468
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Flowcharts are a critical tool for visualizing decision-making processes. However, their non-linear structure and complex visual-textual relationships make it challenging to interpret them using LLMs, as vision-language models frequently hallucinate nonexistent connections and decision paths when analyzing these diagrams. This leads to compromised reliability for automated flowchart processing in critical domains such as logistics, health, and engineering. We introduce the task of Fine-grained Flowchart Attribution, which traces specific components grounding a flowchart referring LLM response. Flowchart Attribution ensures the verifiability of LLM predictions and improves explainability by linking generated responses to the flowchart's structure. We propose FlowPathAgent, a neurosymbolic agent that performs fine-grained post hoc attribution through graph-based reasoning. It first segments the flowchart, then converts it into a structured symbolic graph, and then employs an agentic approach to dynamically interact with the graph, to generate attribution paths. Additionally, we present FlowExplainBench, a novel benchmark for evaluating flowchart attributions across diverse styles, domains, and question types. Experimental results show that FlowPathAgent mitigates visual hallucinations in LLM answers over flowchart QA, outperforming strong baselines by 10-14% on our proposed FlowExplainBench dataset.
- Abstract(参考訳): フローチャートは意思決定プロセスを視覚化するための重要なツールです。
しかし、それらの非線形構造と複雑な視覚・テクスチャ関係は、視覚言語モデルがこれらの図を解析する際に、しばしば存在しない接続や決定経路を幻覚させるため、LLMを用いてそれらを解釈することは困難である。
これにより、ロジスティクス、ヘルス、エンジニアリングといった重要な領域における自動フローチャート処理の信頼性が損なわれる。
LLM応答を参照してフローチャートを接地する特定の成分をトレースするフローチャート属性の微粒化タスクを導入する。
Flowchart AttributionはLLM予測の妥当性を保証し、生成された応答をFlowchartの構造にリンクすることで説明性を向上させる。
本稿では, グラフベースの推論により微細なホックの帰属を行うニューロシンボリック・エージェントであるFlowPathAgentを提案する。
まずフローチャートを分割し、次に構造化されたシンボルグラフに変換し、それからエージェントアプローチを用いてグラフと動的に相互作用し、帰属経路を生成する。
さらに、さまざまなスタイル、ドメイン、質問タイプにわたるフローチャート属性を評価するための新しいベンチマークであるFlowExplainBenchも紹介する。
実験結果から,FlowPathAgentはフローチャートQAに対するLLM回答の視覚幻覚を緩和し,提案したFlowExplainBenchデータセットにおいて,強いベースラインを10-14%上回った。
関連論文リスト
- Socratic Chart: Cooperating Multiple Agents for Robust SVG Chart Understanding [14.75820681491341]
既存のベンチマークでは、真の視覚的推論ではなく、テキストベースのショートカットと確率的パターンマッチングに依存している。
グラフ画像をスケーラブルベクトルグラフ表現に変換する新しいフレームワークであるSocratic Chartを提案する。
我々のフレームワークは、グラフプリミティブを正確にキャプチャし、推論性能を向上させるために最先端モデルを上回る。
論文 参考訳(メタデータ) (2025-04-14T00:07:39Z) - ChartCitor: Multi-Agent Framework for Fine-Grained Chart Visual Attribution [47.79080056618323]
グラフ画像内の支持証拠を識別し,きめ細かなバウンディングボックスの引用を提供するマルチエージェントフレームワークであるChartCitorを提案する。
このシステムは、LCMエージェントを編成して、チャートからテーブルへの抽出、回答の修正、テーブル拡張、事前フィルタリングと再ランク付けによるエビデンス検索、テーブルからチャートへのマッピングを行う。
論文 参考訳(メタデータ) (2025-02-03T02:00:51Z) - Graph-Based Multimodal Contrastive Learning for Chart Question Answering [11.828192162922436]
この研究は、チャートコンポーネントとその基盤構造間の関係を明示的にモデル化する、新しいマルチモーダルシーングラフフレームワークを導入している。
このフレームワークは、視覚グラフとテキストグラフの両方を統合し、構造的特徴と意味的特徴をキャプチャする。
グラフの対照的な学習戦略は、トランスフォーマーデコーダをソフトプロンプトとしてシームレスに組み込むことができるように、モジュール間のノード表現を整列させる。
論文 参考訳(メタデータ) (2025-01-08T06:27:07Z) - Benchmarking Agentic Workflow Generation [80.74757493266057]
複数面シナリオと複雑なグラフワークフロー構造を備えた統合ワークフロー生成ベンチマークであるWorfBenchを紹介する。
また,サブシーケンスとサブグラフマッチングアルゴリズムを利用したシステム評価プロトコルWorfEvalを提案する。
我々は、生成されたタスクが下流のタスクを強化し、推論中により少ない時間で優れたパフォーマンスを達成することを観察する。
論文 参考訳(メタデータ) (2024-10-10T12:41:19Z) - FlowLearn: Evaluating Large Vision-Language Models on Flowchart Understanding [52.35520385083425]
FlowLearnデータセットは、フローチャートの理解を強化するために設計されたリソースである。
科学的サブセットは、科学文献から得られた3,858のフローチャートを含んでいる。
シミュレーションされたサブセットには、カスタマイズ可能なスクリプトを使用して作成された10,000のフローチャートが含まれている。
論文 参考訳(メタデータ) (2024-07-06T20:58:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。