論文の概要: FloCA: Towards Faithful and Logically Consistent Flowchart Reasoning
- arxiv url: http://arxiv.org/abs/2602.14035v1
- Date: Sun, 15 Feb 2026 07:51:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-17 14:17:28.612825
- Title: FloCA: Towards Faithful and Logically Consistent Flowchart Reasoning
- Title(参考訳): FloCA: 忠実で論理的に一貫性のあるフローチャート推論を目指して
- Authors: Jinzi Zou, Bolin Wang, Liang Li, Shuo Zhang, Nuo Xu, Junzhou Zhao,
- Abstract要約: Flowchart-oriented dialogue (FOD) システムは,マルチターン意思決定や運用手順を通じてユーザを誘導することを目的としている。
本研究では,FODにおけるフローチャート推論を,対話ターン毎のフローチャートノードへのユーザ入力の基底として定式化する。
ゼロショットフローチャート指向の対話エージェントであるFloCAを提案する。
- 参考スコア(独自算出の注目度): 21.669156992939616
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Flowchart-oriented dialogue (FOD) systems aim to guide users through multi-turn decision-making or operational procedures by following a domain-specific flowchart to achieve a task goal. In this work, we formalize flowchart reasoning in FOD as grounding user input to flowchart nodes at each dialogue turn while ensuring node transition is consistent with the correct flowchart path. Despite recent advances of LLMs in task-oriented dialogue systems, adapting them to FOD still faces two limitations: (1) LLMs lack an explicit mechanism to represent and reason over flowchart topology, and (2) they are prone to hallucinations, leading to unfaithful flowchart reasoning. To address these limitations, we propose FloCA, a zero-shot flowchart-oriented conversational agent. FloCA uses an LLM for intent understanding and response generation while delegating flowchart reasoning to an external tool that performs topology-constrained graph execution, ensuring faithful and logically consistent node transitions across dialogue turns. We further introduce an evaluation framework with an LLM-based user simulator and five new metrics covering reasoning accuracy and interaction efficiency. Extensive experiments on FLODIAL and PFDial datasets highlight the bottlenecks of existing LLM-based methods and demonstrate the superiority of FloCA. Our codes are available at https://github.com/Jinzi-Zou/FloCA-flowchart-reasoning.
- Abstract(参考訳): Flowchart-oriented dialogue (FOD) システムは,タスク目標を達成するためにドメイン固有のフローチャートに従うことで,マルチターン意思決定や運用手順を通じてユーザを誘導することを目的としている。
本研究では,FODにおけるフローチャート推論を,各対話におけるフローチャートノードに対するユーザ入力の基底として定式化し,ノード遷移が正しいフローチャートパスと整合であることを保証する。
タスク指向対話システムにおけるLLMの最近の進歩にもかかわらず、FODへの適応には、(1)フローチャートトポロジを表現するための明示的なメカニズムが欠如しており、(2)幻覚の傾向があり、不信なフローチャート推論につながる。
これらの制約に対処するため、ゼロショットフローチャート指向の対話エージェントであるFloCAを提案する。
FloCAは意図理解と応答生成にLLMを使用し、フローチャート推論をトポロジに制約されたグラフ実行を実行する外部ツールに委譲し、対話を通した忠実で論理的に一貫したノード遷移を保証する。
さらに、LCMベースのユーザシミュレータと、推論精度と相互作用効率をカバーした5つの新しい指標を用いた評価フレームワークを導入する。
FLODIAL と PFDial のデータセットに関する大規模な実験は、既存の LLM ベースの手法のボトルネックを強調し、FloCA の優位性を実証している。
私たちのコードはhttps://github.com/Jinzi-Zou/FloCA-flowchart-reasoning.comで公開されています。
関連論文リスト
- ChartPoint: Guiding MLLMs with Grounding Reflection for Chart Reasoning [54.86473583610112]
グラフの連鎖推論に反射的相互作用を統合するPointCoTを提案する。
位置アノテーションに基づいてMLLMにバウンディングボックスと再レンダリングチャートを生成することで、テキスト推論ステップと視覚的接地領域の接続を確立する。
我々は、いくつかのグラフベンチマークにおいて最先端のモデルであるChartPointQ2とChartPointQ2.5を開発した。
論文 参考訳(メタデータ) (2025-11-29T04:01:55Z) - Follow the Flow: Fine-grained Flowchart Attribution with Neurosymbolic Agents [106.04963073116468]
フローチャートは意思決定プロセスを視覚化するための重要なツールです。
視覚言語モデルは、これらの図を分析する際に、存在しない接続や決定経路を幻覚させる。
LLM応答を参照してフローチャートを接地する特定の成分をトレースするフローチャートについて紹介する。
本稿では, グラフベースの推論により微細なホック帰属を行うニューロシンボリック・エージェントであるFlowPathAgentを提案する。
論文 参考訳(メタデータ) (2025-06-02T06:02:41Z) - Performant LLM Agentic Framework for Conversational AI [1.6114012813668932]
複雑なグラフをトラバースする際に,適切なノードを選択し,順に処理を実行する際に,LLM(Large Language Models)を支援する新しいシステムであるPerformant Agentic Framework(PAF)を紹介する。
PAFはLLMベースの推論と数学的に基底化されたベクトルスコアリング機構を組み合わせることで、高い精度とレイテンシの低減を実現している。
PAFは、複雑なビジネス環境において、スケーラブルでリアルタイムな会話型AIシステムを実現する方法として、ベースラインメソッドを著しく上回ることを示した。
論文 参考訳(メタデータ) (2025-03-09T02:58:34Z) - Benchmarking Agentic Workflow Generation [80.74757493266057]
複数面シナリオと複雑なグラフワークフロー構造を備えた統合ワークフロー生成ベンチマークであるWorfBenchを紹介する。
また,サブシーケンスとサブグラフマッチングアルゴリズムを利用したシステム評価プロトコルWorfEvalを提案する。
我々は、生成されたタスクが下流のタスクを強化し、推論中により少ない時間で優れたパフォーマンスを達成することを観察する。
論文 参考訳(メタデータ) (2024-10-10T12:41:19Z) - FlowMind: Automatic Workflow Generation with LLMs [12.848562107014093]
本稿では,Large Language Models(LLM)の機能を活用した新しいアプローチであるFlowMindを紹介する。
信頼性のあるアプリケーションプログラミングインタフェース(API)を用いたLLM推論を支援する講義のための汎用的なプロンプトレシピを提案する。
また、N-CENレポートからの質問応答タスクをベンチマークするための金融の新しいデータセットであるNCEN-QAについても紹介する。
論文 参考訳(メタデータ) (2024-03-17T00:36:37Z) - Turning Flowchart into Dialog: Augmenting Flowchart-grounded
Troubleshooting Dialogs via Synthetic Data Generation [50.06143883455979]
Flowchart-grounded trouble shooting dialogue (FTD) システムは、特定のドメインにおけるユーザの問題を診断するフローチャートの指示に従う。
多様な合成ダイアログデータを大規模に生成する計画ベース合成データ生成手法を提案する。
論文 参考訳(メタデータ) (2023-05-02T11:08:27Z) - End-to-End Learning of Flowchart Grounded Task-Oriented Dialogs [23.678209058054062]
タスク指向対話(TOD)のエンドツーエンド学習における新しい問題を提案する。
このようなダイアログは、会話中にエージェントが従うべきドメイン固有のフローチャートに基礎を置いている。
12種類のトラブルシューティングフローチャートに基づいて,2,738のダイアログからなるデータセットをリリースする。
ダイアログエージェントのトレーニングに検索拡張型生成アーキテクチャを使用するニューラルモデルFloNetも設計する。
論文 参考訳(メタデータ) (2021-09-15T12:58:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。