論文の概要: Visual Graph Scaffolds for Structural Reasoning in Large Language Models
- arxiv url: http://arxiv.org/abs/2606.02673v1
- Date: Mon, 01 Jun 2026 12:17:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-03 22:00:04.508815
- Title: Visual Graph Scaffolds for Structural Reasoning in Large Language Models
- Title(参考訳): 大規模言語モデルにおける構造推論のためのビジュアルグラフスカッホールド
- Authors: Runlin Lei, Xiaokui Xiao, Zhewei Wei,
- Abstract要約: グラフは、大きな言語モデル(LLM)を強化するために使われてきた。
本稿では, LLM のグラフの値は情報提供だけでなく, 組織的推論にも当てはまる。
人間はグラフ構造化マインドマップを使って、枝分かれや収束する思考を整理し、グラフが推論支援の内的形態として機能するかどうかを問う。
- 参考スコア(独自算出の注目度): 49.507575509154385
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Graphs have been used to enhance large language models (LLMs) for structured reasoning, mostly as external knowledge sources are provided to models at test time. In this paper, we take a different view: the value of graphs for LLMs lie not only in supplying information, but also in organizing reasoning. Inspired by how humans use graph-structured mind maps to organize branching and converging thoughts, we ask whether graphs can serve as an internal form of reasoning assistance. We study this question on multi-hop question answering tasks, where teacher-provided reasoning traces are rewritten as graph mind maps and used to guide a student model. Our experiments reveal a clear modality gap. When graph structures are flattened into text, their benefits become limited once direct answer hints are removed. Under this abstract guidance setting, both reasoning efficiency and answer quality degrade substantially. In contrast, visual graph guidance remains effective without direct answer clues, and its advantage persists after supervised fine-tuning and KL-based distillation. The above findings support the claim that graphs should be studied not only as external knowledge structures for LLMs, but also as visual scaffolds for organizing reasoning.
- Abstract(参考訳): グラフは構造化推論のための大きな言語モデル(LLM)を強化するために使われてきた。
本稿では, LLM のグラフの値は情報提供だけでなく, 組織的推論にも当てはまる。
人間はグラフ構造化マインドマップを使って、枝分かれや収束する思考を整理し、グラフが推論支援の内的形態として機能するかどうかを問う。
本研究では,教師が提供する推論トレースをグラフマインドマップとして書き直し,学生モデル案内に用いるマルチホップ質問応答タスクについて検討する。
私たちの実験は明らかなモダリティギャップを明らかにします。
グラフ構造がテキストにフラット化されると、直接回答ヒントが取り除かれると、そのメリットは制限される。
この抽象的なガイダンス設定の下では、推論効率と回答品質の両方が大幅に低下する。
対照的に、視覚グラフ誘導は直接答えの手がかりなしに有効であり、その優位性は教師付き微調整とKLベースの蒸留によって持続する。
以上の結果は、グラフはLLMの外部知識構造としてだけでなく、推論を整理するための視覚的な足場として研究されるべきである、という主張を支持している。
関連論文リスト
- Position: How can Graphs Help Large Language Models? [61.53121236127126]
大規模言語モデル(LLM)はグラフ学習のタスクから大きな恩恵を受けている。
本稿では,グラフがLLMにどのように役立つのか,という補完的な質問を行う。
1) グラフは幻覚の低減に役立つ最新の知識源を提供し,2) グラフベースの促進技術であるChain-of-Thought (CoT), Tree-of-Thought (ToT), Graph-of-Thought (GoT)-enhance LLM推論機能,3) グラフをLLMに統合することで構造化データの理解が向上する。
論文 参考訳(メタデータ) (2026-05-04T10:56:05Z) - Revisiting the Graph Reasoning Ability of Large Language Models: Case Studies in Translation, Connectivity and Shortest Path [53.71787069694794]
大規模言語モデル(LLM)のグラフ推論能力に着目する。
グラフ記述変換,グラフ接続,最短パス問題という3つの基本グラフタスクにおけるLLMの能力を再考する。
この結果から,LLMはテキスト記述によるグラフ構造理解に失敗し,これらの基本課題に対して様々な性能を示すことが可能であることが示唆された。
論文 参考訳(メタデータ) (2024-08-18T16:26:39Z) - GITA: Graph to Visual and Textual Integration for Vision-Language Graph Reasoning [30.23658922980425]
我々は、$textbfG$raph to v$textbfI$sual and $textbfT$extual Integr$textbfA$tion (GITA)というエンドツーエンドフレームワークを提案する。
GITAはまず、ビジュアルグラフを一般的なグラフ推論に組み込む。
GVLQAデータセットと5つの実世界のデータセットの実験は、GITAが一般的なグラフ推論能力において、メインストリームのLLMよりも優れていることを示している。
論文 参考訳(メタデータ) (2024-02-03T12:19:47Z) - ExplaGraphs: An Explanation Graph Generation Task for Structured
Commonsense Reasoning [65.15423587105472]
スタンス予測のための説明グラフ生成の新しい生成および構造化コモンセンスリゾニングタスク(および関連するデータセット)を紹介します。
具体的には、信念と議論が与えられた場合、モデルは、議論が信念を支持しているかどうかを予測し、予測されたスタンスに対する非自明で完全で曖昧な説明として機能する常識強化グラフを生成する必要がある。
グラフの83%は、様々な構造と推論深度を持つ外部のコモンセンスノードを含んでいる。
論文 参考訳(メタデータ) (2021-04-15T17:51:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。