Fugu-MT 論文翻訳(概要): Can LLM Graph Reasoning Generalize beyond Pattern Memorization?

論文の概要: Can LLM Graph Reasoning Generalize beyond Pattern Memorization?

arxiv url: http://arxiv.org/abs/2406.15992v1
Date: Sun, 23 Jun 2024 02:59:15 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-25 19:33:31.743438
Title: Can LLM Graph Reasoning Generalize beyond Pattern Memorization?
Title（参考訳）: LLMグラフ推論はパターン記憶を超えて一般化できるか?
Authors: Yizhuo Zhang, Heng Wang, Shangbin Feng, Zhaoxuan Tan, Xiaochuang Han, Tianxing He, Yulia Tsvetkov,
Abstract要約: 我々は,大規模言語モデル (LLM) が,合成学習データにおける意味的,数値的,構造的,推論パターンを超えうるか否かを評価し,実世界のグラフベースタスクにおける有用性を向上させる。トレーニング後のアライメントが現実世界のタスクに最も有望であるのに対して、LLMグラフの推論をパターンを超えて行うことは、依然としてオープンな研究課題である。
参考スコア（独自算出の注目度）: 46.93972334344908
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large language models (LLMs) demonstrate great potential for problems with implicit graphical structures, while recent works seek to enhance the graph reasoning capabilities of LLMs through specialized instruction tuning. The resulting 'graph LLMs' are evaluated with in-distribution settings only, thus it remains underexplored whether LLMs are learning generalizable graph reasoning skills or merely memorizing patterns in the synthetic training data. To this end, we propose the NLGift benchmark, an evaluation suite of LLM graph reasoning generalization: whether LLMs could go beyond semantic, numeric, structural, reasoning patterns in the synthetic training data and improve utility on real-world graph-based tasks. Extensive experiments with two LLMs across four graph reasoning tasks demonstrate that while generalization on simple patterns (semantic, numeric) is somewhat satisfactory, LLMs struggle to generalize across reasoning and real-world patterns, casting doubt on the benefit of synthetic graph tuning for real-world tasks with underlying network structures. We explore three strategies to improve LLM graph reasoning generalization, and we find that while post-training alignment is most promising for real-world tasks, empowering LLM graph reasoning to go beyond pattern memorization remains an open research question.
Abstract（参考訳）: 大規模言語モデル (LLM) は暗黙的なグラフィカル構造の問題に対して大きな可能性を秘めている一方、最近の研究は特殊命令チューニングによる LLM のグラフ推論能力の向上を目指している。結果として得られる「グラフLLM」は、分布内設定でのみ評価されるため、LLMが一般化可能なグラフ推論スキルを学習しているか、あるいは単に合成トレーニングデータにおけるパターンを記憶しているかは未定である。そこで本研究では, LLM が合成学習データにおける意味的, 数値的, 構造的, 推論パターンを超越し, 実世界のグラフベースタスクにおける有用性を向上させることができるか, 一般化した LLM グラフ推論の評価スイートである NLGift ベンチマークを提案する。 4つのグラフ推論タスクにまたがる2つのLLMの広範な実験により、単純なパターン(意味的、数値的)の一般化は幾らか満足できるが、LLMは推論と実世界のパターンの一般化に苦慮し、基礎となるネットワーク構造を持つ実世界のタスクに対する合成グラフチューニングの利点に疑問を呈している。我々は,LLMグラフ推論の一般化を改善するための3つの戦略を探究し,学習後のアライメントが実世界のタスクに最も有望であるのに対して,LLMグラフ推論がパターン記憶を超えて行うことが,オープンな研究課題であることを確認した。

関連論文リスト

Generalizable LLM Learning of Graph Synthetic Data with Reinforcement Learning [38.485929062532925]
本稿では、グラフ合成データの一般化可能な学習を強化学習で解き放つことを提案する。まず、合成グラフ問題に対するソリューションベースおよびプロセスベース報酬を設計する。実験により、我々のRLレシピは5つのデータセットに対して統計的に有意な改善をもたらすことが示された。
論文参考訳（メタデータ） (2025-06-01T05:39:56Z)
GraphICL: Unlocking Graph Learning Potential in LLMs through Structured Prompt Design [13.365623514253926]
Graph In-Context Learning (GraphICL)ベンチマークは、グラフ構造をキャプチャし、限られたラベル知識を扱う新しいプロンプトテンプレートからなる包括的なベンチマークである。システム評価の結果,GraphICLを用いた汎用LLMは,最先端の特殊グラフLLMやグラフニューラルネットワークモデルよりも優れていた。
論文参考訳（メタデータ） (2025-01-27T03:50:30Z)
What Do LLMs Need to Understand Graphs: A Survey of Parametric Representation of Graphs [69.48708136448694]
大規模言語モデル(LLM)は、期待される推論能力と推論能力のために、AIコミュニティで再編成されている。我々は、グラフのこのようなパラメトリック表現、グラフ法則は、LLMがグラフデータを入力として理解させるソリューションであると信じている。
論文参考訳（メタデータ） (2024-10-16T00:01:31Z)
How Do Large Language Models Understand Graph Patterns? A Benchmark for Graph Pattern Comprehension [53.6373473053431]
この研究は、グラフパターンタスクにおける大規模言語モデルの能力を評価するためのベンチマークを導入する。我々は,LLMが用語的記述と位相的記述の両方に基づいて,グラフパターンを理解できるかどうかを評価するベンチマークを開発した。私たちのベンチマークでは、合成データセットと実際のデータセットの両方と、11のタスクと7のモデルで構成されています。
論文参考訳（メタデータ） (2024-10-04T04:48:33Z)
Revisiting the Graph Reasoning Ability of Large Language Models: Case Studies in Translation, Connectivity and Shortest Path [53.71787069694794]
大規模言語モデル(LLM)のグラフ推論能力に着目する。グラフ記述変換,グラフ接続,最短パス問題という3つの基本グラフタスクにおけるLLMの能力を再考する。この結果から,LLMはテキスト記述によるグラフ構造理解に失敗し,これらの基本課題に対して様々な性能を示すことが可能であることが示唆された。
論文参考訳（メタデータ） (2024-08-18T16:26:39Z)
Investigating Instruction Tuning Large Language Models on Graphs [37.20541711360419]
グラフ関連のタスクにLLM(Large Language Models)を適用することへの関心が高まっている。本研究は,実世界のグラフに係わる命令追従型LLMの能力について考察する。
論文参考訳（メタデータ） (2024-08-10T06:54:35Z)
LinkGPT: Teaching Large Language Models To Predict Missing Links [23.57145845001286]
大規模言語モデル(LLM)は、様々な言語やビジョンタスクにおいて有望な結果を示している。近年、グラフベースのタスク、特にテキスト分散グラフ(TAG)にLLMを適用することへの関心が高まっている。
論文参考訳（メタデータ） (2024-06-07T04:54:36Z)
A Survey of Large Language Models on Generative Graph Analytics: Query, Learning, and Applications [4.777453721753589]
大規模言語モデル(LLM)は、様々なNLPおよびマルチモードタスクを扱う強力な一般化能力を示した。グラフ学習モデルと比較して、LLMはグラフタスクの一般化の課題に対処する上で、優れたアドバンテージを持っている。 LLM-based generative graph analysis (LLM-GGA) の重要な問題点を3つのカテゴリで検討した。
論文参考訳（メタデータ） (2024-04-23T07:39:24Z)
Exploring the Potential of Large Language Models in Graph Generation [51.046188600990014]
グラフ生成は、与えられたプロパティを持つグラフを生成するために、大きな言語モデル(LLM)を必要とする。本稿では,LLMのグラフ生成能力について,系統的なタスク設計と実験による検討を行う。評価の結果,LLM,特にGPT-4は,グラフ生成タスクに予備的能力を示すことがわかった。
論文参考訳（メタデータ） (2024-03-21T12:37:54Z)
Can Graph Descriptive Order Affect Solving Graph Problems with LLMs? [55.5662721046769]
大規模言語モデル(LLM)は、数学的推論や論理的推論を含む推論タスクにおいて大きな成功を収めた。従来の研究は様々な手法を用いてLSMのグラフ推論能力について研究してきた。重要な要素は、主に見過ごされ、グラフ記述がモデルに提示される即時順序である。
論文参考訳（メタデータ） (2024-02-11T09:46:24Z)
Integrating Graphs with Large Language Models: Methods and Prospects [68.37584693537555]
大規模言語モデル (LLMs) が最前線として登場し、様々なアプリケーションにおいて非並列の長所を示している。 LLMとグラフ構造化データを組み合わせることは、非常に興味深いトピックです。本稿では、そのような統合を2つの主要なカテゴリに分岐する。
論文参考訳（メタデータ） (2023-10-09T07:59:34Z)
Beyond Text: A Deep Dive into Large Language Models' Ability on Understanding Graph Data [13.524529952170672]
大規模言語モデル(LLM)は多くの自然言語処理タスクにおいて顕著な性能を達成している。 LLMがグラフデータを効果的に処理し、トポロジ構造を利用して性能を向上させることができるかどうかを評価することを目的とする。 LLMの性能を特殊グラフモデルと比較することにより、グラフ解析にLLMを使用する際の長所と短所について考察する。
論文参考訳（メタデータ） (2023-10-07T23:25:22Z)
Exploring the Potential of Large Language Models (LLMs) in Learning on Graphs [59.74814230246034]
大規模言語モデル(LLM)は、広範な共通知識と強力な意味理解能力を持つことが証明されている。 LLMs-as-EnhancersとLLMs-as-Predictorsの2つのパイプラインについて検討する。
論文参考訳（メタデータ） (2023-07-07T05:31:31Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。