Fugu-MT 論文翻訳(概要): Which Modality should I use -- Text, Motif, or Image? : Understanding Graphs with Large Language Models

論文の概要: Which Modality should I use -- Text, Motif, or Image? : Understanding Graphs with Large Language Models

arxiv url: http://arxiv.org/abs/2311.09862v1
Date: Thu, 16 Nov 2023 12:45:41 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-17 14:04:39.806262
Title: Which Modality should I use -- Text, Motif, or Image? : Understanding Graphs with Large Language Models
Title（参考訳）: テキスト、モチーフ、イメージなど、どのモードを使うべきか? 大規模言語モデルによるグラフ理解
Authors: Debarati Das, Ishaan Gupta, Jaideep Srivastava, Dongyeop Kang
Abstract要約: 大規模言語モデル(LLM)は、コンテキスト認識インテリジェンスに大規模なテキストコーパスを活用することで、様々な分野に革命をもたらしている。文脈サイズのため、LLMでグラフ全体を符号化することは基本的に制限される。本稿では,LLMとグラフデータをよりよく統合する方法を考察し,様々な符号化手法を用いた新しい手法を提案する。
参考スコア（独自算出の注目度）: 15.569255799563782
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large language models (LLMs) are revolutionizing various fields by leveraging large text corpora for context-aware intelligence. Due to the context size, however, encoding an entire graph with LLMs is fundamentally limited. This paper explores how to better integrate graph data with LLMs and presents a novel approach using various encoding modalities (e.g., text, image, and motif) and approximation of global connectivity of a graph using different prompting methods to enhance LLMs' effectiveness in handling complex graph structures. The study also introduces GraphTMI, a new benchmark for evaluating LLMs in graph structure analysis, focusing on factors such as homophily, motif presence, and graph difficulty. Key findings reveal that image modality, supported by advanced vision-language models like GPT-4V, is more effective than text in managing token limits while retaining critical information. The research also examines the influence of different factors on each encoding modality's performance. This study highlights the current limitations and charts future directions for LLMs in graph understanding and reasoning tasks.
Abstract（参考訳）: 大規模言語モデル(LLM)は、コンテキスト認識インテリジェンスに大規模なテキストコーパスを活用することで、様々な分野に革命をもたらしている。しかし、文脈サイズのため、LLMでグラフ全体を符号化することは基本的に制限される。本稿では,LLM とグラフデータをよりよく統合する方法を考察し,複雑なグラフ構造を扱う上で LLM の有効性を高めるために,様々な符号化法(テキスト,画像,モチーフ)を用いてグラフのグローバル接続を近似する手法を提案する。また、グラフ構造解析においてLLMを評価するための新しいベンチマークであるGraphTMIも導入され、ホモフィリー、モチーフ存在、グラフの難しさなどの要因に焦点を当てている。 GPT-4Vのような高度な視覚言語モデルでサポートされている画像のモダリティは、重要な情報を保持しながらトークン制限を管理する上で、テキストよりも効果的である。また,各符号化性能に及ぼす異なる因子の影響についても検討した。本研究は、グラフ理解および推論タスクにおけるLLMの現在の限界と今後の方向性を示す。

関連論文リスト

DGP: A Dual-Granularity Prompting Framework for Fraud Detection with Graph-Enhanced LLMs [55.13817504780764]
実世界の不正検出アプリケーションは、しばしばテキストデータに富んだノード特徴とグラフ構造情報を共同で活用するグラフ学習技術の恩恵を受ける。グラフ強化LSMは、グラフ情報をプロンプトに変換する、有望なグラフ学習アプローチとして登場します。目的ノードの細粒度テキストの詳細を保存し,情報過負荷を軽減するDGPを提案する。
論文参考訳（メタデータ） (2025-07-29T10:10:47Z)
LLM as GNN: Graph Vocabulary Learning for Text-Attributed Graph Foundation Models [54.82915844507371]
Text-Attributed Graphs (TAG) は、現実のシナリオにおいてユビキタスである。大規模言語モデル(LLMs)とグラフニューラルネットワーク(GNNs)をTAGsに統合する努力にもかかわらず、既存のアプローチは分離されたアーキテクチャに悩まされている。本稿では,グラフ語彙学習に基づくTAGのための汎用GFMであるPromptGFMを提案する。
論文参考訳（メタデータ） (2025-03-05T09:45:22Z)
Graph Learning in the Era of LLMs: A Survey from the Perspective of Data, Models, and Tasks [25.720233631885726]
グラフニューラルネットワーク(GNN)とLarge Language Models(LLM)の統合は、有望な技術パラダイムとして現れている。データ品質を根本的に向上させるために、リッチなセマンティックコンテキストを持つグラフ記述テキストを活用します。この研究は、グラフ学習方法論の進歩を目指す研究者や実践者にとって、基礎的な参考となる。
論文参考訳（メタデータ） (2024-12-17T01:41:17Z)
NT-LLM: A Novel Node Tokenizer for Integrating Graph Structure into Large Language Models [26.739650151993928]
グラフは、現実世界のシナリオにおける関係を表現するための基本的なデータ構造である。グラフ関連のタスクにLLM(Large Language Models)を適用することは、大きな課題となる。我々は,グラフ構造を効率的にエンコードする新しいフレームワークNT-LLM(Node Tokenizer for Large Language Models)を紹介する。
論文参考訳（メタデータ） (2024-10-14T17:21:57Z)
How Do Large Language Models Understand Graph Patterns? A Benchmark for Graph Pattern Comprehension [53.6373473053431]
この研究は、グラフパターンタスクにおける大規模言語モデルの能力を評価するためのベンチマークを導入する。我々は,LLMが用語的記述と位相的記述の両方に基づいて,グラフパターンを理解できるかどうかを評価するベンチマークを開発した。私たちのベンチマークでは、合成データセットと実際のデータセットの両方と、11のタスクと7のモデルで構成されています。
論文参考訳（メタデータ） (2024-10-04T04:48:33Z)
Exploring Graph Structure Comprehension Ability of Multimodal Large Language Models: Case Studies [7.067145619709089]
本研究では,グラフの可視化が大規模言語モデル(LLM)の性能に与える影響について検討する。本実験は,純粋テキストグラフ表現に対するマルチモーダルアプローチの有効性を比較した。
論文参考訳（メタデータ） (2024-09-13T14:26:58Z)
Bridging Local Details and Global Context in Text-Attributed Graphs [62.522550655068336]
GraphBridgeは、コンテキストテキスト情報を活用することで、ローカルおよびグローバルな視点をブリッジするフレームワークである。提案手法は最先端性能を実現し,グラフ対応トークン削減モジュールは効率を大幅に向上し,スケーラビリティの問題を解消する。
論文参考訳（メタデータ） (2024-06-18T13:35:25Z)
Hierarchical Compression of Text-Rich Graphs via Large Language Models [63.75293588479027]
テキストリッチグラフは、eコマースや学術グラフのようなデータマイニングの文脈で広く使われている。本稿では,LLMの能力とテキストリッチグラフの構造を整合させる新しい手法であるHiComを紹介する。 HiComは、Eコマースと引用グラフのノード分類において、GNNとLLMのバックボーンよりも優れている。
論文参考訳（メタデータ） (2024-06-13T07:24:46Z)
Parameter-Efficient Tuning Large Language Models for Graph Representation Learning [62.26278815157628]
Graph-awareを導入します。 GPEFT - グラフ表現学習のための新しい手法。グラフニューラルネットワーク(GNN)を用いて、隣接するノードからグラフプロンプトに構造情報をエンコードする。我々は8つの異なるテキストリッチグラフで実施した総合的な実験を通じて,リンク予測評価において hit@1 と Mean Reciprocal Rank (MRR) の平均 2% の改善を観察し,本手法の有効性を検証した。
論文参考訳（メタデータ） (2024-04-28T18:36:59Z)
When Graph Data Meets Multimodal: A New Paradigm for Graph Understanding and Reasoning [54.84870836443311]
本稿では,画像エンコーディングとマルチモーダル技術を統合することで,グラフデータの理解と推論を行う新しいパラダイムを提案する。このアプローチは, GPT-4Vの高度な機能を利用して, 命令応答形式によるグラフデータの理解を可能にする。研究は、このパラダイムを様々なグラフタイプで評価し、特に中国のOCRパフォーマンスと複雑な推論タスクにおいて、モデルの強みと弱みを強調した。
論文参考訳（メタデータ） (2023-12-16T08:14:11Z)
Large Language Models on Graphs: A Comprehensive Survey [77.16803297418201]
グラフ上の大規模言語モデルに関連するシナリオとテクニックを体系的にレビューする。まず,LLMをグラフに適用する可能性シナリオを,純グラフ,テキスト分散グラフ,テキストペアグラフの3つのカテゴリにまとめる。本稿では,そのような手法の現実的な応用について論じ,オープンソースコードとベンチマークデータセットを要約する。
論文参考訳（メタデータ） (2023-12-05T14:14:27Z)
Talk like a Graph: Encoding Graphs for Large Language Models [15.652881653332194]
大規模言語モデル(LLM)による消費用テキストとしてグラフ構造化データを符号化する最初の包括的研究について検討する。グラフ解析におけるLCMの性能は,(1)グラフ符号化法,(2)グラフ処理自体の性質,(3)興味深いことに,考慮されたグラフの構造の3つの基本レベルによって異なることを示す。
論文参考訳（メタデータ） (2023-10-06T19:55:21Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。