論文の概要: PlanarBench: Evaluating LLM Spatial Reasoning via Planar Graph Drawing
- arxiv url: http://arxiv.org/abs/2606.02010v1
- Date: Mon, 01 Jun 2026 10:04:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:31.780429
- Title: PlanarBench: Evaluating LLM Spatial Reasoning via Planar Graph Drawing
- Title(参考訳): PlanarBench: 平面グラフ描画によるLLM空間推論の評価
- Authors: Oleksandr Nikitin,
- Abstract要約: PlanarBenchは、LLMがエッジリストのみを与えられたASCIIアートとして平面グラフを描画できるかどうかをテストする。
我々は、最も単純な199個の非同型連結平面グラフ上で91個のモデルを評価する。
- 参考スコア(独自算出の注目度): 16.99229148501035
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: PlanarBench tests whether LLMs can draw planar graphs as ASCII art given only an edge list -- a spatial reasoning task that resists memorization because edge order, edge orientation, and node labels are all permutable. We evaluate 91 models on the 199 simplest non-isomorphic connected planar graphs (2 - 7 vertices). Edge count is the dominant difficulty predictor ($r = -0.85$) -- a finding not reported in prior LLM graph benchmarks, which use only node count as the difficulty axis.
- Abstract(参考訳): PlanarBench氏は、LLMがエッジリストのみを与えられたASCIIアートとして平面グラフを描画できるかどうかをテストしている。
199 の単純非同型連結平面グラフ (2 から 7 の頂点) 上で91 のモデルを評価する。
エッジカウントは (r = -0.85$) -- 従来のLCMグラフベンチマークでは報告されていないが、困難軸としてノードカウントのみを使用する。
関連論文リスト
- GraphTOP: Graph Topology-Oriented Prompting for Graph Neural Networks [66.07512871031163]
ラベルなしグラフデータよりも強力なグラフニューラルネットワーク(GNN)を事前学習する。
適応段階では、グラフプロンプトは学習可能なプロンプトで入力グラフデータを修正し、事前学習されたGNNモデルを凍結し続ける。
本稿では,事前学習したGNNモデルを下流タスクに効果的に適用するために,最初の**Graph****opology-**O**riented **P**rompting(GraphTOP)フレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-25T22:50:12Z) - Rethinking and Benchmarking Large Language Models for Graph Reasoning [36.30471027175558]
グラフ推論のための大規模言語モデル(LLM)は、過去2年間にわたって広く研究されてきた。
近年の研究では、LLMがグラフ推論タスクを扱う可能性を示しているが、その性能は過大評価されている。
論文 参考訳(メタデータ) (2025-09-29T04:10:12Z) - Plan-over-Graph: Towards Parallelable LLM Agent Schedule [53.834646147919436]
大規模言語モデル(LLM)はタスク計画の推論において例外的な能力を示した。
本稿では,まず実生活のテキストタスクを実行可能なサブタスクに分解し,抽象的なタスクグラフを構築する,新しいパラダイムであるプランオーバーグラフを提案する。
モデルはこのタスクグラフを入力として理解し、並列実行計画を生成する。
論文 参考訳(メタデータ) (2025-02-20T13:47:51Z) - GraphSOS: Graph Sampling and Order Selection to Help LLMs Understand Graphs Better [13.742220809751627]
GraphSOSは、グラフデータを自然言語テキストに変換する新しいフレームワークである。
Order Selector Moduleはグラフの適切なシリアライズ順序を保証するもので、Subgraph Smpling Moduleはより良い推論のためにより良い構造を持つサブグラフをサンプリングする。
ノード分類とグラフ問合せのための複数のデータセットの実験は、GraphSOSがグラフタスクにおけるLLMのパフォーマンスと能力を改善することを示した。
論文 参考訳(メタデータ) (2025-01-24T11:55:57Z) - What Do LLMs Need to Understand Graphs: A Survey of Parametric Representation of Graphs [69.48708136448694]
大規模言語モデル(LLM)は、期待される推論能力と推論能力のために、AIコミュニティで再編成されている。
我々は、グラフのこのようなパラメトリック表現、グラフ法則は、LLMがグラフデータを入力として理解させるソリューションであると信じている。
論文 参考訳(メタデータ) (2024-10-16T00:01:31Z) - Random Edge Coding: One-Shot Bits-Back Coding of Large Labeled Graphs [24.761152163389735]
ランダムエッジ符号化(Random Edge Coding)と呼ばれる大きなラベル付きグラフを圧縮するためのワンショット方式を提案する。
実験によると、ランダムエッジ符号化は実世界のネットワークデータセット上での競合圧縮性能を実現することができる。
論文 参考訳(メタデータ) (2023-05-16T12:23:18Z) - Efficient Signed Graph Sampling via Balancing & Gershgorin Disc Perfect
Alignment [51.74913666829224]
強い反相関を持つデータセットに対して、適切なグラフは正および負のエッジ重みの両方を含むことを示す。
本稿では,平衡符号グラフの概念に着目した線形時間符号グラフサンプリング手法を提案する。
実験結果から, 署名付きグラフサンプリング手法は, 各種データセットにおいて, 既存の高速サンプリング方式よりも優れた性能を示した。
論文 参考訳(メタデータ) (2022-08-18T09:19:01Z) - DOTIN: Dropping Task-Irrelevant Nodes for GNNs [119.17997089267124]
最近のグラフ学習アプローチでは、学習のためのグラフのサイズを減らすためのプール戦略が導入されている。
我々はDOTIN(underlineDrunderlineopping underlineTask-underlineIrrelevant underlineNodes)と呼ばれる新しいアプローチを設計し、グラフのサイズを減らす。
本手法は,グラフ分類やグラフ編集距離を含むグラフレベルのタスクにおいて,GATを約50%高速化する。
論文 参考訳(メタデータ) (2022-04-28T12:00:39Z) - Unsupervised Graph Embedding via Adaptive Graph Learning [85.28555417981063]
グラフオートエンコーダ(GAE)は、グラフ埋め込みのための表現学習において強力なツールである。
本稿では,2つの新しい教師なしグラフ埋め込み法,適応グラフ学習(BAGE)による教師なしグラフ埋め込み,変分適応グラフ学習(VBAGE)による教師なしグラフ埋め込みを提案する。
いくつかのデータセットに関する実験的研究により、我々の手法がノードクラスタリング、ノード分類、グラフ可視化タスクにおいて、ベースラインよりも優れていることが実証された。
論文 参考訳(メタデータ) (2020-03-10T02:33:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。