論文の概要: HyperGVL: Benchmarking and Improving Large Vision-Language Models in Hypergraph Understanding and Reasoning
- arxiv url: http://arxiv.org/abs/2604.15648v1
- Date: Fri, 17 Apr 2026 02:46:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-20 22:00:19.715359
- Title: HyperGVL: Benchmarking and Improving Large Vision-Language Models in Hypergraph Understanding and Reasoning
- Title(参考訳): HyperGVL:ハイパーグラフ理解と推論における大規模視覚言語モデルのベンチマークと改善
- Authors: Yanbin Wei, Chun Kang, Siwei Li, Haoxuan Che, Yang Chen, Hua Liu, Jian Liu, Zhuang Liu, Can Ouyang, Fei Xing, Lei Sha, Rui Liu, Yu Zhang, James Kwok,
- Abstract要約: 現実の世界では、ハイパーグラフは生命科学や社会社会などの分野において重要な実践的応用がある。
LVLMの最近の進歩は、複雑なトポロジーを理解することを約束している。
$texttHyperGVL$はハイパーグラフ理解と推論におけるLVLMの習熟度を評価する最初のベンチマークである。
- 参考スコア(独自算出の注目度): 24.826358525982513
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large Vision-Language Models (LVLMs) consistently require new arenas to guide their expanding boundaries, yet their capabilities with hypergraphs remain unexplored. In the real world, hypergraphs have significant practical applications in areas such as life sciences and social communities. Recent advancements in LVLMs have shown promise in understanding complex topologies, yet there remains a lack of a benchmark to delineate the capabilities of LVLMs with hypergraphs, leaving the boundaries of their abilities unclear. To fill this gap, in this paper, we introduce $\texttt{HyperGVL}$, the first benchmark to evaluate the proficiency of LVLMs in hypergraph understanding and reasoning. $\texttt{HyperGVL}$ provides a comprehensive assessment of 12 advanced LVLMs across 84,000 vision-language question-answering (QA) samples spanning 12 tasks, ranging from basic component counting to complex NP-hard problem reasoning. The involved hypergraphs contain multiscale synthetic structures and real-world citation and protein networks. Moreover, we examine the effects of 12 textual and visual hypergraph representations and introduce a generalizable router $\texttt{WiseHyGR}$ that improves LVLMs in hypergraph via learning adaptive representations. We believe that this work is a step forward in connecting hypergraphs with LVLMs.
- Abstract(参考訳): LVLM(Large Vision-Language Models)は、拡張境界を導くために新しいアリーナを一貫して要求するが、ハイパーグラフの能力は未解明のままである。
現実の世界では、ハイパーグラフは生命科学や社会社会などの分野において重要な実践的応用がある。
近年のLVLMの進歩は、複雑なトポロジを理解することを約束していることを示しているが、ハイパーグラフでLVLMの能力を説明するためのベンチマークが欠如しており、それらの能力の境界ははっきりしないままである。
このギャップを埋めるために、ハイパーグラフ理解と推論におけるLVLMの習熟度を評価する最初のベンチマークである$\texttt{HyperGVL}$を紹介する。
$\texttt{HyperGVL}$は、12のタスクにまたがる視覚言語質問回答(QA)の12の高度なLVLMの総合的な評価を提供する。
関与するハイパーグラフには、マルチスケールの合成構造、現実世界の励起とタンパク質ネットワークが含まれる。
さらに,12個のテキストおよび視覚的ハイパーグラフ表現の効果について検討し,適応表現を学習することでハイパーグラフのLVLMを改善する一般化可能なルータ$\texttt{WiseHyGR}$を導入する。
この研究は、ハイパーグラフとLVLMを結びつけるための一歩だと我々は信じている。
関連論文リスト
- Modeling Hypergraph Using Large Language Models [4.58199980642666]
ハイパーグラフは、高階クラスタリング、ハイパーグラフニューラルネットワーク、コンピュータビジョンで使用される。
しかし、従来のペアワイズグラフと比較して、実際のハイパーグラフデータセットはスケールと多様性の両方において不足している。
マルチエージェント協調によるハイパーグラフの生成と進化をシミュレートする新しいLCM駆動型ハイパーグラフ生成装置HyperLLMを紹介する。
論文 参考訳(メタデータ) (2025-10-09T04:23:16Z) - Beyond Graphs: Can Large Language Models Comprehend Hypergraphs? [26.39103710373248]
NLGraphやGraphQAといった既存のベンチマークでは、ペア関係を中心にグラフ上のLLMを評価している。
LLM4Hypergraphは、8つの低次、5つの高次、および2つの同型タスクにまたがる21,500の問題をまとめた最初の総合的なベンチマークである。
GPT-4oを含む6つの著名なLCMを評価し、モデル強度と弱点の同定におけるベンチマークの有効性を実証した。
論文 参考訳(メタデータ) (2024-10-14T01:55:02Z) - HypeBoy: Generative Self-Supervised Representation Learning on Hypergraphs [32.5940489350655]
ハイパーグラフは複雑なトポロジーで特徴付けられ、ハイパーエッジを持つ複数のノード間の高次相互作用を表現する。
生成自己監督学習(SSL)の最近の進歩は、生成自己監督から学習したハイパーグラフニューラルネットワークが、複雑なハイパーグラフトポロジーを効果的にエンコードする可能性があることを示唆している。
ハイパーグラフのための新しい生成型SSL戦略を提案する。
生成するSSLタスクに基づいて,ハイパーグラフSSL法であるHypeBoyを提案する。
論文 参考訳(メタデータ) (2024-03-31T10:30:03Z) - Hypergraph Transformer for Semi-Supervised Classification [50.92027313775934]
我々は新しいハイパーグラフ学習フレームワークHyperGraph Transformer(HyperGT)を提案する。
HyperGTはTransformerベースのニューラルネットワークアーキテクチャを使用して、すべてのノードとハイパーエッジのグローバル相関を効果的に検討する。
局所接続パターンを保ちながら、グローバルな相互作用を効果的に組み込むことで、包括的なハイパーグラフ表現学習を実現する。
論文 参考訳(メタデータ) (2023-12-18T17:50:52Z) - Hypergraph-MLP: Learning on Hypergraphs without Message Passing [41.43504601820411]
多くのハイパーグラフニューラルネットワークは、ハイパーグラフ構造上のメッセージパッシングを利用してノード表現学習を強化する。
我々は、ハイパーグラフ構造に関する情報を、明示的なメッセージパッシングを伴わずに、トレーニングの監督に組み込む方法を提案する。
具体的には,ハイパーグラフ構造化データのための新しい学習フレームワークであるHypergraph-MLPを紹介する。
論文 参考訳(メタデータ) (2023-12-15T13:30:04Z) - Good Questions Help Zero-Shot Image Reasoning [110.1671684828904]
質問駆動型視覚探索(QVix)は、大規模視覚言語モデル(LVLM)の探索能力を高める新しい促進戦略である。
QVixは、視覚的なシーンのより広い探索を可能にし、視覚的な質問応答や視覚的エンターテイメントといったタスクにおけるLVLMの推論精度と深さを改善している。
我々は,ScienceQAやきめ細かな視覚分類など,難易度の高いゼロショット視覚言語ベンチマークの評価を行い,QVixが既存の手法よりも優れていることを示した。
論文 参考訳(メタデータ) (2023-12-04T03:18:51Z) - Hypergraph Convolutional Networks via Equivalency between Hypergraphs
and Undirected Graphs [59.71134113268709]
本稿では,EDVWおよびEIVWハイパーグラフを処理可能な一般学習フレームワークであるGeneral Hypergraph Spectral Convolution(GHSC)を提案する。
本稿では,提案するフレームワークが最先端の性能を達成できることを示す。
ソーシャルネットワーク分析,視覚的客観的分類,タンパク質学習など,様々な分野の実験により,提案手法が最先端の性能を達成できることが実証された。
論文 参考訳(メタデータ) (2022-03-31T10:46:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。