論文の概要: When Graph Language Models Go Beyond Memorization
- arxiv url: http://arxiv.org/abs/2605.06239v1
- Date: Thu, 07 May 2026 13:24:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.841891
- Title: When Graph Language Models Go Beyond Memorization
- Title(参考訳): グラフ言語モデルが記憶を超えたとき
- Authors: Masatsugu Yamada, Mahito Sugiyama,
- Abstract要約: グラフ言語モデルが構造的規則性を学ぶか、単にトレーニンググラフを記憶するだけなのかは、まだ不明である。
我々は,頻繁な部分グラフマイニング,グラフレベルのブートストラップベースライン,3レベルの周波数階層化を組み合わせた校正診断プロトコルを開発した。
グラフ言語モデルは,主に高周波状態において,大規模記憶以上の構造的規則性を得ることができることを示す。
- 参考スコア(独自算出の注目度): 11.201029351368094
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: It remains unclear whether graph language models learn structural regularities or merely memorize training graphs; this cannot be resolved by current aggregate fidelity metrics alone. We develop a calibrated diagnostic protocol that combines frequent subgraph mining, a graph-level bootstrap baseline, and three-level frequency stratification to disentangle memorization from structural alignment. Using this framework, we show that graph language models can acquire structural regularities beyond memorization at scale, primarily in the high-frequency regime. This is supported by the following empirical evidence: On five TU benchmarks, LLaMA-style graph language models reach high subgraph-rank correlation, yet their alignment is matched or exceeded by the memorization bootstrap in most cases. At small scale, under our bootstrap diagnostic, fidelity is largely indistinguishable from verbatim recall. In contrast, at large scale with 3.75M graphs, verbatim memorization drops sharply while rank correlation remains near ceiling. Crucially, in a separate fixed-subsample analysis, frequent subgraph mining restricted to the novel-only subset closely tracks the corresponding all-generation Spearman correlation, providing evidence that the alignment is not driven solely by verbatim recall. Across all scales, high-frequency patterns are well reproduced, while rare patterns remain poorly covered, and this deficit narrows only marginally as capacity increases. We observe the same scale-dependent crossover under two distinct graph serializations (canonical DFS code and action sequences), providing evidence of robustness in our analysis.
- Abstract(参考訳): グラフ言語モデルが構造的規則性を学ぶか、単にトレーニンググラフを記憶するだけなのかは、まだ不明である。
我々は,頻繁な部分グラフマイニング,グラフレベルのブートストラップベースライン,および3レベルの周波数階層化を組み合わせた校正診断プロトコルを開発し,構造的アライメントから記憶のアンタングルを解消する。
この枠組みを用いることで,グラフ言語モデルが大規模記憶以上の構造的規則性を得ることができることを示す。
5つのTUベンチマークでは、LLaMAスタイルのグラフ言語モデルは高いサブグラフランク相関に達するが、ほとんどの場合、それらのアライメントは記憶ブートストラップによって一致または超えられる。
私たちのブートストラップ診断では、小さなスケールでは、忠実度は動詞的リコールと大きく区別できない。
対照的に、3.75万のグラフを持つ大規模では、ランク相関が天井付近にある間、動詞の暗記は急激に低下する。
重要なことは、別の固定サブサンプル分析において、新しい部分グラフマイニングに制限された頻繁なサブグラフマイニングは、対応する全世代のスピアマン相関を密に追跡し、アライメントが単に冗長リコールによって駆動されるわけではないことを示す。
あらゆるスケールにおいて、高周波パターンはよく再現されるが、稀なパターンはカバーが不足しているままであり、この欠陥はキャパシティが増加するにつれてわずかに狭まる。
2つの異なるグラフシリアライゼーション(標準DFS符号とアクションシーケンス)の下で、同じスケール依存のクロスオーバーを観察し、分析においてロバスト性を示す。
関連論文リスト
- OWLEYE: Zero-Shot Learner for Cross-Domain Graph Data Anomaly Detection [48.77471686671269]
OWLEYEは、複数のグラフから正常な振る舞いの伝達可能なパターンを学習する新しいフレームワークである。
OWLEYEは最先端のベースラインに比べて性能と一般化性が優れていることを示す。
論文 参考訳(メタデータ) (2026-01-27T02:08:18Z) - FACTUM: Mechanistic Detection of Citation Hallucination in Long-Form RAG [29.07623863966094]
Retrieval-Augmented Generation (RAG)モデルは、引用幻覚によって著しく損なわれている。
FACTUMは、アンダーライジングメカニズムを介してCitation Trustworthinessをテストするためのフレームワークである。
我々の分析によると、正しい引用は、常に高いパラメトリック力によって特徴付けられる。
この複雑な相互作用を捉えることで、FACTUMは最先端のベースラインを37.5%向上させる。
論文 参考訳(メタデータ) (2026-01-09T15:41:08Z) - GRAD: Graph-Retrieved Adaptive Decoding for Hallucination Mitigation [12.69955054591315]
コーパス由来の証拠を再学習せずに生成する復号時間法であるグラフ検索適応復号法(GRAD)を導入する。
3つのモデルと様々な質問応答ベンチマークで、GRADは一貫してベースラインを超えている。
GRADは、コントラストデコーディングやナレッジグラフの拡張に対して、軽量でプラグアンドプレイの代替手段を提供する。
論文 参考訳(メタデータ) (2025-11-05T22:51:16Z) - Beyond Message Passing: Neural Graph Pattern Machine [50.78679002846741]
本稿では,グラフサブストラクチャから直接学習することで,メッセージパッシングをバイパスする新しいフレームワークであるNeural Graph Pattern Machine(GPM)を紹介する。
GPMはタスク関連グラフパターンを効率的に抽出し、エンコードし、優先順位付けする。
論文 参考訳(メタデータ) (2025-01-30T20:37:47Z) - ADA-GAD: Anomaly-Denoised Autoencoders for Graph Anomaly Detection [84.0718034981805]
我々はAnomaly-Denoized Autoencoders for Graph Anomaly Detection (ADA-GAD)という新しいフレームワークを導入する。
第1段階では,異常レベルを低減したグラフを生成する学習自由な異常化拡張法を設計する。
次の段階では、デコーダは元のグラフで検出するために再訓練される。
論文 参考訳(メタデータ) (2023-12-22T09:02:01Z) - DAGAD: Data Augmentation for Graph Anomaly Detection [57.92471847260541]
本稿では、属性グラフのための新しいデータ拡張ベースのグラフ異常検出(DAGAD)フレームワークを考案する。
3つのデータセットに関する一連の実験は、DAGADが様々な主に使用されるメトリクスに関して、10の最先端のベースライン検出器より優れていることを証明している。
論文 参考訳(メタデータ) (2022-10-18T11:28:21Z) - Spatial-spectral Hyperspectral Image Classification via Multiple Random
Anchor Graphs Ensemble Learning [88.60285937702304]
本稿では,複数のランダムアンカーグラフアンサンブル学習(RAGE)を用いた空間スペクトルHSI分類手法を提案する。
まず、各選択されたバンドのより記述的な特徴を抽出し、局所的な構造と領域の微妙な変化を保存するローカルバイナリパターンを採用する。
次に,アンカーグラフの構成に適応隣接代入を導入し,計算複雑性を低減した。
論文 参考訳(メタデータ) (2021-03-25T09:31:41Z) - Issues with Propagation Based Models for Graph-Level Outlier Detection [16.980621769406916]
Graph-Level Outlier Detection (GLOD)は、グラフデータベース内の異常なグラフを識別するタスクである。
本稿では, GLODに伝搬モデルを適用し, 基本的かつ興味深い問題に対処する。
モデルのROC-AUC性能は、どのクラスがダウンサンプリングされるかによって大きく変化します。
論文 参考訳(メタデータ) (2020-12-23T19:38:21Z) - Auto-decoding Graphs [91.3755431537592]
生成モデルは、潜在コードからグラフを合成することを学ぶ自動デコーダである。
グラフは、おそらく接続パターンを特定するためにトレーニングされた自己アテンションモジュールを使用して合成される。
論文 参考訳(メタデータ) (2020-06-04T14:23:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。