論文の概要: Rethinking Graph Generalization through the Lens of Sharpness-Aware Minimization
- arxiv url: http://arxiv.org/abs/2602.08855v1
- Date: Mon, 09 Feb 2026 16:20:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:25.35232
- Title: Rethinking Graph Generalization through the Lens of Sharpness-Aware Minimization
- Title(参考訳): シャープネス認識最小化のレンズによるグラフ一般化の再考
- Authors: Yang Qiu, Yixiong Zou, Jun Wang,
- Abstract要約: 我々は、グラフ一般化、最小シフトフリップ(MSF)において、一般的だが未探索の現象に焦点をあてる。
MSFは、トレーニング分布からわずかに逸脱したテストサンプルが突然誤分類された場合に発生する。
エネルギー誘導型潜伏摂動を利用して擬似OODサンプルを生成するエネルギー駆動型生成拡張フレームワーク(E2A)を提案する。
- 参考スコア(独自算出の注目度): 18.577399823354806
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Graph Neural Networks (GNNs) have achieved remarkable success across various graph-based tasks but remain highly sensitive to distribution shifts. In this work, we focus on a prevalent yet under-explored phenomenon in graph generalization, Minimal Shift Flip (MSF),where test samples that slightly deviate from the training distribution are abruptly misclassified. To interpret this phenomenon, we revisit MSF through the lens of Sharpness-Aware Minimization (SAM), which characterizes the local stability and sharpness of the loss landscape while providing a theoretical foundation for modeling generalization error. To quantify loss sharpness, we introduce the concept of Local Robust Radius, measuring the smallest perturbation required to flip a prediction and establishing a theoretical link between local stability and generalization. Building on this perspective, we further observe a continual decrease in the robust radius during training, indicating weakened local stability and an increasingly sharp loss landscape that gives rise to MSF. To jointly solve the MSF phenomenon and the intractability of radius, we develop an energy-based formulation that is theoretically proven to be monotonically correlated with the robust radius, offering a tractable and principled objective for modeling flatness and stability. Building on these insights, we propose an energy-driven generative augmentation framework (E2A) that leverages energy-guided latent perturbations to generate pseudo-OOD samples and enhance model generalization. Extensive experiments across multiple benchmarks demonstrate that E2A consistently improves graph OOD generalization, outperforming state-of-the-art baselines.
- Abstract(参考訳): グラフニューラルネットワーク(GNN)は、様々なグラフベースのタスクで顕著な成功を収めているが、分散シフトに対して非常に敏感である。
本研究では,学習分布からわずかに逸脱したテストサンプルを突然誤分類するグラフ一般化法,Minimmal Shift Flip (MSF) に注目する。
この現象を解釈するために、我々は、一般化誤差をモデル化するための理論的基盤を提供しながら、損失景観の局所的安定性と鋭さを特徴付けるシャープネス・アウェア最小化(SAM)レンズを用いて、MSFを再検討する。
損失のシャープネスを定量化するために、局所ロバスト・ラディウスの概念を導入し、予測を反転させるのに必要な最小の摂動を測定し、局所安定性と一般化の理論的関係を確立する。
この観点から、トレーニング中のロバスト半径の連続的な減少が観察され、局所的な安定性の低下と、MSFを生じさせる鋭いロスランドスケープが示唆された。
MSF現象と半径の誘引性を共同で解くため, 理論上は剛性半径と単調に相関することが証明されたエネルギーベースの定式化を開発し, 平坦性と安定性をモデル化するための, トラクタブルで原理化された目的を提供する。
これらの知見に基づいて、エネルギー誘導型潜伏摂動を利用して擬似OODサンプルを生成し、モデル一般化を強化するエネルギー駆動型生成拡張フレームワーク(E2A)を提案する。
複数のベンチマークにわたる大規模な実験により、E2AはグラフOODの一般化を一貫して改善し、最先端のベースラインを上回っている。
関連論文リスト
- Understanding Degradation with Vision Language Model [56.09241449206817]
視覚的劣化を理解することは、コンピュータビジョンにおいて重要な問題であるが、難しい問題である。
本稿では,教師付き微調整と強化学習を併用したマルチモーダル・チェーン・オブ・ソート・モデルであるDU-VLMを紹介する。
また,110,000個のクリーン劣化ペアと接地された物理アノテーションからなる大規模データセットである textbfDU-110k も導入した。
論文 参考訳(メタデータ) (2026-02-04T13:51:15Z) - On the Stability of Graph Convolutional Neural Networks: A Probabilistic Perspective [21.0483487978294]
グラフトポロジにおける摂動がGCNN出力に与える影響について検討し,モデル安定性解析のための新しい定式化を提案する。
最悪の場合の摂動のみに焦点を当てた従来の研究とは異なり、分布認識の定式化は幅広い入力データにまたがる出力摂動を特徴付ける。
論文 参考訳(メタデータ) (2025-06-01T23:17:19Z) - ACMamba: Fast Unsupervised Anomaly Detection via An Asymmetrical Consensus State Space Model [51.83639270669481]
ハイパースペクトル画像(HSI)における教師なし異常検出は、背景から未知のターゲットを検出することを目的としている。
HSI研究は、HSIの高次元特性と高密度サンプリングベーストレーニングパラダイムにより、計算コストの急激さによって妨げられている。
計算コストを大幅に削減する非対称コンセンサス状態空間モデル(ACMamba)を提案する。
論文 参考訳(メタデータ) (2025-04-16T05:33:42Z) - Understanding Flatness in Generative Models: Its Role and Benefits [9.775257597631244]
教師付き学習における堅牢性を高めることが知られているフラット・ミニマは、生成モデルにおいてほとんど探索されていない。
より平坦なミニマは、対象の事前分布における摂動に対する頑健性を改善するという理論的主張を確立する。
拡散モデルにおける平坦なミニマは、生成性能だけでなく、頑健性も向上することを示した。
論文 参考訳(メタデータ) (2025-03-14T04:38:53Z) - Unmasking Bias in Diffusion Model Training [40.90066994983719]
拡散モデルが画像生成の主流のアプローチとして登場した。
トレーニングの収束が遅く、サンプリングのカラーシフトの問題に悩まされている。
本稿では,これらの障害は,既定のトレーニングパラダイムに固有のバイアスや準最適性に大きく起因していると考えられる。
論文 参考訳(メタデータ) (2023-10-12T16:04:41Z) - Convergence of mean-field Langevin dynamics: Time and space
discretization, stochastic gradient, and variance reduction [49.66486092259376]
平均場ランゲヴィンダイナミクス(英: mean-field Langevin dynamics、MFLD)は、分布依存のドリフトを含むランゲヴィン力学の非線形一般化である。
近年の研究では、MFLDは測度空間で機能するエントロピー規則化された凸関数を地球規模で最小化することが示されている。
有限粒子近似,時間分散,勾配近似による誤差を考慮し,MFLDのカオスの均一時間伝播を示す枠組みを提供する。
論文 参考訳(メタデータ) (2023-06-12T16:28:11Z) - Handling Distribution Shifts on Graphs: An Invariance Perspective [78.31180235269035]
我々は、グラフ上のOOD問題を定式化し、新しい不変学習手法である探索・拡張リスク最小化(EERM)を開発する。
EERMは、複数の仮想環境からのリスクの分散を最大化するために、敵対的に訓練された複数のコンテキストエクスプローラーを利用する。
理論的に有効なOOD解の保証を示すことによって,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2022-02-05T02:31:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。