論文の概要: Spectral Analysis of Molecular Kernels: When Richer Features Do Not Guarantee Better Generalization
- arxiv url: http://arxiv.org/abs/2510.14217v1
- Date: Thu, 16 Oct 2025 01:52:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-17 21:15:14.673122
- Title: Spectral Analysis of Molecular Kernels: When Richer Features Do Not Guarantee Better Generalization
- Title(参考訳): 分子核のスペクトル解析:よりリッチな特徴がより良い一般化を保証しないとき
- Authors: Asma Jamali, Tin Sum Cheng, Rodrigo A. Vargas-Hernández,
- Abstract要約: QM9データセット上でカーネルリッジ回帰の総合スペクトル分析を行った。
驚くべきことに、4つの異なるスペクトル測定値によって測定されるよりリッチなスペクトル特徴は、常に精度を向上しない。
変換器ベースおよび局所的な3次元表現の場合、スペクトルの富度は性能と負の相関を持つ。
- 参考スコア(独自算出の注目度): 3.2880869992413246
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding the spectral properties of kernels offers a principled perspective on generalization and representation quality. While deep models achieve state-of-the-art accuracy in molecular property prediction, kernel methods remain widely used for their robustness in low-data regimes and transparent theoretical grounding. Despite extensive studies of kernel spectra in machine learning, systematic spectral analyses of molecular kernels are scarce. In this work, we provide the first comprehensive spectral analysis of kernel ridge regression on the QM9 dataset, molecular fingerprint, pretrained transformer-based, global and local 3D representations across seven molecular properties. Surprisingly, richer spectral features, measured by four different spectral metrics, do not consistently improve accuracy. Pearson correlation tests further reveal that for transformer-based and local 3D representations, spectral richness can even have a negative correlation with performance. We also implement truncated kernels to probe the relationship between spectrum and predictive performance: in many kernels, retaining only the top 2% of eigenvalues recovers nearly all performance, indicating that the leading eigenvalues capture the most informative features. Our results challenge the common heuristic that "richer spectra yield better generalization" and highlight nuanced relationships between representation, kernel features, and predictive performance. Beyond molecular property prediction, these findings inform how kernel and self-supervised learning methods are evaluated in data-limited scientific and real-world tasks.
- Abstract(参考訳): カーネルのスペクトル特性を理解することは、一般化と表現品質に関する原則的な視点を与える。
ディープモデルは分子特性予測において最先端の精度を達成するが、カーネル法は低データ状態におけるロバスト性や透明な理論的根拠のために広く使われている。
機械学習におけるカーネルスペクトルの広範な研究にもかかわらず、分子核の系統的なスペクトル分析は乏しい。
本研究では,QM9データセット,分子指紋,予め訓練されたトランスフォーマーベース,グローバルおよび局所的な7つの分子特性におけるカーネルリッジ回帰のスペクトル分析を行った。
驚くべきことに、4つの異なるスペクトル測定値によって測定されるよりリッチなスペクトル特徴は、常に精度を向上しない。
ピアソン相関試験により、変換器に基づく局所的な3次元表現では、スペクトルの豊かさは性能と負の相関を持つことが明らかとなった。
多くのカーネルでは、トップ2%の固有値のみを保持するだけでほぼ全ての性能が回復し、先頭の固有値が最も有意な特徴を捉えていることを示す。
この結果は「よりリッチなスペクトルがより一般化する」という一般的なヒューリスティックに挑戦し、表現、カーネル特徴、予測性能の間のニュアンスな関係を強調した。
分子特性予測以外にも、これらの知見は、データ制限された科学的・現実世界のタスクにおいて、カーネルと自己教師付き学習手法がどのように評価されるかを示す。
関連論文リスト
- DiffSpectra: Molecular Structure Elucidation from Spectra using Diffusion Models [66.41802970528133]
スペクトルからの分子構造解明は化学の基礎的な問題である。
従来の手法は専門家の解釈に大きく依存し、拡張性に欠ける。
マルチモーダルスペクトルデータから2次元および3次元分子構造を直接推定する生成フレームワークであるDiffSpectraを提案する。
論文 参考訳(メタデータ) (2025-07-09T13:57:20Z) - Graph Neural Networks Are More Than Filters: Revisiting and Benchmarking from A Spectral Perspective [49.613774305350084]
グラフニューラルネットワーク(GNN)は、様々なグラフベースの学習タスクにおいて顕著な成功を収めている。
近年の研究では、非線形層などの他のコンポーネントが、GNNがスペクトル領域の入力グラフデータをどのように処理するかに大きく影響する可能性が示唆されている。
本稿では、入力グラフデータの異なる周波数成分に符号化された情報を捕捉し、活用する際のGNNの能力を評価するための総合的なベンチマークを提案する。
論文 参考訳(メタデータ) (2024-12-10T04:53:53Z) - Holistic Physics Solver: Learning PDEs in a Unified Spectral-Physical Space [54.13671100638092]
Holistic Physics Mixer (HPM) は、スペクトルと物理情報を統一された空間に統合するためのフレームワークである。
我々はHPMが精度と計算効率の両面で最先端の手法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2024-10-15T08:19:39Z) - Demystifying Spectral Bias on Real-World Data [2.3020018305241337]
カーネルリッジ回帰(KRR)とガウス過程(GP)は統計学と機械学習の基本的なツールである。
我々は、データセット間の学習可能性について検討し、複雑なデータセットのスペクトルバイアスを明らかにするために、高度に理想化されたデータ尺度に関連する固有値と固有関数を用いることを示す。
論文 参考訳(メタデータ) (2024-06-04T18:00:00Z) - Hodge-Aware Contrastive Learning [101.56637264703058]
単純コンプレックスは、マルチウェイ依存によるデータのモデリングに有効である。
我々は、単純なデータを処理するための対照的な自己教師付き学習手法を開発した。
論文 参考訳(メタデータ) (2023-09-14T00:40:07Z) - Unsupervised Machine Learning for Exploratory Data Analysis of Exoplanet
Transmission Spectra [68.8204255655161]
我々は、通過する太陽系外惑星のスペクトルデータを解析するための教師なし手法に焦点をあてる。
スペクトルデータには、適切な低次元表現を要求する高い相関関係があることが示される。
主成分に基づく興味深い構造、すなわち、異なる化学状態に対応する明確に定義された分岐を明らかにする。
論文 参考訳(メタデータ) (2022-01-07T22:26:33Z) - Spectral Analysis Network for Deep Representation Learning and Image
Clustering [53.415803942270685]
本稿ではスペクトル分析に基づく教師なし深層表現学習のための新しいネットワーク構造を提案する。
パッチレベルで画像間の局所的な類似性を識別できるため、閉塞に対してより堅牢である。
クラスタリングに親しみやすい表現を学習し、データサンプル間の深い相関を明らかにすることができる。
論文 参考訳(メタデータ) (2020-09-11T05:07:15Z) - Convolutional Spectral Kernel Learning [21.595130250234646]
逆フーリエ変換に基づく解釈可能な畳み込みスペクトルカーネルネットワーク(textttCSKN)を構築する。
一般化誤差境界を導出し、性能を改善するために2つの正規化器を導入する。
実世界のデータセットを用いた実験は、学習フレームワークの有効性を検証する。
論文 参考訳(メタデータ) (2020-02-28T14:35:54Z) - Spectrum Dependent Learning Curves in Kernel Regression and Wide Neural
Networks [17.188280334580195]
トレーニングサンプル数の関数として,カーネル回帰の一般化性能に関する解析式を導出する。
我々の表現は、トレーニングとニューラルカーネル・タンジェント(NTK)によるカーネル回帰の等価性により、広いニューラルネットワークに適用される。
我々は、合成データとMNISTデータセットのシミュレーションを用いて、我々の理論を検証する。
論文 参考訳(メタデータ) (2020-02-07T00:03:40Z) - Persistent spectral based machine learning (PerSpect ML) for drug design [0.0]
薬物設計のための永続スペクトルベース機械学習(PerSpect ML)モデルを提案する。
我々は、11の永続スペクトル変数を考慮し、タンパク質-リガンド結合親和性予測における機械学習モデルの特徴として利用する。
これらのデータベースに対する私たちの結果は、知る限り、既存のすべてのモデルよりも優れています。
論文 参考訳(メタデータ) (2020-02-03T07:14:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。