論文の概要: Monotonic Kolmogorov-Arnold Networks: A Theoretical and Empirical Study of Monotonicity as an Inductive Bias
- arxiv url: http://arxiv.org/abs/2606.17886v2
- Date: Thu, 18 Jun 2026 07:32:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 13:55:51.709811
- Title: Monotonic Kolmogorov-Arnold Networks: A Theoretical and Empirical Study of Monotonicity as an Inductive Bias
- Title(参考訳): モノトニック・コルモゴロフ・アルノルドネットワーク:誘導バイアスとしてのモノトニック性の理論的実証的研究
- Authors: Mikhail Krasnov, Blaž Bertalanič, Carolina Fortuna,
- Abstract要約: モノトニック性は、ニューラルネットワークの長年にわたるアーキテクチャ上の帰納バイアスである。
センホールパラメータ値に対するハードモノトニック性を保証するカンであるbfMKANを提案する。
MKANはSMM/I-2024ベンチマークで最先端のモノトーンNNと競合する。
- 参考スコア(独自算出の注目度): 4.904092547705666
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Monotonicity has been a long-running architectural inductive bias for neural networks, motivated by tabular, scientific, and economic settings where outputs are known to respond monotonically to certain inputs. Existing approaches are MLP- or flow-based and lack per-edge functional transparency; the only Kolmogorov--Arnold Network (KAN) variant with monotonicity, MonoKAN, enforces the constraint only on a restricted parameter subset and requires a projection-style training procedure. We close this gap with \textbf{MKAN}, a KAN with hard monotonicity guaranteed for \emph{all} parameter values via exponential reparameterization of B-spline coefficients, positive edge weights, and a monotone base activation. Training reduces to standard unconstrained gradient descent. Our headline theoretical contribution is a \emph{representation-cost} theorem: any $C^K, K >0$ feature extractor inducing a ball-shaped semantic-neighborhood partition admits a monotone realization of the equivalent neighborhood structure at $N' = N^* + k \le 2N^*$, where $k$ is the number of non-monotone coordinates of the original. The bound is architecture-agnostic and gives a principled sizing rule for monotone encoders. Empirically, MKAN is competitive with state-of-the-art monotone NNs on the SMM/ICML-2024 benchmark while being the only method that combines hard unconstrained monotonicity with KAN's per-edge functional transparency; the $2N^*$ prediction is validated in a self-supervised feature-size sweep on four real datasets, and on a controlled monotone-generative dataset MKAN recovers ground-truth factors with substantially higher Spearman alignment than KAN, MLP, and linear baselines.
- Abstract(参考訳): モノトニック性(Monotonicity)は、特定の入力に対して単調に応答することが知られているグラフ、科学的、経済的な設定によって動機付けられた、ニューラルネットワークの長年にわたるアーキテクチャ的帰納バイアスである。
モノトニック性を持つ唯一のKAN(Kolmogorov-Arnold Network)変種であるMonoKANは、制限されたパラメータサブセットにのみ制約を強制し、プロジェクションスタイルのトレーニング手順を必要とする。
このギャップを, B-スプライン係数の指数的再パラメータ化, 正のエッジ重み, 単調なベースアクティベーションにより, 単調性の強いカンで埋める。
訓練は標準の非拘束勾配降下に還元される。
C^K, K > 0$ 特徴抽出器はボール型セマンティック-近傍分割を誘導し、n' = N^* + k \le 2N^*$ で同値な近傍構造をモノトン化することで、k$ は元の非モノトン座標の数である。
境界はアーキテクチャに依存しないものであり、単調エンコーダに対して原則化されたサイズルールを与える。
実証的には、MKANはSMM/ICML-2024ベンチマークで最先端のモノトーンNNと競合する一方で、硬く制約のないモノトニック性とKANのエッジごとの機能透過性を組み合わせた唯一の方法である; 2N^*$予測は、4つの実データセット上の自己監督的特徴サイズスイープで検証され、制御されたモノトーン生成データセットMKANは、kan, MLP, 線形ベースラインよりもはるかに高いスピアマンアライメントを持つ地ストルース因子を回復する。
関連論文リスト
- Beyond the Laplacian: Doubly Stochastic Matrices for Graph Neural Networks [0.0]
グラフニューラルネットワーク(GNN)は従来、構造的メッセージパッシングのために標準的なラプラシア行列や隣接行列に依存していた。
本研究では、従来のラプラシアンを、修正ラプラシアンの逆数から派生した二重グラフ行列 (DSM) で置き換え、連続マルチホップ近接と厳密な局所集中性を自然に符号化する。
論文 参考訳(メタデータ) (2026-04-16T14:33:32Z) - Regularized Online RLHF with Generalized Bilinear Preferences [68.44113000390544]
一般的な嗜好を伴う文脈的オンラインRLHFの問題を考える。
一般化された双線形選好モデルを用いて、低ランクなスキュー対称行列による選好を捉える。
グリーディポリシーの双対ギャップは推定誤差の正方形によって有界であることを示す。
論文 参考訳(メタデータ) (2026-02-26T15:27:53Z) - Singular Bayesian Neural Networks [1.2891210250935148]
ベイズニューラルネットワークはキャリブレーションされた不確かさを約束するが、標準平均体ガウス後方に対する$O(mn)$パラメータを必要とする。
我々は、ルベーグ測度に関して特異な後部を誘導し、ランク-$r$多様体に集中する。
複素項が $sqrtr(m+n)$ ではなく $sqrtm n$ としてスケールするPAC-Bayes 一般化境界を導出し、誤差を最適化とランク誘導バイアスに分解する損失境界を証明する。
論文 参考訳(メタデータ) (2026-01-30T23:06:34Z) - Unregularized Linear Convergence in Zero-Sum Game from Preference Feedback [50.89125374999765]
NLHFにおける最適乗算重み更新(mathtOMWU$)に対する最初の収束保証を提供する。
本分析では, 稀に発生する行動の確率が指数関数的に小さい値から指数関数的に増大する新たな限界収束挙動を同定する。
論文 参考訳(メタデータ) (2025-12-31T12:08:29Z) - Differentiable Sparsity via $D$-Gating: Simple and Versatile Structured Penalization [22.883367233817836]
D$-Gatingは、理論上、元の群疎性問題の解法と等価であることを示す。
ビジョン、言語、タスクにまたがって私たちの理論を検証する。
論文 参考訳(メタデータ) (2025-09-28T14:08:29Z) - Learning with Norm Constrained, Over-parameterized, Two-layer Neural Networks [54.177130905659155]
近年の研究では、再生カーネルヒルベルト空間(RKHS)がニューラルネットワークによる関数のモデル化に適した空間ではないことが示されている。
本稿では,有界ノルムを持つオーバーパラメータ化された2層ニューラルネットワークに適した関数空間について検討する。
論文 参考訳(メタデータ) (2024-04-29T15:04:07Z) - Robustness Certificates for Implicit Neural Networks: A Mixed Monotone
Contractive Approach [60.67748036747221]
暗黙のニューラルネットワークは、競合性能とメモリ消費の削減を提供する。
入力逆流の摂動に関して、それらは不安定なままである。
本稿では,暗黙的ニューラルネットワークのロバスト性検証のための理論的および計算的枠組みを提案する。
論文 参考訳(メタデータ) (2021-12-10T03:08:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。