論文の概要: CAWI: Copula-Aligned Weight Initialization for Randomized Neural Networks
- arxiv url: http://arxiv.org/abs/2605.12580v1
- Date: Tue, 12 May 2026 15:46:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 23:30:27.592661
- Title: CAWI: Copula-Aligned Weight Initialization for Randomized Neural Networks
- Title(参考訳): CAWI:ランダムニューラルネットワークのためのコピュラ配向重み初期化
- Authors: Mushir Akhtar, M. Tanveer, Mohd. Arshad,
- Abstract要約: データ適合したコプラから入力から隠れた重みを引き出すフレームワークであるCAWI(Copula-Aligned Weight Initialization)を提案する。
83種類の分類ベンチマークと2つのバイオメディカルデータセットでCAWIを評価した。
- 参考スコア(独自算出の注目度): 7.698602367824994
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Randomized neural networks (RdNNs) enable efficient, backpropagation-free training by freezing randomly initialized input-to-hidden weights, which permits a closed-form solution for the output layer. However, conventional random initialization is blind to inter-feature dependence, ignoring correlations, asymmetries, and tail dependence in the data, which degrades conditioning and predictive performance. To the best of our knowledge, this limitation remains unaddressed in the RdNN literature. To close this gap, we propose CAWI (Copula-Aligned Weight Initialization), a framework that draws input-to-hidden weights from a data-fitted copula that matches empirical dependence, ensuring the frozen projections respect inter-feature dependence without sacrificing the closed-form solution. CAWI (i) maps each feature to the unit interval using empirical CDFs, (ii) fits a multivariate copula that captures rank-based dependence among features, and (iii) samples each weight column w_j from the fitted copula and applies a fixed inverse marginal transform to set scale. The objective, solver, and "freeze-once" paradigm remain unchanged; only the sampling law for W becomes dependence-aware. For dependence modeling, we consider two copula families: elliptical (Gaussian, t) and Archimedean (Clayton, Frank, Gumbel). This enables CAWI to handle diverse dependence, including tail dependence. We evaluate CAWI across 83 diverse classification benchmarks (binary and multiclass) and two biomedical datasets, BreaKHis and the Schizophrenia dataset, using standard shallow and deep RdNN architectures. CAWI consistently delivers significant improvements in predictive performance over conventional random initialization. Code is available at: https://github.com/mtanveer1/CAWI
- Abstract(参考訳): ランダム化ニューラルネットワーク(RdNN)は、ランダムに初期化された入力から隠れた重みを凍結することにより、効率的なバックプロパゲーションなしのトレーニングを可能にする。
しかし、従来のランダム初期化は、条件付けと予測性能を低下させるデータにおいて、機能間依存、相関の無視、非対称性、テール依存に盲目である。
我々の知る限りでは、この制限はRdNNの文献では未解決のままである。
このギャップを埋めるために,データ適合型コプラから入力から隠れた重みを引き出すフレームワークであるCAWI(Copula-Aligned Weight Initialization)を提案する。
CAWI
(i)各特徴を経験CDFを用いて単位区間にマッピングする。
(ii)特徴間の階数に基づく依存を捉える多変量コプラに適合し、
(iii)各重み列w_jを嵌合したコプラからサンプリングし、固定された逆縁変換をセットスケールに適用する。
目的、解決、そして「フリーズ・オンス」パラダイムは変わらず、W のサンプリング法則のみが依存に気付くようになる。
依存モデルでは、楕円形(ガウス, t)とアルキメデス(クレイトン, フランク, ガンベル)の2つのコプラ族を考える。
これによりCAWIは尾の依存を含む様々な依存を処理できる。
標準の浅層・深層RdNNアーキテクチャを用いて,83種類の分類ベンチマーク(バイナリとマルチクラス)とBreaKHisとSchizophreniaデータセットの2つのバイオメディカルデータセットを対象にCAWIを評価した。
CAWIは、従来のランダム初期化よりも予測性能が大幅に向上している。
コードは、https://github.com/mtanveer1/CAWIで入手できる。
関連論文リスト
- Factual recall in linear associative memories: sharp asymptotics and mechanistic insights [11.11958822145404]
ニューラルネットワークによる入力出力関連の保存と検索の限界について検討する。
線形連想メモリは$p$入力埋め込みを$mathbbRd$で対応する$d$次元のターゲットにマッピングする。
分離されたモデルでは最大$p_c log p_c / d2 = 1 / 2$のアソシエーションを保存できることを示す。
論文 参考訳(メタデータ) (2026-05-11T16:24:02Z) - Dual-Solver: A Generalized ODE Solver for Diffusion Models with Dual Prediction [0.26856688022781555]
学習可能なパラメータによって多段階のサンプルを一般化するDual-rを導入する。
2階局所精度を維持しながら、標準的な予測器・相関器構造を維持している。
FIDおよびCLIPスコアは、背骨全体にわたる低NFEレギュレーションで改善される。
論文 参考訳(メタデータ) (2026-03-04T12:14:52Z) - Self-supervised Latent Space Optimization with Nebula Variational Coding [87.20343320266215]
本稿では,クラスタ化埋め込みに繋がる変分推論モデルを提案する。
textbfnebula anchorsと呼ばれる潜伏空間に新たな変数を導入し、トレーニング中に潜伏変数がクラスタを形成するように誘導する。
各潜在機能は最も近いアンカーでラベル付けできるため、クラスタ間の分離をより明確にするために、自己教師付き方法でメートル法学習を適用することも提案する。
論文 参考訳(メタデータ) (2025-06-02T08:13:32Z) - Neural variational Data Assimilation with Uncertainty Quantification using SPDE priors [28.804041716140194]
ディープラーニングコミュニティの最近の進歩は、ニューラルネットワークと変分データ同化フレームワークを通じて、この問題に対処することができる。
本研究では、部分微分方程式(SPDE)とガウス過程(GP)の理論を用いて状態の空間的および時間的共分散を推定する。
論文 参考訳(メタデータ) (2024-02-02T19:18:12Z) - CeCNN: Copula-enhanced convolutional neural networks in joint prediction of refraction error and axial length based on ultra-widefield fundus images [6.787893694522311]
球面等価性(SE)測定と高ミオピア診断を共同で予測するために,CeCNN(Copula-enhanced Convolutional Neural Network)を提案する。
論文 参考訳(メタデータ) (2023-11-07T13:06:50Z) - FedNAR: Federated Optimization with Normalized Annealing Regularization [54.42032094044368]
ウェイト崩壊の選択を探索し、ウェイト崩壊値が既存のFLアルゴリズムの収束に有意な影響を及ぼすことを確かめる。
我々は,既存のFLアルゴリズムにシームレスに統合可能なプラグインであるFederated Optimization with Normalized Annealing Regularization (FedNAR)を開発した。
論文 参考訳(メタデータ) (2023-10-04T21:11:40Z) - Robust Implicit Networks via Non-Euclidean Contractions [63.91638306025768]
暗黙のニューラルネットワークは、精度の向上とメモリ消費の大幅な削減を示す。
彼らは不利な姿勢と収束の不安定さに悩まされる。
本論文は,ニューラルネットワークを高機能かつ頑健に設計するための新しい枠組みを提供する。
論文 参考訳(メタデータ) (2021-06-06T18:05:02Z) - ACDC: Weight Sharing in Atom-Coefficient Decomposed Convolution [57.635467829558664]
我々は,CNNにおいて,畳み込みカーネル間の構造正則化を導入する。
我々はCNNがパラメータや計算量を劇的に減らして性能を維持していることを示す。
論文 参考訳(メタデータ) (2020-09-04T20:41:47Z) - Revisiting Initialization of Neural Networks [72.24615341588846]
ヘッセン行列のノルムを近似し, 制御することにより, 層間における重みのグローバルな曲率を厳密に推定する。
Word2Vec と MNIST/CIFAR 画像分類タスクの実験により,Hessian ノルムの追跡が診断ツールとして有用であることが確認された。
論文 参考訳(メタデータ) (2020-04-20T18:12:56Z) - Model Fusion via Optimal Transport [64.13185244219353]
ニューラルネットワークのための階層モデル融合アルゴリズムを提案する。
これは、不均一な非i.d.データに基づいてトレーニングされたニューラルネットワーク間での"ワンショット"な知識伝達に成功していることを示す。
論文 参考訳(メタデータ) (2019-10-12T22:07:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。