論文の概要: Newton-Puiseux Analysis for Interpretability and Calibration of Complex-Valued Neural Networks
- arxiv url: http://arxiv.org/abs/2504.19176v2
- Date: Mon, 13 Oct 2025 20:27:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-15 14:23:56.733955
- Title: Newton-Puiseux Analysis for Interpretability and Calibration of Complex-Valued Neural Networks
- Title(参考訳): 複素値ニューラルネットワークの解釈可能性と校正のためのNewton-Puiseux解析
- Authors: Piotr Migus,
- Abstract要約: 複雑なニューラルネットワーク(CVNN)は、心電図(ECG)、レーダー/ソナー、無線の位相/四分法(I/Q)ストリームなどの位相感受性信号を扱うのに適している。
訓練されたCVNNの局所的決定幾何を,小型のキンク対応サロゲートに適合させて検討するNewton-Puiseuxフレームワークを提案する。
我々のフェーズアウェア分析は、制御された$C2$合成ベンチマークを超える2つのケーススタディにおいて、センシティブな方向を特定し、予測エラーを強化する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Complex-valued neural networks (CVNNs) are particularly suitable for handling phase-sensitive signals, including electrocardiography (ECG), radar/sonar, and wireless in-phase/quadrature (I/Q) streams. Nevertheless, their \emph{interpretability} and \emph{probability calibration} remain insufficiently investigated. In this work, we present a Newton--Puiseux framework that examines the \emph{local decision geometry} of a trained CVNN by (i) fitting a small, kink-aware polynomial surrogate to the \emph{logit difference} in the vicinity of uncertain inputs, and (ii) factorizing this surrogate using Newton--Puiseux expansions to derive analytic branch descriptors, including exponents, multiplicities, and orientations. These descriptors provide phase-aligned directions that induce class flips in the original network and allow for a straightforward, \emph{multiplicity-guided} temperature adjustment for improved calibration. We outline assumptions and diagnostic measures under which the surrogate proves informative and characterize potential failure modes arising from piecewise-holomorphic activations (e.g., modReLU). Our phase-aware analysis identifies sensitive directions and enhances Expected Calibration Error in two case studies beyond a controlled $\C^2$ synthetic benchmark -- namely, the MIT--BIH arrhythmia (ECG) dataset and RadioML 2016.10a (wireless modulation) -- when compared to uncalibrated softmax and standard post-hoc baselines. We also present confidence intervals, non-parametric tests, and quantify sensitivity to inaccuracies in estimating branch multiplicity. Crucially, this method requires no modifications to the architecture and applies to any CVNN with complex logits transformed to real moduli.
- Abstract(参考訳): 複雑評価ニューラルネットワーク(CVNN)は、特に、心電図(ECG)、レーダー/ソナー、無線位相/四分法(I/Q)ストリームなどの位相感受性信号を扱うのに適している。
それでも、それらの「emph{interpretability」と「emph{probability calibration」は十分に研究されていない。
本稿では,訓練されたCVNNのemph{local decision geometry}を検証したNewton-Puiseuxフレームワークを提案する。
(i)不確実な入力の近傍で「emph{logit difference}」を代用する、小さい、キンク対応多項式
(II)Newton-Puiseux展開を用いてこのサロゲートを分解し、指数、乗法、配向を含む解析分岐記述子を導出する。
これらの記述子は、元のネットワークでクラスフリップを誘導し、キャリブレーションを改善するための簡単な温度調整を可能にする位相整列方向を提供する。
本稿では,一方向の正則な活性化(例えばmodReLU)から生じる潜在的な障害モードを,サロゲートが情報的かつ特性的に証明する仮定と診断方法について概説する。
我々のフェーズアウェア分析は、制御された$\C^2$の合成ベンチマーク、すなわちMIT--BIH arrhythmia(ECG)データセットとRadioML 2016.10a(無線変調)の2つのケーススタディにおいて、非校正ソフトマックスや標準ポストホックベースラインと比較して、センシティブな方向を認識し、期待される校正誤差を高める。
また、信頼区間、非パラメトリックテストを示し、分岐乗法の推定における不正確性に対する感度を定量化する。
重要なことに、この手法はアーキテクチャの変更を一切必要とせず、複雑なロジットを実際のモジュライに変換するCVNNに適用する。
関連論文リスト
- Non-Hermitian Quantum Metrology Enhancement and Skin Effect Suppression in PT-Symmetric Bardeen-Cooper-Schrieffer Chains [0.0]
非エルミート系における量子力学の理論的枠組みを概説する。
生物直交的な量子フィッシャー情報解析により、2つの異なる形態を同定する。
NHSEは指数関数的に感度を抑えるが、$mathcalPT$-symmetricはハイゼンベルク制限の強化を可能にする。
論文 参考訳(メタデータ) (2025-08-06T18:54:45Z) - Decentralized Nonconvex Composite Federated Learning with Gradient Tracking and Momentum [78.27945336558987]
分散サーバ(DFL)はクライアント・クライアント・アーキテクチャへの依存をなくす。
非滑らかな正規化はしばしば機械学習タスクに組み込まれる。
本稿では,これらの問題を解決する新しいDNCFLアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-04-17T08:32:25Z) - Approximation Bounds for Transformer Networks with Application to Regression [9.549045683389085]
H"older 関数と Sobolev 関数に対する Transformer ネットワークの近似機能について検討する。
シーケンス・ツー・シーケンス・マッピングを近似した標準トランスフォーマー・ネットワークのための新しい上限を確立する。
トランスフォーマーの自己アテンション層がカラム平均化を行うことができれば,ネットワークはシーケンス・ツー・シーケンスのH"older関数を近似することができることを示す。
論文 参考訳(メタデータ) (2025-04-16T15:25:58Z) - Uncertainty Quantification From Scaling Laws in Deep Neural Networks [0.0]
機械学習の分析から不確かさを定量化することは、物理科学での使用に不可欠である。
平均$mu_mathcalL$と分散$sigma_mathcalL$を多層パーセプトロンのアンサンブルとして計算する。
我々は、MNIST分類、CIFAR分類、カロリーメータエネルギー回帰の3つの課題について、有限幅ネットワークの結果と経験的に比較した。
論文 参考訳(メタデータ) (2025-03-07T21:15:11Z) - Theoretical limits of descending $\ell_0$ sparse-regression ML algorithms [0.0]
本研究では,emphmaximum-likelihood (ML)デコーディングの性能解析プログラムを開発した。
ML性能パラメータの鍵となるのは、残留エンフェロ平均二乗誤差(textbfRMSE$)を発見し、いわゆるエンフェロ遷移(PT)現象を示す。
Fl RDTの具体的実装と実用的妥当性は、典型的には、基礎となる数値評価のサイズのセットを実行する能力に依存している。
論文 参考訳(メタデータ) (2024-10-10T06:33:41Z) - Learning with Norm Constrained, Over-parameterized, Two-layer Neural Networks [54.177130905659155]
近年の研究では、再生カーネルヒルベルト空間(RKHS)がニューラルネットワークによる関数のモデル化に適した空間ではないことが示されている。
本稿では,有界ノルムを持つオーバーパラメータ化された2層ニューラルネットワークに適した関数空間について検討する。
論文 参考訳(メタデータ) (2024-04-29T15:04:07Z) - Risk Bounds for Mixture Density Estimation on Compact Domains via the $h$-Lifted Kullback--Leibler Divergence [2.8074364079901017]
標準KL分散の一般化として、$h$-lifted Kullback--Leibler(KL)分散を導入する。
我々は、対応する最大$h$-lifted chance 推定器の計算手順を開発する。
論文 参考訳(メタデータ) (2024-04-19T02:31:34Z) - Tighter Learning Guarantees on Digital Computers via Concentration of Measure on Finite Spaces [7.373617024876726]
デジタルコンピュータ上での学習モデルに適した一般化の族を$c_m/N1/ (2vee m)_m=1infty$とする。
パラメータ $m$ を$N$ に従って調整すると、実用的なサンプルサイズに対するより厳密な一般化境界が$N$ となる。
一般化境界の族は、有限距離空間における測度集中に対する新しい非漸近結果に基づいて定式化される。
論文 参考訳(メタデータ) (2024-02-08T11:23:11Z) - Generalization and Stability of Interpolating Neural Networks with
Minimal Width [37.908159361149835]
補間系における勾配によって訓練された浅層ニューラルネットワークの一般化と最適化について検討する。
トレーニング損失数は$m=Omega(log4 (n))$ニューロンとニューロンを最小化する。
m=Omega(log4 (n))$のニューロンと$Tapprox n$で、テスト損失のトレーニングを$tildeO (1/)$に制限します。
論文 参考訳(メタデータ) (2023-02-18T05:06:15Z) - Improved techniques for deterministic l2 robustness [63.34032156196848]
畳み込みニューラルネットワーク(CNN)を$l_2$ノルムの下で厳密な1-Lipschitz制約で訓練することは、対向的堅牢性、解釈可能な勾配、安定した訓練に有用である。
我々は,最後の線形層を1重層に置き換えることで,1-Lipschitz CNNのロバスト性を証明する手法を提案する。
我々は,CIFAR-10およびCIFAR-100における標準および証明可能な堅牢な精度の最先端化を図る。
論文 参考訳(メタデータ) (2022-11-15T19:10:12Z) - Towards an Understanding of Benign Overfitting in Neural Networks [104.2956323934544]
現代の機械学習モデルは、しばしば膨大な数のパラメータを使用し、通常、トレーニング損失がゼロになるように最適化されている。
ニューラルネットワークの2層構成において、これらの良質な過適合現象がどのように起こるかを検討する。
本稿では,2層型ReLUネットワーク補間器を極小最適学習率で実現可能であることを示す。
論文 参考訳(メタデータ) (2021-06-06T19:08:53Z) - Robust Implicit Networks via Non-Euclidean Contractions [63.91638306025768]
暗黙のニューラルネットワークは、精度の向上とメモリ消費の大幅な削減を示す。
彼らは不利な姿勢と収束の不安定さに悩まされる。
本論文は,ニューラルネットワークを高機能かつ頑健に設計するための新しい枠組みを提供する。
論文 参考訳(メタデータ) (2021-06-06T18:05:02Z) - A New Framework for Variance-Reduced Hamiltonian Monte Carlo [88.84622104944503]
分散還元型ハミルトン・モンテカルロ法 (HMC) の新たなフレームワークを提案し,$L$-smooth および $m$-strongly log-concave 分布からサンプリングする。
本研究では,SAGA法やSVRG法をベースとした非バイアス勾配推定器を用いて,バッチサイズを小さくすることで,高い勾配効率が得られることを示す。
総合的および実世界のベンチマークデータによる実験結果から、我々の新しいフレームワークは、完全な勾配と勾配HMCアプローチを著しく上回っていることが示された。
論文 参考訳(メタデータ) (2021-02-09T02:44:24Z) - NeCPD: An Online Tensor Decomposition with Optimal Stochastic Gradient
Descent [1.0953917735844645]
マルチウェイオンラインデータに基づく$(N)Nにおける非効率的な問題に対して,NeCPDという新しい効率的な分解アルゴリズムを提案する。
さらに,本手法を構造的データセットを用いた実生活モニタリングの分野に適用する。
論文 参考訳(メタデータ) (2020-03-18T04:44:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。