論文の概要: Newton-Puiseux Analysis for Interpretability and Calibration of Complex-Valued Neural Networks
- arxiv url: http://arxiv.org/abs/2504.19176v2
- Date: Mon, 13 Oct 2025 20:27:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-15 14:23:56.733955
- Title: Newton-Puiseux Analysis for Interpretability and Calibration of Complex-Valued Neural Networks
- Title(参考訳): 複素値ニューラルネットワークの解釈可能性と校正のためのNewton-Puiseux解析
- Authors: Piotr Migus,
- Abstract要約: 複雑なニューラルネットワーク(CVNN)は、心電図(ECG)、レーダー/ソナー、無線の位相/四分法(I/Q)ストリームなどの位相感受性信号を扱うのに適している。
訓練されたCVNNの局所的決定幾何を,小型のキンク対応サロゲートに適合させて検討するNewton-Puiseuxフレームワークを提案する。
我々のフェーズアウェア分析は、制御された$C2$合成ベンチマークを超える2つのケーススタディにおいて、センシティブな方向を特定し、予測エラーを強化する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Complex-valued neural networks (CVNNs) are particularly suitable for handling phase-sensitive signals, including electrocardiography (ECG), radar/sonar, and wireless in-phase/quadrature (I/Q) streams. Nevertheless, their \emph{interpretability} and \emph{probability calibration} remain insufficiently investigated. In this work, we present a Newton--Puiseux framework that examines the \emph{local decision geometry} of a trained CVNN by (i) fitting a small, kink-aware polynomial surrogate to the \emph{logit difference} in the vicinity of uncertain inputs, and (ii) factorizing this surrogate using Newton--Puiseux expansions to derive analytic branch descriptors, including exponents, multiplicities, and orientations. These descriptors provide phase-aligned directions that induce class flips in the original network and allow for a straightforward, \emph{multiplicity-guided} temperature adjustment for improved calibration. We outline assumptions and diagnostic measures under which the surrogate proves informative and characterize potential failure modes arising from piecewise-holomorphic activations (e.g., modReLU). Our phase-aware analysis identifies sensitive directions and enhances Expected Calibration Error in two case studies beyond a controlled $\C^2$ synthetic benchmark -- namely, the MIT--BIH arrhythmia (ECG) dataset and RadioML 2016.10a (wireless modulation) -- when compared to uncalibrated softmax and standard post-hoc baselines. We also present confidence intervals, non-parametric tests, and quantify sensitivity to inaccuracies in estimating branch multiplicity. Crucially, this method requires no modifications to the architecture and applies to any CVNN with complex logits transformed to real moduli.
- Abstract(参考訳): 複雑評価ニューラルネットワーク(CVNN)は、特に、心電図(ECG)、レーダー/ソナー、無線位相/四分法(I/Q)ストリームなどの位相感受性信号を扱うのに適している。
それでも、それらの「emph{interpretability」と「emph{probability calibration」は十分に研究されていない。
本稿では,訓練されたCVNNのemph{local decision geometry}を検証したNewton-Puiseuxフレームワークを提案する。
(i)不確実な入力の近傍で「emph{logit difference}」を代用する、小さい、キンク対応多項式
(II)Newton-Puiseux展開を用いてこのサロゲートを分解し、指数、乗法、配向を含む解析分岐記述子を導出する。
これらの記述子は、元のネットワークでクラスフリップを誘導し、キャリブレーションを改善するための簡単な温度調整を可能にする位相整列方向を提供する。
本稿では,一方向の正則な活性化(例えばmodReLU)から生じる潜在的な障害モードを,サロゲートが情報的かつ特性的に証明する仮定と診断方法について概説する。
我々のフェーズアウェア分析は、制御された$\C^2$の合成ベンチマーク、すなわちMIT--BIH arrhythmia(ECG)データセットとRadioML 2016.10a(無線変調)の2つのケーススタディにおいて、非校正ソフトマックスや標準ポストホックベースラインと比較して、センシティブな方向を認識し、期待される校正誤差を高める。
また、信頼区間、非パラメトリックテストを示し、分岐乗法の推定における不正確性に対する感度を定量化する。
重要なことに、この手法はアーキテクチャの変更を一切必要とせず、複雑なロジットを実際のモジュライに変換するCVNNに適用する。
関連論文リスト
- Equivariant Evidential Deep Learning for Interatomic Potentials [55.6997213490859]
不確かさの定量化は、分子動力学シミュレーションにおける機械学習の原子間ポテンシャルの信頼性を評価するために重要である。
既存のMLIPのUQアプローチは、高い計算コストや準最適性能によって制限されることが多い。
我々は,原子間ポテンシャルの定量的深層学習(texte2$IP)を提案する。
論文 参考訳(メタデータ) (2026-02-11T02:00:25Z) - Generalizing GNNs with Tokenized Mixture of Experts [75.8310720413187]
安定性の向上には,変化に敏感な特徴への依存を低減し,既約最悪の一般化フロアを残す必要があることを示す。
本研究では,STEM-GNNを提案する。STEM-GNN,STEM-GNN,STEM-GNN,STEM-GNN,STEM-GNN,STEM-GNN,STEM-GNN,STEM-GNN,STEM-GNN。
9つのノード、リンク、グラフのベンチマークで、STEM-GNNはより強力な3方向バランスを実現し、クリアグラフ上での競争力を維持しながら、次数/ホモフィリーシフトや特徴/エッジの破損に対する堅牢性を改善している。
論文 参考訳(メタデータ) (2026-02-09T22:48:30Z) - From Evaluation to Design: Using Potential Energy Surface Smoothness Metrics to Guide Machine Learning Interatomic Potential Architectures [12.68400434984463]
MLIPは量子ポテンシャルエネルギー表面の物理的滑らかさを再現することができない。
マイクロカノニカル分子動力学のような既存の評価は計算に高価であり、主に近平衡状態を研究する。
MLIPの評価基準を改善するためにBSCT(Band Smoothness Characterization Test)を導入する。
論文 参考訳(メタデータ) (2026-02-04T18:50:10Z) - Micro-Macro Tensor Neural Surrogates for Uncertainty Quantification in Collisional Plasma [3.7863228436382013]
プラズマ方程式は、モデルパラメータとデータに顕微鏡的摂動に対する顕著な感度を示す。
不確実性サンプリングのコスト、高次元位相空間、マルチスケール剛性は、計算効率とエラー制御の両方に深刻な課題をもたらす。
ランダウ衝突項のコスト評価をニューラルネットワークが代用するUQのための分散還元モンテカルロフレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-30T13:07:35Z) - Ising on the donut: Regimes of topological quantum error correction from statistical mechanics [0.0]
ユーティリティスケールの量子コンピュータは、論理的誤り率を十分に低くするために、大量の物理量子ビットを持つ量子エラー訂正符号を必要とする。
ここでは、ビットフリップ雑音下でのトーラス符号から、トーラス上の正確に解ける2次元イジングモデルに対して、シンドロームフリーで選択されたトーラス符号の正確なマッピングを利用して、論理的故障率の解析解を導出する。
論文 参考訳(メタデータ) (2025-12-11T08:06:23Z) - Deterministic Coreset Construction via Adaptive Sensitivity Trimming [0.2864713389096699]
実証的リスク最小化のための決定論的コアセット構築のためのフレームワークを開発する。
我々の中心的な貢献は、適応決定論的一様重みトリミング(ADUWT)アルゴリズムである。
我々は,インスタンス最適オラクル,決定論的ストリーミング,公平性に制約されたEMMについて,オープンな問題で結論付けた。
論文 参考訳(メタデータ) (2025-08-25T17:19:13Z) - Non-Hermitian Quantum Metrology Enhancement and Skin Effect Suppression in PT-Symmetric Bardeen-Cooper-Schrieffer Chains [0.0]
非エルミート系における量子力学の理論的枠組みを概説する。
生物直交的な量子フィッシャー情報解析により、2つの異なる形態を同定する。
NHSEは指数関数的に感度を抑えるが、$mathcalPT$-symmetricはハイゼンベルク制限の強化を可能にする。
論文 参考訳(メタデータ) (2025-08-06T18:54:45Z) - Decentralized Nonconvex Composite Federated Learning with Gradient Tracking and Momentum [78.27945336558987]
分散サーバ(DFL)はクライアント・クライアント・アーキテクチャへの依存をなくす。
非滑らかな正規化はしばしば機械学習タスクに組み込まれる。
本稿では,これらの問題を解決する新しいDNCFLアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-04-17T08:32:25Z) - Approximation Bounds for Transformer Networks with Application to Regression [9.549045683389085]
H"older 関数と Sobolev 関数に対する Transformer ネットワークの近似機能について検討する。
シーケンス・ツー・シーケンス・マッピングを近似した標準トランスフォーマー・ネットワークのための新しい上限を確立する。
トランスフォーマーの自己アテンション層がカラム平均化を行うことができれば,ネットワークはシーケンス・ツー・シーケンスのH"older関数を近似することができることを示す。
論文 参考訳(メタデータ) (2025-04-16T15:25:58Z) - Uncertainty Quantification From Scaling Laws in Deep Neural Networks [0.0]
機械学習の分析から不確かさを定量化することは、物理科学での使用に不可欠である。
平均$mu_mathcalL$と分散$sigma_mathcalL$を多層パーセプトロンのアンサンブルとして計算する。
我々は、MNIST分類、CIFAR分類、カロリーメータエネルギー回帰の3つの課題について、有限幅ネットワークの結果と経験的に比較した。
論文 参考訳(メタデータ) (2025-03-07T21:15:11Z) - Rao-Blackwell Gradient Estimators for Equivariant Denoising Diffusion [55.95767828747407]
分子やタンパク質の生成のようなドメインでは、物理系はモデルにとって重要な固有の対称性を示す。
学習のばらつきを低減し、確率的に低い分散勾配推定器を提供するフレームワークを提案する。
また,軌道拡散法(Orbit Diffusion)と呼ばれる手法を用いて,損失とサンプリングの手順を取り入れた推定器の実用的実装を提案する。
論文 参考訳(メタデータ) (2025-02-14T03:26:57Z) - Theoretical limits of descending $\ell_0$ sparse-regression ML algorithms [0.0]
本研究では,emphmaximum-likelihood (ML)デコーディングの性能解析プログラムを開発した。
ML性能パラメータの鍵となるのは、残留エンフェロ平均二乗誤差(textbfRMSE$)を発見し、いわゆるエンフェロ遷移(PT)現象を示す。
Fl RDTの具体的実装と実用的妥当性は、典型的には、基礎となる数値評価のサイズのセットを実行する能力に依存している。
論文 参考訳(メタデータ) (2024-10-10T06:33:41Z) - Learning with Norm Constrained, Over-parameterized, Two-layer Neural Networks [54.177130905659155]
近年の研究では、再生カーネルヒルベルト空間(RKHS)がニューラルネットワークによる関数のモデル化に適した空間ではないことが示されている。
本稿では,有界ノルムを持つオーバーパラメータ化された2層ニューラルネットワークに適した関数空間について検討する。
論文 参考訳(メタデータ) (2024-04-29T15:04:07Z) - Risk Bounds for Mixture Density Estimation on Compact Domains via the $h$-Lifted Kullback--Leibler Divergence [2.8074364079901017]
標準KL分散の一般化として、$h$-lifted Kullback--Leibler(KL)分散を導入する。
我々は、対応する最大$h$-lifted chance 推定器の計算手順を開発する。
論文 参考訳(メタデータ) (2024-04-19T02:31:34Z) - Tighter Learning Guarantees on Digital Computers via Concentration of Measure on Finite Spaces [7.373617024876726]
デジタルコンピュータ上での学習モデルに適した一般化の族を$c_m/N1/ (2vee m)_m=1infty$とする。
パラメータ $m$ を$N$ に従って調整すると、実用的なサンプルサイズに対するより厳密な一般化境界が$N$ となる。
一般化境界の族は、有限距離空間における測度集中に対する新しい非漸近結果に基づいて定式化される。
論文 参考訳(メタデータ) (2024-02-08T11:23:11Z) - Last-Iterate Convergence of Adaptive Riemannian Gradient Descent for Equilibrium Computation [52.73824786627612]
本稿では,テクスト幾何学的強単調ゲームに対する新たな収束結果を確立する。
我々のキーとなる結果は、RGDがテクスト幾何学的手法で最終定位線形収束を実現することを示しています。
全体として、ユークリッド設定を超えるゲームに対して、幾何学的に非依存な最終点収束解析を初めて提示する。
論文 参考訳(メタデータ) (2023-06-29T01:20:44Z) - Generalization and Stability of Interpolating Neural Networks with
Minimal Width [37.908159361149835]
補間系における勾配によって訓練された浅層ニューラルネットワークの一般化と最適化について検討する。
トレーニング損失数は$m=Omega(log4 (n))$ニューロンとニューロンを最小化する。
m=Omega(log4 (n))$のニューロンと$Tapprox n$で、テスト損失のトレーニングを$tildeO (1/)$に制限します。
論文 参考訳(メタデータ) (2023-02-18T05:06:15Z) - Improved techniques for deterministic l2 robustness [63.34032156196848]
畳み込みニューラルネットワーク(CNN)を$l_2$ノルムの下で厳密な1-Lipschitz制約で訓練することは、対向的堅牢性、解釈可能な勾配、安定した訓練に有用である。
我々は,最後の線形層を1重層に置き換えることで,1-Lipschitz CNNのロバスト性を証明する手法を提案する。
我々は,CIFAR-10およびCIFAR-100における標準および証明可能な堅牢な精度の最先端化を図る。
論文 参考訳(メタデータ) (2022-11-15T19:10:12Z) - Tunable Complexity Benchmarks for Evaluating Physics-Informed Neural
Networks on Coupled Ordinary Differential Equations [64.78260098263489]
本研究では,より複雑に結合した常微分方程式(ODE)を解く物理インフォームドニューラルネットワーク(PINN)の能力を評価する。
PINNの複雑性が増大するにつれて,これらのベンチマークに対する正しい解が得られないことが示される。
PINN損失のラプラシアンは,ネットワーク容量の不足,ODEの条件の低下,局所曲率の高さなど,いくつかの理由を明らかにした。
論文 参考訳(メタデータ) (2022-10-14T15:01:32Z) - Deep subspace encoders for continuous-time state-space identification [0.0]
連続時間(CT)モデルは、学習中にサンプル効率が改善されている。
マルチフェイスCT状態空間モデル同定問題はまだ完全に解決されていない。
本稿では,これらの側面を含む新しい評価手法を提案する。
論文 参考訳(メタデータ) (2022-04-20T11:55:17Z) - Towards an Understanding of Benign Overfitting in Neural Networks [104.2956323934544]
現代の機械学習モデルは、しばしば膨大な数のパラメータを使用し、通常、トレーニング損失がゼロになるように最適化されている。
ニューラルネットワークの2層構成において、これらの良質な過適合現象がどのように起こるかを検討する。
本稿では,2層型ReLUネットワーク補間器を極小最適学習率で実現可能であることを示す。
論文 参考訳(メタデータ) (2021-06-06T19:08:53Z) - Robust Implicit Networks via Non-Euclidean Contractions [63.91638306025768]
暗黙のニューラルネットワークは、精度の向上とメモリ消費の大幅な削減を示す。
彼らは不利な姿勢と収束の不安定さに悩まされる。
本論文は,ニューラルネットワークを高機能かつ頑健に設計するための新しい枠組みを提供する。
論文 参考訳(メタデータ) (2021-06-06T18:05:02Z) - A New Framework for Variance-Reduced Hamiltonian Monte Carlo [88.84622104944503]
分散還元型ハミルトン・モンテカルロ法 (HMC) の新たなフレームワークを提案し,$L$-smooth および $m$-strongly log-concave 分布からサンプリングする。
本研究では,SAGA法やSVRG法をベースとした非バイアス勾配推定器を用いて,バッチサイズを小さくすることで,高い勾配効率が得られることを示す。
総合的および実世界のベンチマークデータによる実験結果から、我々の新しいフレームワークは、完全な勾配と勾配HMCアプローチを著しく上回っていることが示された。
論文 参考訳(メタデータ) (2021-02-09T02:44:24Z) - NeCPD: An Online Tensor Decomposition with Optimal Stochastic Gradient
Descent [1.0953917735844645]
マルチウェイオンラインデータに基づく$(N)Nにおける非効率的な問題に対して,NeCPDという新しい効率的な分解アルゴリズムを提案する。
さらに,本手法を構造的データセットを用いた実生活モニタリングの分野に適用する。
論文 参考訳(メタデータ) (2020-03-18T04:44:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。