論文の概要: When do complex-valued neural networks help? A study of representation, geometry, and optimization
- arxiv url: http://arxiv.org/abs/2605.27673v1
- Date: Tue, 26 May 2026 20:49:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.513978
- Title: When do complex-valued neural networks help? A study of representation, geometry, and optimization
- Title(参考訳): 複素数値ニューラルネットワークはいつ役に立つのか?表現、幾何学、最適化の研究
- Authors: Ashutosh Kumar,
- Abstract要約: 複雑な数値入力だけでは、複雑な算術が学習を改善するかどうかを判断できないことを示す。
合成RFタスク全体において、複素表現は有用であるが、普遍的に優れているものではない。
CVNNは、表現、対称性、最適化に依存している構造的帰納バイアスと見なされる。
- 参考スコア(独自算出の注目度): 1.4935265696074094
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Complex-valued Neural Networks (CVNNs) are often motivated by domains where information is naturally encoded in magnitude and phase. Yet complex-valued inputs alone do not determine when complex arithmetic improves learning: the label signal may lie in amplitude, phase, their coupling, or a symmetry that real-valued models can also represent under suitable coordinates. We study this through a representation-first evaluation of CVNNs against Cartesian real, polar, phase-only, magnitude-only, parameter-matched real, and FLOP-matched real baselines. Across synthetic RF tasks, complex representations are useful but not universally superior. PSK-only tasks favor phase-aware and complex-valued models, QAM-only tasks favor magnitude-based models, mixed PSK+QAM gives only a small complex-valued advantage, and unseen carrier-phase rotations break coordinate-dependent models without augmentation. Similar patterns appear beyond RF: in quantum-wavefunction prediction, momentum is invisible to $|ψ|$ but recoverable from phase, while EEG analytic-signal experiments show that phase locking, amplitude bursts, and phase-amplitude coupling each favor different coordinate views. We also identify a benchmarking artifact on RadioML 2018.01A. Under matched-shared-trial selection, a CReLU complex model exceeds the best real baseline by 22.94 PP; under independent per-family tuning on the same data and 16-trial search space, the gap collapses to 2.46 PP. Gradient analysis traces the inflated gap to high-learning-rate first-step instability in real baselines, while complex parameter coupling distributes the loss signal more robustly. A learning-rate $\times$ activation factorial confirms the failure is primarily hyperparameter-driven. Overall, CVNNs are best viewed as structured inductive biases whose gains depend on representation, symmetry, and optimization, not as universally superior architectures.
- Abstract(参考訳): 複雑評価ニューラルネットワーク(CVNN)は、情報の大きさと位相が自然に符号化される領域によって動機付けられていることが多い。
ラベル信号は振幅、位相、それらの結合、あるいは実数値モデルも適切な座標の下で表現できる対称性にあるかもしれない。
CVNNの表現ファースト評価により,カルテシアン実数,極性,位相のみ,等級のみ,パラメータマッチング実数,FLOP整合実数に対して検討する。
合成RFタスク全体において、複素表現は有用であるが、普遍的に優れているものではない。
PSKのみのタスクは位相認識モデルと複素値モデル、QAMのみのタスクは等級ベースモデル、PSK+QAMの混合は小さな複素値のアドバンテージしか与えず、キャリア・フェーズの回転は増大することなく座標依存のモデルを破る。
量子波動関数予測では運動量は$||$に見えないが位相から回復可能であるのに対し、EEG分析信号実験は位相ロック、振幅バースト、位相振幅結合はそれぞれ異なる座標ビューを好むことを示している。
また、RadioML 2018.01Aでベンチマークアーティファクトを特定します。
一致したShared-trialセレクションの下では、CRELU複合体モデルは22.94 PPで最高の実ベースラインを超え、同じデータと16-trialサーチ空間で独立した家庭ごとのチューニングの下でギャップは2.46 PPに崩壊する。
グラディエント解析は、実際のベースラインにおける高い学習速度の第1ステップ不安定性への膨張したギャップをトレースする一方、複雑なパラメータ結合は損失信号をより堅牢に分散する。
学習レート$\times$Activation Factorialは、障害が主にハイパーパラメータ駆動であることを確認する。
CVNNは一般に優れたアーキテクチャではなく、表現、対称性、最適化に依存する構造的帰納バイアスと見なされる。
関連論文リスト
- Deterministic Mapping of Topological Phases via Autoregressive Exogenous Neural Networks [0.0]
NAR、NARX、NIOという3つの動的ニューラルネットワーク(NN)アーキテクチャが評価されている。
NARXは予測精度に優れており,平均正方形誤差(MSE)は10~27ドルである。
NARXモデルの精度がより高い遅延で崩壊する「複雑パラドックス」を観測する。
論文 参考訳(メタデータ) (2026-05-26T17:11:22Z) - Efficient Adjoint Matching for Fine-tuning Diffusion Models [47.05085426361986]
本研究では,テキストベースドリフトとテキスト端末コストでSOC問題を修正し,トレーニング効率を大幅に向上するEMAを提案する。
EAMはAMよりも最大4倍早く収束し、PickScore、ImageReward、HPSv2.1、CLIPScore、Aestheticsなど様々なメトリクスにマッチするか、超える。
論文 参考訳(メタデータ) (2026-05-12T03:55:12Z) - Neural Precoding in Complex Projective Spaces [39.36151459385294]
ディープラーニングモデルは、チャネル係数から派生した特徴を事前符号化重みから派生したラベルにマッピングするように訓練される。
伝統的に、複素数値チャネルとプリコーダ係数は、実数成分と虚数成分または振幅と位相を用いてパラメータ化される。
本稿では、無線チャネルと重み付き最小二乗誤差(WMMSE)プリコーダベクトルの両方の複素射影空間(CPS)パラメータ化に基づくフレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-08T21:29:26Z) - Is Flow Matching Just Trajectory Replay for Sequential Data? [46.770624059457724]
時系列生成には、フローマッチング(FM)がますます使われている。
一般的な力学構造を学ぶのか、それとも単に効果的な「軌道再生」を行うのかはよく分かっていない。
インプリッドサンプリングは、非パラメトリックなメモリ拡張型連続時間力学系を構成するODEであることを示す。
論文 参考訳(メタデータ) (2026-02-09T06:48:45Z) - Timely Parameter Updating in Over-the-Air Federated Learning [45.5660377179285]
我々は,各通信ラウンドにおいて,最も影響のある勾配のサブセットを選択するアルゴリズムであるフレッシュネス・フレッシュネス・mAgnItude awaRe top-k (FAIR-k)を提案する。
本研究では,FAIR-kが新たな(かつ公平な)パラメータの更新を促進し,局所訓練期間を延長することで,全体の訓練効率に大きな影響を及ぼすことなく通信効率を向上させることを示す。
論文 参考訳(メタデータ) (2025-12-22T07:18:13Z) - Towards Generalized Synapse Detection Across Invertebrate Species [0.07999703756441755]
SimpSynはシングルステージのResidual U-Netで、シナプス前および後における二重チャネルの球面の予測を訓練している。
F1スコアのSynfulは、すべてのボリュームで相乗的なサイト検出に優れています。
論文 参考訳(メタデータ) (2025-09-21T11:40:49Z) - Equivariant U-Shaped Neural Operators for the Cahn-Hilliard Phase-Field Model [4.79907962230318]
等価なU字型ニューラル作用素(E-UNO)が過去の力学の短い歴史から位相場変数の進化を学習できることを示す。
対称性とスケール階層を符号化することにより、モデルはより一般化され、トレーニングデータが少なくなり、物理的に一貫したダイナミクスが得られる。
論文 参考訳(メタデータ) (2025-09-01T09:25:31Z) - Understanding Augmentation-based Self-Supervised Representation Learning
via RKHS Approximation and Regression [53.15502562048627]
最近の研究は、自己教師付き学習とグラフラプラシアン作用素のトップ固有空間の近似との関係を構築している。
この研究は、増強に基づく事前訓練の統計的分析に発展する。
論文 参考訳(メタデータ) (2023-06-01T15:18:55Z) - Autoencoder-driven Spiral Representation Learning for Gravitational Wave
Surrogate Modelling [47.081318079190595]
オートエンコーダを用いた経験的係数における基礎構造の存在について検討する。
ニューラルネットワークの第一層として使用される学習可能なパラメータを持つスパイラルモジュールを設計し,入力空間を係数にマッピングする方法を学習する。
スパイラルモジュールは複数のニューラルネットワークアーキテクチャ上で評価され、ベースラインモデルよりも一貫して速度-精度のトレードオフを実現している。
論文 参考訳(メタデータ) (2021-07-09T09:03:08Z) - Kernel and Rich Regimes in Overparametrized Models [69.40899443842443]
過度にパラメータ化された多層ネットワーク上の勾配勾配は、RKHSノルムではないリッチな暗黙バイアスを誘発できることを示す。
また、より複雑な行列分解モデルと多層非線形ネットワークに対して、この遷移を実証的に示す。
論文 参考訳(メタデータ) (2020-02-20T15:43:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。