論文の概要: Architecture Shape Governs QNN Trainability: Jacobian Null Space Growth and Parameter Efficiency
- arxiv url: http://arxiv.org/abs/2605.05942v1
- Date: Thu, 07 May 2026 09:52:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.674911
- Title: Architecture Shape Governs QNN Trainability: Jacobian Null Space Growth and Parameter Efficiency
- Title(参考訳): アーキテクチャシェイプゲーバーQNNトレーサビリティ:Jacobian Null空間成長とパラメータ効率
- Authors: Michael Poppel, David Bucher, Maximilian Zorn, Markus Baumann, Sebastian Wölckert, Claudia Linnhoff-Popien, Philipp Altmann, Jonas Stein,
- Abstract要約: トレーニング容易性はアーキテクチャ形状が$(N,L)$で,固定$E$で大きく変化することを示す。
ヤコビアン$J$と一致する係数の構造的階数不足をその原因となるメカニズムとして同定する。
- 参考スコア(独自算出の注目度): 3.1094222618006664
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Variational quantum circuits with angle encoding implement truncated Fourier series, and architectures arranging $N$ qubits with $L$ encoding layers each -- sharing encoding budget $E = NL$ -- generate identical frequency spectra, identical frequency redundancy, and require the same minimum parameter count for coefficient control. Despite this equivalence, trainability varies substantially with architecture shape $(N,L)$ at fixed $E$. We identify structural rank deficiency of the coefficient matching Jacobian $J$ as the mechanism responsible. For serial single-qubit architectures, we prove $\mathrm{rank}(J) \leq 2L+1$ regardless of parameter count $P$, with $\dim(\ker J) \geq P-(2L+1)$ growing without bound -- a phenomenon we term \emph{structural gradient starvation}: a growing fraction of parameters become structurally decoupled from the loss as $P$ increases at fixed $L$. Parallel architectures avoid this via independent phase trajectories, ensuring $σ_{\min}(J^{(\mathrm{par})}) > 0$ generically for $P \leq 2E+1$, so no parameter lies in $\ker J$. For practitioners, we further show that the two natural routes to increasing parameter count have fundamentally different effects: adding feature map (FM) layers monotonically strengthens the Jacobian QFIM eigenvalue spectrum and achieves $R^2 \geq 0.95$ with $1.6$--$2.2\times$ fewer parameters than adding trainable blocks across all tested architectures, while trainable blocks improve training only through the classical interpolation mechanism with no quantum-specific benefit.
- Abstract(参考訳): アングルエンコーディングを持つ変分量子回路は、トランケートされたフーリエ級数を実装し、アーキテクチャは、それぞれ$N$ qubitsと$L$エンコーディング層を配置する -- 共有エンコーディング予算$E = NL$ -- は、同一周波数スペクトル、同一周波数冗長性を生成し、係数制御のために同じ最小パラメータカウントを必要とする。
この等価性にもかかわらず、トレーニング容易性はアーキテクチャ形状が$(N,L)$で固定$E$で大きく変化する。
ヤコビアン$J$と一致する係数の構造的階数不足をその原因となるメカニズムとして同定する。
連続的なシングルキュービットアーキテクチャの場合、$\mathrm{rank}(J) \leq 2L+1$ はパラメータ数によらず$P$ を証明します。 $\dim(\ker J) \geq P-(2L+1)$ 境界のない成長 -- a phenomenon we term \emph{structureural gradient starvation}: パラメータの増大分は損失から構造的に分離されます。
関連論文リスト
- Two Layers, No Swaps: Biplanar SPOQC Architecture Improves Runtime of Fermi-Hubbard Simulation [0.0]
二平面スピン光学量子コンピューティングアーキテクチャ上での2次元フェルミ・ハバードモデルのシミュレーションコストを推定する。
各平面内における格子手術とマジック状態準備のベンチマークを行った。
フォールバックに基づく回転合成法はスケーラビリティのボトルネックとなる。
論文 参考訳(メタデータ) (2026-05-06T18:00:09Z) - Efficient Complex-Valued State Preparation on Bucket Brigade QRAM [47.72095699729477]
効率的な量子状態準備は、大規模な古典的データを処理する量子アルゴリズムにおいて重要な要素である。
同じアーキテクチャ・アウェア・フレームワークで2つの改善点を提示します。
論文 参考訳(メタデータ) (2026-04-28T13:43:29Z) - On the complexity of quantum numerical integration: an angle-structure characterization [1.376408511310322]
量子振幅推定(QAE)による$[0,1]$の数値積分について検討し,振幅オラクルの構築コストに着目した。
格子関数クラス $mathcalG_n(d)$ の階層を導入し、角写像 $_g:0,1nto[0,]$ を最大$d$ の次数として定義する。
$d=1$の場合、これは$O(varepsilon-1log(1/varepsilon))$となり、古典的なモンテカルロを$geで改善する。
論文 参考訳(メタデータ) (2026-04-27T10:23:24Z) - Inter-Layer Hessian Analysis of Neural Networks with DAG Architectures [45.88028371034407]
現代の自動微分フレームワーク(JAX, PyTorch)は、層間相互作用の内部構造を公開することなく、損失関数のヘシアンをモノリシックテンソルとして返す。
この理論解析は、経験的ネットワークとスキップスキップ時の接続における共鳴の指数的減衰を説明する。
論文 参考訳(メタデータ) (2026-04-13T15:48:41Z) - Optimal Decay Spectra for Linear Recurrences [6.508284558109273]
PoSTは任意の対角線再帰をオーバーヘッドなく統合する。
Mamba RWKV-7、Gated DeltaNet、Gated Linear Attention、RetNetでインスタンス化します。
論文 参考訳(メタデータ) (2026-04-08T23:54:57Z) - An Information-Minimal Geometry for Qubit-Efficient Optimization [0.0]
量子ビット効率の最適化を幾何学的問題として再検討する。
局所一貫性問題は、Sherali-Adams level-2 polytope $mathrmSA(2)$とちょうど一致する。
論文 参考訳(メタデータ) (2025-11-11T15:38:57Z) - Proving the Limited Scalability of Centralized Distributed Optimization via a New Lower Bound Construction [57.93371273485736]
我々は、すべての労働者が同一の分布にアクセスする均質な(すなわちd.d.)場合であっても、すべての労働者が非バイアス付き境界 LDeltaepsilon2,$$$$$ のポリ対数的により良いポリ対数を求める集中型分散学習環境を考える。
論文 参考訳(メタデータ) (2025-06-30T13:27:39Z) - Learning with Norm Constrained, Over-parameterized, Two-layer Neural Networks [54.177130905659155]
近年の研究では、再生カーネルヒルベルト空間(RKHS)がニューラルネットワークによる関数のモデル化に適した空間ではないことが示されている。
本稿では,有界ノルムを持つオーバーパラメータ化された2層ニューラルネットワークに適した関数空間について検討する。
論文 参考訳(メタデータ) (2024-04-29T15:04:07Z) - Towards large-scale quantum optimization solvers with few qubits [59.63282173947468]
我々は、$m=mathcalO(nk)$バイナリ変数を$n$ qubitsだけを使って最適化するために、$k>1$で可変量子ソルバを導入する。
我々は,特定の量子ビット効率の符号化が,バレン高原の超ポリノミウム緩和を内蔵特徴としてもたらすことを解析的に証明した。
論文 参考訳(メタデータ) (2024-01-17T18:59:38Z) - Precision of quantum simulation of all-to-all coupling in a local
architecture [0.0]
所望の相互作用の値である$J_ij$と2d回路のパラメータの相関関係を求める。
相対誤差が定数$epsilon$であるためには、量子ビット数でn6$になるエネルギースケールが必要である。
我々の証明はシュリーファー・ヴォルフ変換に基づいており、任意のハードウェアに一般化する。
論文 参考訳(メタデータ) (2023-02-05T18:54:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。