論文の概要: Expressivity of congruence-based architectures for DNNs on positive-definite matrices
- arxiv url: http://arxiv.org/abs/2606.02490v1
- Date: Mon, 01 Jun 2026 17:01:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:32.520993
- Title: Expressivity of congruence-based architectures for DNNs on positive-definite matrices
- Title(参考訳): 正定値行列上のDNNの合同アーキテクチャの表現性
- Authors: Antonin Oswald, Estelle Massart,
- Abstract要約: 入力行列が左右に(おそらく長方形の)重み行列によって乗算される合同のような層とその変換に着目する。
このような層は祝福されたSPDNetの中核にあり、また正定値データの次元的削減にも独立して利用されている。
W$に課される(半)直交性制約は、これらの層の表現性を制限していることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This work studies neural architectures for classifying symmetric positive-definite matrices, focusing on congruence-like layers, in which the input matrix is multiplied on the left and right by a (possibly rectangular) weight matrix $W$ and its transpose. Such layers lie at the core of the celebrated SPDNet and have also been employed independently for dimensionality reduction on positive-definite data. We show that the (semi)-orthogonality constraint commonly imposed on $W$ limits the expressivity of these layers: for certain activation functions, the resulting architecture collapses to a one-hidden-layer equivalent. This lack of expressivity follows from a loss of spectral diversity in congruence-like layers for semi-orthogonal $W$ and is a direct consequence of Poincaré's separation theorem. We then examine the choice of the final classifier, comparing several Riemannian classifiers and discussing their compatibility with the feature maps produced by congruence-like layers.
- Abstract(参考訳): この研究は、対称正定行列を分類するためのニューラルネットワークアーキテクチャの研究であり、入力行列を(おそらく長方形の)重み行列$W$とその変換によって左右に乗算する合同のような層に焦点を当てている。
このような層は祝福されたSPDNetの中核にあり、また正定値データの次元的削減にも独立して利用されている。
W$ に課される(半)直交性の制約がこれらの層の表現性を制限することを示し、ある活性化関数に対して、結果として生じるアーキテクチャは1つの階層の同値に崩壊する。
この表現力の欠如は、半直交$W$に対する合同のような層におけるスペクトルの多様性の欠如によるものであり、ポアンカレの分離定理の直接的な結果である。
次に、最終分類器の選択を検討し、いくつかのリーマン分類器を比較し、合同的な層によって生成される特徴写像との整合性について議論する。
関連論文リスト
- Riemannian Networks over Full-Rank Correlation Matrices [102.84784139051526]
フルランク相関行列は対称正定値多様体(SPD)の正規化された代替である。
我々はこれらのジオメトリに、MLR(Multinomial Logistic Regression)、FC(Fully Connected)、畳み込み層を含む基本層を拡張した。
また、2つの相関ジオメトリの正確なバックプロパゲーション法を提案する。
論文 参考訳(メタデータ) (2026-05-18T19:54:55Z) - Structured Linear CDEs: Maximally Expressive and Parallel-in-Time Sequence Models [15.650005330621148]
本研究は、構造線形制御微分方程式(SLiCE)を導入する。
これは、構造化された入力依存状態遷移行列を持つシーケンスモデルの統一フレームワークである。
SLiCE はブロック対角行列、スパース行列、ウォルシュ・アダマール行列を用いる。
論文 参考訳(メタデータ) (2025-05-23T11:34:21Z) - Understanding Matrix Function Normalizations in Covariance Pooling through the Lens of Riemannian Geometry [63.694184882697435]
グローバル共分散プーリング(GCP)は、高レベルの表現の2階統計を利用して、ディープニューラルネットワーク(DNN)の性能を向上させることが実証されている。
本稿では、リーマン幾何学の観点から行列対数とパワーの包括的かつ統一的な理解を提供する。
論文 参考訳(メタデータ) (2024-07-15T07:11:44Z) - Unfolding Projection-free SDP Relaxation of Binary Graph Classifier via
GDPA Linearization [59.87663954467815]
アルゴリズムの展開は、モデルベースのアルゴリズムの各イテレーションをニューラルネットワーク層として実装することにより、解釈可能で類似のニューラルネットワークアーキテクチャを生成する。
本稿では、Gershgorin disc perfect alignment (GDPA)と呼ばれる最近の線形代数定理を利用して、二進グラフの半定値プログラミング緩和(SDR)のためのプロジェクションフリーアルゴリズムをアンロールする。
実験結果から,我々の未学習ネットワークは純粋モデルベースグラフ分類器よりも優れ,純粋データ駆動ネットワークに匹敵する性能を示したが,パラメータははるかに少なかった。
論文 参考訳(メタデータ) (2021-09-10T07:01:15Z) - Orthogonalizing Convolutional Layers with the Cayley Transform [83.73855414030646]
直交に制約された畳み込み層をパラメータ化するための代替手法を提案し,評価する。
本手法は,大規模畳み込みにおいても直交性が高次に保たれることを示す。
論文 参考訳(メタデータ) (2021-04-14T23:54:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。