論文の概要: Tensor-Augmented Convolutional Neural Networks: Enhancing Expressivity with Generic Tensor Kernels
- arxiv url: http://arxiv.org/abs/2604.08072v1
- Date: Thu, 09 Apr 2026 10:44:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.866379
- Title: Tensor-Augmented Convolutional Neural Networks: Enhancing Expressivity with Generic Tensor Kernels
- Title(参考訳): テンソル強化畳み込みニューラルネットワーク:ジェネリックテンソルカーネルによる表現性向上
- Authors: Chia-Wei Hsing, Wei-Lin Tu,
- Abstract要約: 畳み込みニューラルネットワーク(CNN)は、局所的な特徴を階層的に抽出することに優れていますが、複雑な相関を捉えたパフォーマンスは、深いアーキテクチャに大きく依存しています。
テンソル付加CNN(TACNN)を用いた物理誘導浅部モデルを提案する。
我々の設計では、各層の畳み込み出力は高次特徴相関を捉えることができる多線形形式となる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Convolutional Neural Networks (CNNs) excel at extracting local features hierarchically, but their performance in capturing complex correlations hinges heavily on deep architectures, which are usually computationally demanding and difficult to interpret. To address these issues, we propose a physically-guided shallow model: tensor-augmented CNN (TACNN), which replaces conventional convolution kernels with generic tensors to enhance representational capacity. This choice is motivated by the fact that an order-$N$ tensor naturally encodes an arbitrary quantum superposition state in the Hilbert space of dimension $d^N$, where $d$ is the local physical dimension, thus offering substantially richer expressivity. Furthermore, in our design the convolution output of each layer becomes a multilinear form capable of capturing high-order feature correlations, thereby equipping a shallow multilayer architecture with an expressive power competitive to that of deep CNNs. On the Fashion-MNIST benchmark, TACNN demonstrates clear advantages over conventional CNNs, achieving remarkable accuracies with only a few layers. In particular, a TACNN with only two convolution layers attains a test accuracy of 93.7$\%$, surpassing or matching considerably deeper models such as VGG-16 (93.5$\%$) and GoogLeNet (93.7$\%$). These findings highlight TACNN as a promising framework that strengthens model expressivity while preserving architectural simplicity, paving the way towards more interpretable and efficient deep learning models.
- Abstract(参考訳): 畳み込みニューラルネットワーク(CNN)は、局所的な特徴を階層的に抽出することに優れていますが、複雑な相関を捉えたパフォーマンスは深いアーキテクチャに大きく依存しています。
これらの問題に対処するために,従来の畳み込みカーネルを一般的なテンソルに置き換えて表現能力を高めるテンソル拡張CNN(TACNN)を提案する。
この選択は、オーダー$N$テンソルが自然に次元$d^N$のヒルベルト空間の任意の量子重ね合わせ状態を符号化するという事実によって動機づけられる。
さらに,本設計では,各層の畳み込み出力が高次特徴相関を捕捉し,深層CNNと競合する表現力を持つ浅層多層構造を具備するマルチ線形形式となる。
Fashion-MNISTベンチマークでは、TACNNは従来のCNNよりも明確なアドバンテージを示し、わずか数層で顕著な精度を実現している。
特に、2つの畳み込み層しか持たないTACNNは、VGG-16 (93.5$\%$) や GoogLeNet (93.7$\%$) といったかなり深いモデルを上回る、または一致するテスト精度が93.7$\%$に達する。
これらの知見は、TACNNを、アーキテクチャの単純さを維持しながらモデル表現性を強化し、より解釈可能で効率的なディープラーニングモデルへの道を開く、有望なフレームワークとして強調する。
関連論文リスト
- M$^2$RNN: Non-Linear RNNs with Matrix-Valued States for Scalable Language Modeling [53.351103753419046]
本稿では,行列値の隠蔽状態と表現的非線形状態遷移を持つアーキテクチャであるMatrix-to-Matrix RNNを紹介する。
非線形RNNの言語モデリング性能は,その状態サイズによって制限されていることを示す。
また、状態サイズ拡大機構がテンソルコアの効率的な利用を可能にすることを示す。
論文 参考訳(メタデータ) (2026-03-15T12:53:09Z) - S$^2$NN: Sub-bit Spiking Neural Networks [53.08060832135342]
スパイキングニューラルネットワーク(SNN)は、マシンインテリジェンスにエネルギー効率のよいパラダイムを提供する。
最近のバイナリSNNの進歩にもかかわらず、大規模ネットワークではストレージと計算の要求が相当に大きい。
1ビット未満の重みを表すサブビットスパイキングニューラルネットワーク(S$2$NNs)を提案する。
論文 参考訳(メタデータ) (2025-09-29T04:17:44Z) - Convexified Message-Passing Graph Neural Networks [12.350115354262947]
CGNN(Convexified Message Passing Graph Neural Networks)を導入する。
非線形ヒルベルトカーネルトレーニングを凸最適化問題にマッピングすることにより、CGNNは凸最適化問題に変換する。
実験ベンチマークデータセットは、CGNNが主要なGNNモデルの性能を大幅に上回っていることを示している。
論文 参考訳(メタデータ) (2025-05-23T18:33:01Z) - Compositionality Unlocks Deep Interpretable Models [0.5437298646956507]
$chi$-netは、テンソルネットワークの合成多線形構造とディープニューラルネットワークの表現性と効率を組み合わせた、本質的に解釈可能なアーキテクチャである。
論文 参考訳(メタデータ) (2025-04-03T15:07:54Z) - Unveiling the Unseen: Identifiable Clusters in Trained Depthwise
Convolutional Kernels [56.69755544814834]
深部分離型畳み込みニューラルネットワーク(DS-CNN)の最近の進歩は、新しいアーキテクチャをもたらす。
本稿では,DS-CNNアーキテクチャのもう一つの顕著な特性を明らかにする。
論文 参考訳(メタデータ) (2024-01-25T19:05:53Z) - MuseGNN: Forming Scalable, Convergent GNN Layers that Minimize a Sampling-Based Energy [27.328628715885287]
グラフニューラルネットワーク(GNN)アーキテクチャは、クロスインスタンス関係でデータをモデル化することができる。
このアーキテクチャの重要なサブクラスは、フォワードパスが関心のグラフ正規化エネルギー関数を反復的に還元するように設計された層を含む。
本稿では, ある設定における収束保証によって導かれる, サンプリングベースエネルギー関数と拡張性のあるGNN層を反復的に削減する手法を提案する。
また、これらの設計に基づいて完全なGNNアーキテクチャをインスタンス化し、1TBを超える最大公用ノード分類ベンチマークに適用した場合の競合精度とスケーラビリティを実現する。
論文 参考訳(メタデータ) (2023-10-19T04:30:14Z) - Contextualizing MLP-Mixers Spatiotemporally for Urban Data Forecast at Scale [54.15522908057831]
本稿では,STTD予測を大規模に行うためのコンピュータ・ミクサーの適応版を提案する。
我々の結果は、この単純な効率の良いソリューションが、いくつかのトラフィックベンチマークでテストした場合、SOTAベースラインに匹敵する可能性があることを驚くほど示している。
本研究は, 実世界のSTTD予測において, 簡便な有効モデルの探索に寄与する。
論文 参考訳(メタデータ) (2023-07-04T05:19:19Z) - Deep Architecture Connectivity Matters for Its Convergence: A
Fine-Grained Analysis [94.64007376939735]
我々は、勾配降下訓練におけるディープニューラルネットワーク(DNN)の収束に対する接続パターンの影響を理論的に特徴づける。
接続パターンの単純なフィルタリングによって、評価対象のモデルの数を削減できることが示される。
論文 参考訳(メタデータ) (2022-05-11T17:43:54Z) - Block-term Tensor Neural Networks [29.442026567710435]
ブロック終端テンソル層(BT層)は,CNNやRNNなどのニューラルネットワークモデルに容易に適用可能であることを示す。
CNNとRNNのBT層は、元のDNNの表現力を維持したり改善したりしながら、パラメータ数に対して非常に大きな圧縮比を達成することができる。
論文 参考訳(メタデータ) (2020-10-10T09:58:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。