論文の概要: Directional Non-Commutative Monoidal Embeddings for MNIST
- arxiv url: http://arxiv.org/abs/2506.03472v1
- Date: Wed, 04 Jun 2025 01:07:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-05 21:20:14.097448
- Title: Directional Non-Commutative Monoidal Embeddings for MNIST
- Title(参考訳): MNISTのための指向性非可換なモノイダル埋め込み
- Authors: Mahesh Godavarti,
- Abstract要約: 本報告では, 指向性非可換モノイダル埋め込みフレームワークの実証検証について述べる。
このフレームワークは、次元ごとに異なる非可換作用素を用いて学習可能な合成埋め込みを定義する。
本実験により, 画像データの表現には, 指向性非可換モノイダル埋め込みが有効であることが確認された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We present an empirical validation of the directional non-commutative monoidal embedding framework recently introduced in prior work~\cite{Godavarti2025monoidal}. This framework defines learnable compositional embeddings using distinct non-commutative operators per dimension (axis) that satisfy an interchange law, generalizing classical one-dimensional transforms. Our primary goal is to verify that this framework can effectively model real data by applying it to a controlled, well-understood task: image classification on the MNIST dataset~\cite{lecun1998gradient}. A central hypothesis for why the proposed monoidal embedding works well is that it generalizes the Discrete Fourier Transform (DFT)~\cite{oppenheim1999discrete} by learning task-specific frequency components instead of using fixed basis frequencies. We test this hypothesis by comparing learned monoidal embeddings against fixed DFT-based embeddings on MNIST. The results show that as the embedding dimensionality decreases (e.g., from 32 to 8 to 2), the performance gap between the learned monoidal embeddings and fixed DFT-based embeddings on MNIST grows increasingly large. This comparison is used as an analytic tool to explain why the framework performs well: the learnable embeddings can capture the most discriminative spectral components for the task. Overall, our experiments confirm that directional non-commutative monoidal embeddings are highly effective for representing image data, offering a compact learned representation that retains high task performance. The code used in this work is available at https://github.com/mahesh-godavarti/directional_composition_mnist.
- Abstract(参考訳): 本稿では,最近導入された指向性非可換モノイダル埋め込みフレームワークの実証的検証について述べる。
この枠組みは、古典的な一次元変換を一般化し、交換則を満たす次元(軸)ごとに異なる非可換作用素を用いて学習可能な合成埋め込みを定義する。
我々の第一の目的は、MNISTデータセット~\cite{lecun1998gradient}の画像分類という、制御された、よく理解されたタスクに適用することで、このフレームワークが実データを効果的にモデル化できることを検証することです。
提案されたモノイド埋め込みがうまく機能する理由の主な仮説は、固定基底周波数ではなくタスク固有の周波数成分を学習することによって離散フーリエ変換(DFT)~\cite{oppenheim 1999discrete}を一般化するということである。
我々は,この仮説を,MNIST上の固定DFTベースの埋め込みと比較することにより検証する。
その結果, 埋め込み次元が減少する(例えば, 32~8~2)につれ, 学習したモノイダル埋め込みと固定DFTベースのMNISTへの埋め込みのパフォーマンスギャップが増大することがわかった。
この比較は、フレームワークがなぜうまく機能するかを説明するための分析ツールとして使用され、学習可能な埋め込みはタスクの最も差別的なスペクトル成分をキャプチャすることができる。
本実験では, 画像データの表現に指向性非可換なモノイダル埋め込みが有効であることを確認し, 高いタスク性能を保ったコンパクトな学習表現を提供する。
この作業で使用されるコードはhttps://github.com/mahesh-godavarti/directional_composition_mnistで公開されている。
関連論文リスト
- Relaxed Rotational Equivariance via $G$-Biases in Vision [19.814324876189772]
群同変畳み込み(GConv)は、元のデータから回転同値を取ることができる。
しかし、実世界のデータの提示や分布は、しばしば厳密な回転同値に適合する。
本稿では,G$-Biasesと呼ばれる学習可能なバイアスの集合を利用して,この問題に対処する,単純かつ高効率な手法を提案する。
実験により,提案手法は既存のGConv法と比較して,2次元オブジェクト検出タスクと分類作業の両方において優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2024-08-22T14:52:53Z) - Fast and interpretable Support Vector Classification based on the truncated ANOVA decomposition [0.0]
サポートベクタマシン(SVM)は、散在するデータの分類を行うための重要なツールである。
三角関数やウェーブレットに基づく特徴写像を用いて,SVMを原始形式で解くことを提案する。
論文 参考訳(メタデータ) (2024-02-04T10:27:42Z) - Uncovering Model Processing Strategies with Non-Negative Per-Example Fisher Factorization [44.39409273712917]
我々は,モデルが予測を生成するために使用する戦略を明らかにすることを目的とした解釈可能性手法であるNPEFFを紹介する。
我々は NPEFF コンポーネントが様々な言語モデルやテキスト処理タスクのモデル処理戦略に対応することを実証した。
論文 参考訳(メタデータ) (2023-10-07T02:02:45Z) - Manifold Learning with Sparse Regularised Optimal Transport [1.949927790632678]
実世界のデータセットはノイズの多い観測とサンプリングを受けており、基礎となる多様体に関する情報を蒸留することが大きな課題である。
本稿では,2次正規化を用いた最適輸送の対称版を利用する多様体学習法を提案する。
得られたカーネルは連続的な極限においてLaplace型演算子と整合性を証明し、ヘテロスケダスティックノイズに対する堅牢性を確立し、これらの結果を数値実験で示す。
論文 参考訳(メタデータ) (2023-07-19T08:05:46Z) - Disentanglement via Latent Quantization [60.37109712033694]
本研究では,組織化された潜在空間からの符号化と復号化に向けた帰納的バイアスを構築する。
本稿では,基本データレコーダ (vanilla autoencoder) と潜時再構成 (InfoGAN) 生成モデルの両方に追加することで,このアプローチの広範な適用性を実証する。
論文 参考訳(メタデータ) (2023-05-28T06:30:29Z) - Combating Mode Collapse in GANs via Manifold Entropy Estimation [70.06639443446545]
Generative Adversarial Networks (GAN) は、様々なタスクやアプリケーションにおいて魅力的な結果を示している。
GANのモード崩壊問題に対処するための新しいトレーニングパイプラインを提案する。
論文 参考訳(メタデータ) (2022-08-25T12:33:31Z) - Efficient Multidimensional Functional Data Analysis Using Marginal
Product Basis Systems [2.4554686192257424]
多次元関数データのサンプルから連続表現を学習するためのフレームワークを提案する。
本研究では, テンソル分解により, 得られた推定問題を効率的に解けることを示す。
我々は、ニューロイメージングにおける真のデータ応用で締めくくっている。
論文 参考訳(メタデータ) (2021-07-30T16:02:15Z) - Hierarchical Dynamic Filtering Network for RGB-D Salient Object
Detection [91.43066633305662]
RGB-D Salient Object Detection (SOD) の主な目的は、相互融合情報をよりよく統合し活用する方法である。
本稿では,これらの問題を新たな視点から考察する。
我々は、より柔軟で効率的なマルチスケールのクロスモーダルな特徴処理を実装している。
論文 参考訳(メタデータ) (2020-07-13T07:59:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。