論文の概要: Quaternion Approximation Networks for Enhanced Image Classification and Oriented Object Detection
- arxiv url: http://arxiv.org/abs/2509.05512v1
- Date: Fri, 05 Sep 2025 21:41:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-09 14:07:03.556757
- Title: Quaternion Approximation Networks for Enhanced Image Classification and Oriented Object Detection
- Title(参考訳): 画像分類とオブジェクト指向物体検出のための四次近似ネットワーク
- Authors: Bryce Grant, Peng Wang,
- Abstract要約: Quaternion Approximate Networks (QUIN) は、回転同変画像分類と物体検出に四元数代数を利用する新しいディープラーニングフレームワークである。
Quaternion Approximate Networks (QUAN) は画像分類(CIFAR-10/100, ImageNet)、オブジェクト検出(COCO, DOTA)、ロボット認識タスクに基づいて評価される。
これらの結果は、回転認識と他の領域での応用を必要とする資源制約されたロボットシステムへの展開の可能性を強調している。
- 参考スコア(独自算出の注目度): 2.847742374860449
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces Quaternion Approximate Networks (QUAN), a novel deep learning framework that leverages quaternion algebra for rotation equivariant image classification and object detection. Unlike conventional quaternion neural networks attempting to operate entirely in the quaternion domain, QUAN approximates quaternion convolution through Hamilton product decomposition using real-valued operations. This approach preserves geometric properties while enabling efficient implementation with custom CUDA kernels. We introduce Independent Quaternion Batch Normalization (IQBN) for training stability and extend quaternion operations to spatial attention mechanisms. QUAN is evaluated on image classification (CIFAR-10/100, ImageNet), object detection (COCO, DOTA), and robotic perception tasks. In classification tasks, QUAN achieves higher accuracy with fewer parameters and faster convergence compared to existing convolution and quaternion-based models. For objection detection, QUAN demonstrates improved parameter efficiency and rotation handling over standard Convolutional Neural Networks (CNNs) while establishing the SOTA for quaternion CNNs in this downstream task. These results highlight its potential for deployment in resource-constrained robotic systems requiring rotation-aware perception and application in other domains.
- Abstract(参考訳): 本稿では、回転同変画像分類と物体検出に四元数代数を利用する新しいディープラーニングフレームワークであるQuaternion Approximate Networks (QUAN)を紹介する。
四元数領域で完全に動作しようとする従来の四元数ニューラルネットワークとは異なり、quaNは実数値演算を用いてハミルトン積分解を通じて四元数畳み込みを近似する。
このアプローチは、カスタムCUDAカーネルによる効率的な実装を実現しつつ、幾何学的特性を保存する。
Independent Quaternion Batch Normalization (IQBN) を導入する。
QUINは画像分類(CIFAR-10/100, ImageNet)、オブジェクト検出(COCO, DOTA)、ロボット認識タスクに基づいて評価される。
分類タスクでは、QUINは既存の畳み込みモデルや四元数ベースのモデルと比較して、より少ないパラメータとより高速な収束で高い精度を達成する。
対物検出では、標準畳み込みニューラルネットワーク(CNN)よりもパラメータ効率と回転処理が向上し、この下流タスクでは四元CNNのためのSOTAが確立されている。
これらの結果は、回転認識と他の領域での応用を必要とする資源制約されたロボットシステムへの展開の可能性を強調している。
関連論文リスト
- Exploring Kernel Transformations for Implicit Neural Representations [57.2225355625268]
入射神経表現(INR)は、ニューラルネットワークを利用して、対応する属性に座標をマッピングすることで、信号を表現する。
この研究は、モデル自体を変更せずに入出力のカーネル変換の効果を探求する先駆者となった。
我々の発見の副産物は、スケールとシフトを組み合わせて、INRを無視できないオーバーヘッドで著しく向上させる、単純で効果的な方法である。
論文 参考訳(メタデータ) (2025-04-07T04:43:50Z) - Deep-Unrolling Multidimensional Harmonic Retrieval Algorithms on Neuromorphic Hardware [78.17783007774295]
本稿では,高精度かつエネルギー効率の高い単発多次元高調波検索のための変換に基づくニューロモルフィックアルゴリズムの可能性について検討する。
複雑な値の畳み込み層と活性化をスパイクニューラルネットワーク(SNN)に変換する新しい手法を開発した。
変換されたSNNは、元のCNNに比べて性能が低下し、ほぼ5倍の電力効率を実現している。
論文 参考訳(メタデータ) (2024-12-05T09:41:33Z) - Quanv4EO: Empowering Earth Observation by means of Quanvolutional Neural Networks [62.12107686529827]
本稿は、大量のリモートセンシングデータの処理において、量子コンピューティング技術を活用することへの大きなシフトを取り上げる。
提案したQuanv4EOモデルでは,多次元EOデータを前処理するための準進化法が導入された。
主要な知見は,提案モデルが画像分類の精度を維持するだけでなく,EOのユースケースの約5%の精度向上を図っていることを示唆している。
論文 参考訳(メタデータ) (2024-07-24T09:11:34Z) - DCNN: Dual Cross-current Neural Networks Realized Using An Interactive Deep Learning Discriminator for Fine-grained Objects [48.65846477275723]
本研究では、微細な画像分類の精度を向上させるために、新しい二重電流ニューラルネットワーク(DCNN)を提案する。
弱い教師付き学習バックボーンモデルを構築するための新しい特徴として、(a)異種データの抽出、(b)特徴マップの解像度の維持、(c)受容領域の拡大、(d)グローバル表現と局所特徴の融合などがある。
論文 参考訳(メタデータ) (2024-05-07T07:51:28Z) - Quaternion-valued Correlation Learning for Few-Shot Semantic
Segmentation [33.88445464404075]
Few-shot segmentation (FSS)は、少数のサンプルしか与えられていないクラスをセグメントすることを目的としている。
相関学習に関する四元数視点を導入し、新しい四元数評価相関学習ネットワーク(QCLNet)を提案する。
我々のQCLNetは超複素値ネットワークとして定式化され、四元数値畳み込みを用いてクエリ部分空間の外部関係を探索する四元数領域の相関テンソルを表す。
論文 参考訳(メタデータ) (2023-05-12T06:56:22Z) - A Neural Network-enhanced Reproducing Kernel Particle Method for
Modeling Strain Localization [0.0]
本研究では,ニューラルネットワークを用いた再生カーネル粒子法(NN-RKPM)を提案する。
局所化近傍の溶液転移の位置、配向、形状は、NN近似によって自動的にキャプチャされる。
NN-RKPMの有効性を数値検証により検証した。
論文 参考訳(メタデータ) (2022-04-28T23:59:38Z) - Inducing Gaussian Process Networks [80.40892394020797]
本稿では,特徴空間と誘導点を同時に学習するシンプルなフレームワークであるGaussian Process Network (IGN)を提案する。
特に誘導点は特徴空間で直接学習され、複雑な構造化領域のシームレスな表現を可能にする。
実世界のデータセットに対する実験結果から,IGNは最先端の手法よりも大幅に進歩していることを示す。
論文 参考訳(メタデータ) (2022-04-21T05:27:09Z) - A Quaternion-Valued Variational Autoencoder [15.153617649974263]
可変オートエンコーダ(VAE)は、入力の潜在表現を学習することで、生成過程をモデル化する能力を証明している。
四元数領域で定義された新しいVAEを提案し、四元数代数の特性を利用して性能を向上させる。
論文 参考訳(メタデータ) (2020-10-22T12:33:42Z) - Modeling from Features: a Mean-field Framework for Over-parameterized
Deep Neural Networks [54.27962244835622]
本稿では、オーバーパラメータ化ディープニューラルネットワーク(DNN)のための新しい平均場フレームワークを提案する。
このフレームワークでは、DNNは連続的な極限におけるその特徴に対する確率測度と関数によって表現される。
本稿では、標準DNNとResidual Network(Res-Net)アーキテクチャを通してフレームワークを説明する。
論文 参考訳(メタデータ) (2020-07-03T01:37:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。