論文の概要: Polar Separable Transform for Efficient Orthogonal Rotation-Invariant Image Representation
- arxiv url: http://arxiv.org/abs/2510.09125v1
- Date: Fri, 10 Oct 2025 08:26:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 00:38:48.408629
- Title: Polar Separable Transform for Efficient Orthogonal Rotation-Invariant Image Representation
- Title(参考訳): 効率的な直交回転不変画像表現のための極分離変換
- Authors: Satya P. Singh, Rashmi Chaudhry, Anand Srivastava, Jagath C. Rajapakse,
- Abstract要約: 極座標の非分離障壁を克服する分離直交変換であるtextbfPSepT (Polar Separable Transform) を導入する。
その結果、構造化データセット上での数値安定性、計算効率、および競合分類性能が向上した。
このフレームワークは従来の手法では実現不可能な高次モーメント解析を可能にし、ロバストな画像解析アプリケーションのための新たな可能性を開く。
- 参考スコア(独自算出の注目度): 10.420952921069759
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Orthogonal moment-based image representations are fundamental in computer vision, but classical methods suffer from high computational complexity and numerical instability at large orders. Zernike and pseudo-Zernike moments, for instance, require coupled radial-angular processing that precludes efficient factorization, resulting in $\mathcal{O}(n^3N^2)$ to $\mathcal{O}(n^6N^2)$ complexity and $\mathcal{O}(N^4)$ condition number scaling for the $n$th-order moments on an $N\times N$ image. We introduce \textbf{PSepT} (Polar Separable Transform), a separable orthogonal transform that overcomes the non-separability barrier in polar coordinates. PSepT achieves complete kernel factorization via tensor-product construction of Discrete Cosine Transform (DCT) radial bases and Fourier harmonic angular bases, enabling independent radial and angular processing. This separable design reduces computational complexity to $\mathcal{O}(N^2 \log N)$, memory requirements to $\mathcal{O}(N^2)$, and condition number scaling to $\mathcal{O}(\sqrt{N})$, representing exponential improvements over polynomial approaches. PSepT exhibits orthogonality, completeness, energy conservation, and rotation-covariance properties. Experimental results demonstrate better numerical stability, computational efficiency, and competitive classification performance on structured datasets, while preserving exact reconstruction. The separable framework enables high-order moment analysis previously infeasible with classical methods, opening new possibilities for robust image analysis applications.
- Abstract(参考訳): 直交モーメントに基づく画像表現はコンピュータビジョンにおいて基本的なものであるが、古典的手法は計算の複雑さと大きな順序での数値不安定さに悩まされている。
例えば、Zernike と pseudo-Zernike のモーメントは、効率的な分解を妨げ、$\mathcal{O}(n^3N^2)$ to $\mathcal{O}(n^6N^2)$ complexity と $\mathcal{O}(N^4)$ condition number scaling for the $n$th-order moments on a $N\times N$ image である。
極座標における非可分障壁を克服する分離直交変換である \textbf{PSepT} (Polar Separable Transform) を導入する。
PSepTは、離散コサイン変換(DCT)ラジアル基底とフーリエ高調波角基底のテンソル積構成により完全なカーネル分解を達成し、独立なラジアルおよび角処理を可能にする。
この分離可能な設計は、計算複雑性を$\mathcal{O}(N^2 \log N)$に、メモリ要件を$\mathcal{O}(N^2)$に、条件番号を$\mathcal{O}(\sqrt{N})$に、多項式アプローチよりも指数関数的に改善したことを示す。
PSepTは直交性、完全性、エネルギー保存、回転共分散特性を示す。
実験結果は、正確な再構成を保ちながら、構造化データセット上でのより優れた数値安定性、計算効率、および競合分類性能を示す。
分離可能なフレームワークは、従来は古典的手法では実現できなかった高次モーメント解析を可能にし、ロバストな画像解析アプリケーションに対する新たな可能性を開く。
関連論文リスト
- Generalized tensor transforms and their applications in classical and quantum computing [0.0]
一般化変換(GTT)のための新しいフレームワークを導入し、任意の$b倍の単位行列$W$のテンソル積を$n$フォールドで構築する。
量子アプリケーションの場合、GTTベースのアルゴリズムはゲートの複雑さと回路深さが$O(log_b N)$であり、$N = bn$はベクトル入力の長さを表す。
本稿では,量子状態圧縮と伝送,関数符号化,量子ディジタル信号処理など,量子コンピューティングにおけるGTTの多様な応用について検討する。
論文 参考訳(メタデータ) (2025-07-03T08:28:00Z) - E2Former: A Linear-time Efficient and Equivariant Transformer for Scalable Molecular Modeling [44.75336958712181]
We introduced E2Former, an equivariant and efficient transformer architecture that with the Wigner 6,j$ convolution (Wigner 6,j$ Conv)
計算負荷をエッジからノードにシフトすることで、Wigner 6j$ Convは複雑さを$O(|mathcalE|)$から$O(| MathcalV|)$に縮める。
この開発は、スケーラブルで効率的な分子モデリングのための有望な方向を示唆する可能性がある。
論文 参考訳(メタデータ) (2025-01-31T15:22:58Z) - Obtaining Lower Query Complexities through Lightweight Zeroth-Order Proximal Gradient Algorithms [65.42376001308064]
複素勾配問題に対する2つの分散化ZO推定器を提案する。
我々は、現在最先端の機能複雑性を$mathcalOleft(minfracdn1/2epsilon2, fracdepsilon3right)$から$tildecalOleft(fracdepsilon2right)$に改善する。
論文 参考訳(メタデータ) (2024-10-03T15:04:01Z) - Chain of Thought Empowers Transformers to Solve Inherently Serial Problems [57.58801785642868]
思考の連鎖(CoT)は、算術や記号的推論タスクにおいて、大きな言語モデル(LLM)の精度を向上させるための非常に効果的な方法である。
この研究は、表現性のレンズを通してデコーダのみの変換器に対するCoTのパワーを理論的に理解する。
論文 参考訳(メタデータ) (2024-02-20T10:11:03Z) - Scalable First-Order Bayesian Optimization via Structured Automatic
Differentiation [4.061135251278187]
広い範囲のカーネルが構造化行列を生じさせ、勾配観測のための正確な$mathcalO(n2d)$Matrix-vector multiplyとヘッセン観測のための$mathcalO(n2d2)$を可能にした。
提案手法は,ほぼすべての標準カーネルに適用され,ニューラルネットワーク,放射基底関数ネットワーク,スペクトル混合カーネルなどの複雑なカーネルに自動的に拡張される。
論文 参考訳(メタデータ) (2022-06-16T17:59:48Z) - Hybrid Model-based / Data-driven Graph Transform for Image Coding [54.31406300524195]
予測内残差ブロックを符号化するハイブリッドモデルベース/データ駆動方式を提案する。
変換行列の最初の$K$固有ベクトルは、安定性のための非対称離散正弦変換(ADST)のような統計モデルから導かれる。
WebPをベースライン画像として使用することにより、我々のハイブリッドグラフ変換は、デフォルトの離散コサイン変換(DCT)よりもエネルギーの圧縮が良く、KLTよりも安定性がよいことを示す。
論文 参考訳(メタデータ) (2022-03-02T15:36:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。