論文の概要: Euclidean Invariant Recognition of 2D Shapes Using Histograms of
Magnitudes of Local Fourier-Mellin Descriptors
- arxiv url: http://arxiv.org/abs/2203.06787v1
- Date: Sun, 13 Mar 2022 23:54:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-16 05:28:05.158392
- Title: Euclidean Invariant Recognition of 2D Shapes Using Histograms of
Magnitudes of Local Fourier-Mellin Descriptors
- Title(参考訳): 局所フーリエ・メリン記述子のマグニチュードヒストグラムを用いた2次元形状のユークリッド不変認識
- Authors: Xinhua Zhang and Lance R. Williams
- Abstract要約: 本稿では,Fourier-Mellin変換を画像の各点で計算するシステムについて述べる。
基底関数の空間的支持をエンベロープに乗じて局所的に行う。
2次元形状のユークリッド不変認識を行うVLAD機械学習方式を実証する。
- 参考スコア(独自算出の注目度): 11.57423546614283
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Because the magnitude of inner products with its basis functions are
invariant to rotation and scale change, the Fourier-Mellin transform has long
been used as a component in Euclidean invariant 2D shape recognition systems.
Yet Fourier-Mellin transform magnitudes are only invariant to rotation and
scale changes about a known center point, and full Euclidean invariant shape
recognition is not possible except when this center point can be consistently
and accurately identified. In this paper, we describe a system where a
Fourier-Mellin transform is computed at every point in the image. The spatial
support of the Fourier-Mellin basis functions is made local by multiplying them
with a polynomial envelope. Significantly, the magnitudes of convolutions with
these complex filters at isolated points are not (by themselves) used as
features for Euclidean invariant shape recognition because reliable
discrimination would require filters with spatial support large enough to fully
encompass the shapes. Instead, we rely on the fact that normalized histograms
of magnitudes are fully Euclidean invariant. We demonstrate a system based on
the VLAD machine learning method that performs Euclidean invariant recognition
of 2D shapes and requires an order of magnitude less training data than
comparable methods based on convolutional neural networks.
- Abstract(参考訳): 基本関数を持つ内積の大きさは回転やスケールの変化に不変であるため、フーリエ・メリン変換はユークリッド不変な2次元形状認識システムにおいて長い間使われてきた。
しかし、フーリエ・メリン変換の規模は既知の中心点に関する回転とスケールの変化にのみ不変であり、この中心点が一貫して正確に識別される以外はフルユークリッド不変形状認識は不可能である。
本稿では,フーリエメルリン変換が画像の各点において計算されるシステムについて述べる。
フーリエ・メルリン基底関数の空間的サポートは、多項式包絡を乗じることで局所化される。
重要なことに、分離された点におけるこれらの複雑なフィルタとの畳み込みの大きさは(それ自体によって)ユークリッド不変形状認識の特徴として使われていない。
代わりに、大きさの正規化されたヒストグラムが完全にユークリッド不変量であるという事実に依存する。
本研究では,2次元形状のユークリッド不変な認識を行い,畳み込みニューラルネットワークに基づく同等の手法よりも1桁少ないトレーニングデータを必要とするvlad機械学習に基づくシステムを示す。
関連論文リスト
- Learning SO(3)-Invariant Semantic Correspondence via Local Shape Transform [62.27337227010514]
RISTと呼ばれる局所形状変換を用いた自己教師型回転不変3次元対応学習システムを提案する。
RISTは、挑戦的なクラス内変分と任意の向きの下でも、形状間の密接な対応を確立することを学ぶ。
RISTは、任意の回転点雲対に与えられる3D部分ラベル転送とセマンティックキーポイント転送の最先端性能を示す。
論文 参考訳(メタデータ) (2024-04-17T08:09:25Z) - Transolver: A Fast Transformer Solver for PDEs on General Geometries [66.82060415622871]
本稿では, 離散化された測地の背後に隠れた本質的な物理状態を学習するTransolverについて述べる。
スライスから符号化された物理認識トークンに注意を向けることで、Transovlerは複雑な物理的相関を効果的に捉えることができる。
Transolverは6つの標準ベンチマークで22%の相対的な利得で一貫した最先端を実現し、大規模産業シミュレーションでも優れている。
論文 参考訳(メタデータ) (2024-02-04T06:37:38Z) - Rethinking Rotation Invariance with Point Cloud Registration [18.829454172955202]
本稿では, 回転不変形状符号化, 整列化機能統合, 深部特徴登録の3段階を通した回転不変性学習のための効果的なフレームワークを提案する。
3次元形状分類,部分分割,検索タスクの実験結果から,本研究の可能性が確認された。
論文 参考訳(メタデータ) (2022-12-31T08:17:09Z) - Unified Fourier-based Kernel and Nonlinearity Design for Equivariant
Networks on Homogeneous Spaces [52.424621227687894]
等質空間上の群同変ネットワークに対する統一的枠組みを導入する。
昇降した特徴場のフーリエ係数の空間性を利用する。
安定化部分群におけるフーリエ係数としての特徴を取り扱う他の方法が、我々のアクティベーションの特別な場合であることを示す。
論文 参考訳(メタデータ) (2022-06-16T17:59:01Z) - Shape-Pose Disentanglement using SE(3)-equivariant Vector Neurons [59.83721247071963]
本研究では,点雲を標準形状表現に符号化するための教師なし手法を提案する。
エンコーダは安定で一貫性があり、形状のエンコーダは純粋にポーズ不変である。
抽出された回転と変換は、同じクラスの異なる入力形状を共通の標準ポーズに意味的に整合させることができる。
論文 参考訳(メタデータ) (2022-04-03T21:00:44Z) - Frame Averaging for Equivariant Shape Space Learning [85.42901997467754]
形状空間学習に対称性を組み込む自然な方法は、形状空間(エンコーダ)への写像と形状空間(デコーダ)からの写像が関連する対称性に同値であることを問うことである。
本稿では,2つのコントリビューションを導入することで,エンコーダとデコーダの等価性を組み込む枠組みを提案する。
論文 参考訳(メタデータ) (2021-12-03T06:41:19Z) - Nonlinearities in Steerable SO(2)-Equivariant CNNs [7.552100672006172]
我々は,SO(2)の表現に対する非線形性の影響を照らし出すために調和歪み解析を適用した。
我々は、非線形変換されたアクティベーションの表現を計算するための新しいFFTベースのアルゴリズムを開発した。
2Dおよび3Dデータを用いた実験では、連続対称性と正確な同値性において、精度の点で最先端と良好に比較できる結果が得られる。
論文 参考訳(メタデータ) (2021-09-14T17:53:45Z) - Learning Equivariant Representations [10.745691354609738]
畳み込みニューラルネットワーク(CNN)はこの原理の成功例である。
対称性の群で定義される異なる変換に対する同変モデルを提案する。
これらのモデルはデータの対称性を利用して、サンプルとモデルの複雑さを減らし、一般化性能を向上させる。
論文 参考訳(メタデータ) (2020-12-04T18:46:17Z) - Dense Non-Rigid Structure from Motion: A Manifold Viewpoint [162.88686222340962]
Non-Rigid Structure-from-Motion (NRSfM) 問題は、複数のフレームにまたがる2次元特徴対応から変形物体の3次元形状を復元することを目的としている。
提案手法は,ノイズに対する精度,スケーラビリティ,堅牢性を大幅に向上させる。
論文 参考訳(メタデータ) (2020-06-15T09:15:54Z) - Instant recovery of shape from spectrum via latent space connections [33.83258865005668]
ラプラシアンスペクトルから形状を復元する最初の学習法を提案する。
自動エンコーダが与えられた場合、我々のモデルはサイクル整合モジュールの形で潜在ベクトルを固有値列にマッピングする。
我々のデータ駆動型アプローチは、計算コストのごく一部でより正確な結果を提供しながら、事前の手法で必要となるアドホック正規化器の必要性を置き換える。
論文 参考訳(メタデータ) (2020-03-14T00:48:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。