論文の概要: Generalizations of the Normalized Radon Cumulative Distribution Transform for Limited Data Recognition
- arxiv url: http://arxiv.org/abs/2512.08099v1
- Date: Mon, 08 Dec 2025 23:16:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-10 22:28:07.751933
- Title: Generalizations of the Normalized Radon Cumulative Distribution Transform for Limited Data Recognition
- Title(参考訳): 限定データ認識のための正規化ラドン累積分布変換の一般化
- Authors: Matthias Beckmann, Robert Beinert, Jonas Bresch,
- Abstract要約: ラドン累積分布変換(R-CDT)は1次元ワッサーシュタイン輸送とラドン変換を利用して画像の特徴を表現する。
我々は,新しい特徴表現がある種の変換の下で不変であることを示し,特徴空間における線形分離を可能にする。
- 参考スコア(独自算出の注目度): 1.4018975578160688
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Radon cumulative distribution transform (R-CDT) exploits one-dimensional Wasserstein transport and the Radon transform to represent prominent features in images. It is closely related to the sliced Wasserstein distance and facilitates classification tasks, especially in the small data regime, like the recognition of watermarks in filigranology. Here, a typical issue is that the given data may be subject to affine transformations caused by the measuring process. To make the R-CDT invariant under arbitrary affine transformations, a two-step normalization of the R-CDT has been proposed in our earlier works. The aim of this paper is twofold. First, we propose a family of generalized normalizations to enhance flexibility for applications. Second, we study multi-dimensional and non-Euclidean settings by making use of generalized Radon transforms. We prove that our novel feature representations are invariant under certain transformations and allow for linear separation in feature space. Our theoretical results are supported by numerical experiments based on 2d images, 3d shapes and 3d rotation matrices, showing near perfect classification accuracies and clustering results.
- Abstract(参考訳): ラドン累積分布変換(R-CDT)は1次元ワッサーシュタイン輸送とラドン変換を利用して画像の特徴を表現する。
それはスライスされたワッサースタイン距離と密接に関連しており、特にフィリグラロジーにおける透かしの認識のような小さなデータ構造において、分類作業を促進する。
ここでの典型的な問題は、与えられたデータが測定プロセスによって引き起こされるアフィン変換を受ける可能性があることである。
任意のアフィン変換の下でR-CDTを不変にするために、R-CDTの2段階の正規化が以前の研究で提案されている。
本論文の目的は2つある。
まず,アプリケーションの柔軟性を高めるため,一般化正規化のファミリを提案する。
第二に、一般化されたラドン変換を用いて多次元および非ユークリッド設定を研究する。
我々は、新しい特徴表現がある種の変換の下で不変であることを示し、特徴空間における線形分離を可能にする。
2次元画像, 3次元形状, 3次元回転行列に基づく数値実験により, ほぼ完全な分類精度とクラスタリング結果が得られた。
関連論文リスト
- Normalized Radon Cumulative Distribution Transforms for Invariance and Robustness in Optimal Transport Based Image Classification [1.3654846342364308]
Radon累積分布変換(R-CDT)は、画像分類作業を容易にする簡易な特徴抽出器である。
任意のアフィン変換の下では、基本演算のみを必要とせず、分離性も保証する、いわゆる最大正規化R-CDTを導入する。
感度解析により, 試料間のワッサーシュタイン-無限距離を制御できる場合, 分離性は安定であることがわかった。
論文 参考訳(メタデータ) (2025-06-10T13:03:20Z) - RLE: A Unified Perspective of Data Augmentation for Cross-Spectral Re-identification [59.5042031913258]
非線型モダリティの相違は主に、異なる材料の表面に作用する様々な線形変換に由来する。
本稿では,MRLE(Modrate Random Linear Enhancement)とRRLE(Radical Random Linear Enhancement)を含むRLE(Random Linear Enhancement)戦略を提案する。
実験結果は、RLEの優位性と有効性を示すだけでなく、クロススペクトル再同定のための汎用データ拡張としての可能性も確認した。
論文 参考訳(メタデータ) (2024-11-02T12:13:37Z) - Cross-domain and Cross-dimension Learning for Image-to-Graph Transformers [48.74331852418905]
直接画像からグラフへの変換は、1つのモデルで物体の検出と関係予測を解くことを伴う課題である。
このタスクの複雑さのため、多くのドメインで大規模なトレーニングデータセットはまれであり、ディープラーニングメソッドのトレーニングを困難にしている。
画像-グラフ変換器のクロスドメインおよびクロス次元学習を可能にする一連の手法を提案する。
論文 参考訳(メタデータ) (2024-03-11T10:48:56Z) - MGAug: Multimodal Geometric Augmentation in Latent Spaces of Image Deformations [2.2954246824369218]
本稿では,幾何変形の多モード潜在空間における拡張変換を生成する新しいモデルを提案する。
実験結果から,提案手法は予測精度を大幅に向上させることで,全てのベースラインよりも優れた性能を示すことがわかった。
論文 参考訳(メタデータ) (2023-12-20T21:30:55Z) - Adaptive Multi-step Refinement Network for Robust Point Cloud Registration [82.64560249066734]
ポイントクラウド登録は、同じシーンの2つのポイントクラウド間の相対的な厳密な変換を推定する。
本稿では,前ステップからの情報を活用することで,各ステップの登録品質を向上する適応型多段階改良ネットワークを提案する。
本手法は3DMatch/3DLoMatchベンチマークとKITTIベンチマークの両方で最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-12-05T18:59:41Z) - Orthonormal Convolutions for the Rotation Based Iterative
Gaussianization [64.44661342486434]
本稿では、画像ガウス化を可能にする回転型反復ガウス化RBIGの拡張について詳述する。
RBIGの回転は主成分分析や独立成分分析に基づくため、画像では小さな画像パッチや孤立画素に制限されている。
emphConvolutional RBIG:この問題を緩和する拡張として,RBIGの回転が畳み込みであることを示す。
論文 参考訳(メタデータ) (2022-06-08T12:56:34Z) - Invariant Deep Compressible Covariance Pooling for Aerial Scene
Categorization [80.55951673479237]
本研究では,空気シーン分類におけるニュアンス変動を解決するために,新しい不変な深部圧縮性共分散プール (IDCCP) を提案する。
本研究では,公開空間画像データセットに関する広範な実験を行い,最先端の手法と比較して,この手法の優位性を実証する。
論文 参考訳(メタデータ) (2020-11-11T11:13:07Z) - Region adaptive graph fourier transform for 3d point clouds [51.193111325231165]
本稿では,3次元点雲特性の圧縮のための領域適応グラフフーリエ変換(RA-GFT)を提案する。
RA-GFTは従来の手法よりも複雑性と性能のトレードオフが優れている。
論文 参考訳(メタデータ) (2020-03-04T02:47:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。