論文の概要: Normalized Radon Cumulative Distribution Transforms for Invariance and Robustness in Optimal Transport Based Image Classification
- arxiv url: http://arxiv.org/abs/2506.08761v1
- Date: Tue, 10 Jun 2025 13:03:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-11 15:11:42.471521
- Title: Normalized Radon Cumulative Distribution Transforms for Invariance and Robustness in Optimal Transport Based Image Classification
- Title(参考訳): 最適輸送に基づく画像分類における不変性とロバスト性のための正規化ラドン累積分布変換
- Authors: Matthias Beckmann, Robert Beinert, Jonas Bresch,
- Abstract要約: Radon累積分布変換(R-CDT)は、画像分類作業を容易にする簡易な特徴抽出器である。
任意のアフィン変換の下では、基本演算のみを必要とせず、分離性も保証する、いわゆる最大正規化R-CDTを導入する。
感度解析により, 試料間のワッサーシュタイン-無限距離を制御できる場合, 分離性は安定であることがわかった。
- 参考スコア(独自算出の注目度): 1.3654846342364308
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Radon cumulative distribution transform (R-CDT), is an easy-to-compute feature extractor that facilitates image classification tasks especially in the small data regime. It is closely related to the sliced Wasserstein distance and provably guaranties the linear separability of image classes that emerge from translations or scalings. In many real-world applications, like the recognition of watermarks in filigranology, however, the data is subject to general affine transformations originating from the measurement process. To overcome this issue, we recently introduced the so-called max-normalized R-CDT that only requires elementary operations and guaranties the separability under arbitrary affine transformations. The aim of this paper is to continue our study of the max-normalized R-CDT especially with respect to its robustness against non-affine image deformations. Our sensitivity analysis shows that its separability properties are stable provided the Wasserstein-infinity distance between the samples can be controlled. Since the Wasserstein-infinity distance only allows small local image deformations, we moreover introduce a mean-normalized version of the R-CDT. In this case, robustness relates to the Wasserstein-2 distance and also covers image deformations caused by impulsive noise for instance. Our theoretical results are supported by numerical experiments showing the effectiveness of our novel feature extractors as well as their robustness against local non-affine deformations and impulsive noise.
- Abstract(参考訳): Radon cumulative Distribution transform (R-CDT) は、特に小さなデータ構造において画像分類作業を容易にする簡易な特徴抽出器である。
これはスライスされたワッサーシュタイン距離と密接に関連しており、変換やスケーリングから現れる画像クラスの線形分離性を確実に保証している。
しかし、フィリグラロジーにおける透かしの認識のような現実世界の多くの応用では、データは測定過程から派生した一般的なアフィン変換の対象となっている。
この問題を克服するために,我々は最近,任意のアフィン変換の下での基本的な操作と分離性のみを必要とする,いわゆる最大正規化R-CDTを導入した。
本研究の目的は, 最大正規化R-CDTについて, 特に非ファイン画像変形に対するロバスト性について検討を続けることである。
感度解析により, 試料間のワッサーシュタイン-無限距離を制御できる場合, 分離性は安定であることがわかった。
Wasserstein-infinity 距離は局所的な画像の小さな変形しか許さないため、R-CDT の平均正規化版を導入する。
この場合、ロバスト性はワッサーシュタイン2距離に関係しており、例えばインパルスノイズによる画像変形もカバーしている。
提案手法は,新しい特徴抽出器の有効性と,局所的な非アフィン変形とインパルスノイズに対する頑健性を示す数値実験によって支持された。
関連論文リスト
- ASCNet: Asymmetric Sampling Correction Network for Infrared Image Destriping [25.816984064145906]
非対称サンプリング補正ネットワーク(ASCNet)と呼ばれる新しい赤外画像デストリップ手法を提案する。
我々のASCNetは、Residual Haar Discrete Wavelet Transform (RHDWT), Pixel Shuffle (PS), Column Non-uniformity Correction Module (CNCM)の3つのコア要素で構成されています。
論文 参考訳(メタデータ) (2024-01-28T06:23:55Z) - Adaptive Multi-step Refinement Network for Robust Point Cloud Registration [82.64560249066734]
ポイントクラウド登録は、同じシーンの2つのポイントクラウド間の相対的な厳密な変換を推定する。
本稿では,前ステップからの情報を活用することで,各ステップの登録品質を向上する適応型多段階改良ネットワークを提案する。
本手法は3DMatch/3DLoMatchベンチマークとKITTIベンチマークの両方で最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-12-05T18:59:41Z) - Microseismic source imaging using physics-informed neural networks with
hard constraints [4.07926531936425]
物理インフォームドニューラルネットワーク(PINN)に基づく直接微動イメージングフレームワークを提案する。
PINNを用いてマルチ周波数波動場を表現し,その逆フーリエ変換を用いて音源画像の抽出を行う。
さらに,本手法をモニタリングフィールドデータの水理破砕に応用し,少ないアーティファクトで精度よくソースを画像化できることを実証する。
論文 参考訳(メタデータ) (2023-04-09T21:10:39Z) - Uncertainty-Aware Source-Free Adaptive Image Super-Resolution with Wavelet Augmentation Transformer [60.31021888394358]
Unsupervised Domain Adaptation (UDA)は、現実世界の超解像(SR)における領域ギャップ問題に効果的に対処できる
本稿では,画像SR(SODA-SR)のためのSOurce-free Domain Adaptationフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-31T03:14:44Z) - Image Deblurring by Exploring In-depth Properties of Transformer [86.7039249037193]
我々は、事前訓練された視覚変換器(ViT)から抽出した深い特徴を活用し、定量的な測定値によって測定された性能を犠牲にすることなく、回復した画像のシャープ化を促進する。
得られた画像と対象画像の変換器特徴を比較することにより、事前学習された変換器は、高解像度のぼやけた意味情報を提供する。
特徴をベクトルとみなし、抽出された画像から抽出された表現とユークリッド空間における対象表現との差を計算する。
論文 参考訳(メタデータ) (2023-03-24T14:14:25Z) - Negligible effect of brain MRI data preprocessing for tumor segmentation [36.89606202543839]
我々は3つの公開データセットの実験を行い、ディープニューラルネットワークにおける異なる前処理ステップの効果を評価する。
その結果、最も一般的な標準化手順は、ネットワーク性能に何の価値も与えないことが示されている。
画像の規格化に伴う信号分散の低減のため,画像強度正規化手法はモデル精度に寄与しない。
論文 参考訳(メタデータ) (2022-04-11T17:29:36Z) - Surrogate-based cross-correlation for particle image velocimetry [4.306143768014157]
本稿では,SBCC(Surrogate-based cross-correlation)フレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-10T02:45:42Z) - Photoacoustic Reconstruction Using Sparsity in Curvelet Frame: Image
versus Data Domain [1.6797639124983812]
曲線フレームは光音響トモグラフィー(PAT)において特に重要である
画像空間とデータ空間における波面方向の1対1の写像を導出し、カーベレットフレームの間隔を仮定する際の圧縮・サブサンプリング測定から初期圧力の回復とPATデータとのほぼ同値性を示唆する。
論文 参考訳(メタデータ) (2020-11-26T00:51:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。