論文の概要: Normalized Radon Cumulative Distribution Transforms for Invariance and Robustness in Optimal Transport Based Image Classification
- arxiv url: http://arxiv.org/abs/2506.08761v1
- Date: Tue, 10 Jun 2025 13:03:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-11 15:11:42.471521
- Title: Normalized Radon Cumulative Distribution Transforms for Invariance and Robustness in Optimal Transport Based Image Classification
- Title(参考訳): 最適輸送に基づく画像分類における不変性とロバスト性のための正規化ラドン累積分布変換
- Authors: Matthias Beckmann, Robert Beinert, Jonas Bresch,
- Abstract要約: Radon累積分布変換(R-CDT)は、画像分類作業を容易にする簡易な特徴抽出器である。
任意のアフィン変換の下では、基本演算のみを必要とせず、分離性も保証する、いわゆる最大正規化R-CDTを導入する。
感度解析により, 試料間のワッサーシュタイン-無限距離を制御できる場合, 分離性は安定であることがわかった。
- 参考スコア(独自算出の注目度): 1.3654846342364308
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Radon cumulative distribution transform (R-CDT), is an easy-to-compute feature extractor that facilitates image classification tasks especially in the small data regime. It is closely related to the sliced Wasserstein distance and provably guaranties the linear separability of image classes that emerge from translations or scalings. In many real-world applications, like the recognition of watermarks in filigranology, however, the data is subject to general affine transformations originating from the measurement process. To overcome this issue, we recently introduced the so-called max-normalized R-CDT that only requires elementary operations and guaranties the separability under arbitrary affine transformations. The aim of this paper is to continue our study of the max-normalized R-CDT especially with respect to its robustness against non-affine image deformations. Our sensitivity analysis shows that its separability properties are stable provided the Wasserstein-infinity distance between the samples can be controlled. Since the Wasserstein-infinity distance only allows small local image deformations, we moreover introduce a mean-normalized version of the R-CDT. In this case, robustness relates to the Wasserstein-2 distance and also covers image deformations caused by impulsive noise for instance. Our theoretical results are supported by numerical experiments showing the effectiveness of our novel feature extractors as well as their robustness against local non-affine deformations and impulsive noise.
- Abstract(参考訳): Radon cumulative Distribution transform (R-CDT) は、特に小さなデータ構造において画像分類作業を容易にする簡易な特徴抽出器である。
これはスライスされたワッサーシュタイン距離と密接に関連しており、変換やスケーリングから現れる画像クラスの線形分離性を確実に保証している。
しかし、フィリグラロジーにおける透かしの認識のような現実世界の多くの応用では、データは測定過程から派生した一般的なアフィン変換の対象となっている。
この問題を克服するために,我々は最近,任意のアフィン変換の下での基本的な操作と分離性のみを必要とする,いわゆる最大正規化R-CDTを導入した。
本研究の目的は, 最大正規化R-CDTについて, 特に非ファイン画像変形に対するロバスト性について検討を続けることである。
感度解析により, 試料間のワッサーシュタイン-無限距離を制御できる場合, 分離性は安定であることがわかった。
Wasserstein-infinity 距離は局所的な画像の小さな変形しか許さないため、R-CDT の平均正規化版を導入する。
この場合、ロバスト性はワッサーシュタイン2距離に関係しており、例えばインパルスノイズによる画像変形もカバーしている。
提案手法は,新しい特徴抽出器の有効性と,局所的な非アフィン変形とインパルスノイズに対する頑健性を示す数値実験によって支持された。
関連論文リスト
- Rotation Equivariant Arbitrary-scale Image Super-Resolution [62.41329042683779]
任意のスケールの超解像(ASISR)は、低解像度の入力画像から任意のスケールの高分解能回復を実現することを目的としている。
本研究では, 回転同変ASISR法の構築に尽力する。
論文 参考訳(メタデータ) (2025-08-07T08:51:03Z) - Accurate Latent Inversion for Generative Image Steganography via Rectified Flow [5.404219831398271]
拡散モデルに基づくステレオグラフィーは、高品質な画像を生成し、強靭性を示す能力によって注目されている。
我々は,新しい画像ステガノグラフィー手法である textbfRF-Stego を提案する。
RF-Stegoは, 抽出精度, 画質, 堅牢性, セキュリティ, 生成効率において, 最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2025-08-01T08:46:32Z) - ASCNet: Asymmetric Sampling Correction Network for Infrared Image Destriping [25.816984064145906]
非対称サンプリング補正ネットワーク(ASCNet)と呼ばれる新しい赤外画像デストリップ手法を提案する。
我々のASCNetは、Residual Haar Discrete Wavelet Transform (RHDWT), Pixel Shuffle (PS), Column Non-uniformity Correction Module (CNCM)の3つのコア要素で構成されています。
論文 参考訳(メタデータ) (2024-01-28T06:23:55Z) - Adaptive Multi-step Refinement Network for Robust Point Cloud Registration [82.64560249066734]
ポイントクラウド登録は、同じシーンの2つのポイントクラウド間の相対的な厳密な変換を推定する。
本稿では,前ステップからの情報を活用することで,各ステップの登録品質を向上する適応型多段階改良ネットワークを提案する。
本手法は3DMatch/3DLoMatchベンチマークとKITTIベンチマークの両方で最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-12-05T18:59:41Z) - ESSAformer: Efficient Transformer for Hyperspectral Image
Super-resolution [76.7408734079706]
単一ハイパースペクトル像超解像(単一HSI-SR)は、低分解能観測から高分解能ハイパースペクトル像を復元することを目的としている。
本稿では,1つのHSI-SRの繰り返し精製構造を持つESSA注目組込みトランスフォーマネットワークであるESSAformerを提案する。
論文 参考訳(メタデータ) (2023-07-26T07:45:14Z) - Microseismic source imaging using physics-informed neural networks with
hard constraints [4.07926531936425]
物理インフォームドニューラルネットワーク(PINN)に基づく直接微動イメージングフレームワークを提案する。
PINNを用いてマルチ周波数波動場を表現し,その逆フーリエ変換を用いて音源画像の抽出を行う。
さらに,本手法をモニタリングフィールドデータの水理破砕に応用し,少ないアーティファクトで精度よくソースを画像化できることを実証する。
論文 参考訳(メタデータ) (2023-04-09T21:10:39Z) - Uncertainty-Aware Source-Free Adaptive Image Super-Resolution with Wavelet Augmentation Transformer [60.31021888394358]
Unsupervised Domain Adaptation (UDA)は、現実世界の超解像(SR)における領域ギャップ問題に効果的に対処できる
本稿では,画像SR(SODA-SR)のためのSOurce-free Domain Adaptationフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-31T03:14:44Z) - Image Deblurring by Exploring In-depth Properties of Transformer [86.7039249037193]
我々は、事前訓練された視覚変換器(ViT)から抽出した深い特徴を活用し、定量的な測定値によって測定された性能を犠牲にすることなく、回復した画像のシャープ化を促進する。
得られた画像と対象画像の変換器特徴を比較することにより、事前学習された変換器は、高解像度のぼやけた意味情報を提供する。
特徴をベクトルとみなし、抽出された画像から抽出された表現とユークリッド空間における対象表現との差を計算する。
論文 参考訳(メタデータ) (2023-03-24T14:14:25Z) - Exploring Invariant Representation for Visible-Infrared Person
Re-Identification [77.06940947765406]
異なるスペクトルを横断する歩行者にアイデンティティを関連付けることを目的とした、クロススペクトルの人物再識別は、モダリティの相違の主な課題に直面している。
本稿では、ロバスト機能マイニングネットワーク(RFM)と呼ばれるエンドツーエンドのハイブリッド学習フレームワークにおいて、画像レベルと特徴レベルの両方の問題に対処する。
RegDBとSYSU-MM01という2つの標準的なクロススペクトル人物識別データセットの実験結果により,最先端の性能が示された。
論文 参考訳(メタデータ) (2023-02-02T05:24:50Z) - Editing Out-of-domain GAN Inversion via Differential Activations [56.62964029959131]
本稿では,構成分解パラダイムを用いて,ドメイン外反転問題に対処する新しいGAN事前編集フレームワークを提案する。
生成されたDiff-CAMマスクの助けを借りて、粗い再構成を直感的に元の画像と編集された画像で合成することができる。
また, 分解段階において, 粗い再構成から最終微編集画像を切り離すための, GAN 以前のデゴーストネットワークを提示する。
論文 参考訳(メタデータ) (2022-07-17T10:34:58Z) - Negligible effect of brain MRI data preprocessing for tumor segmentation [36.89606202543839]
我々は3つの公開データセットの実験を行い、ディープニューラルネットワークにおける異なる前処理ステップの効果を評価する。
その結果、最も一般的な標準化手順は、ネットワーク性能に何の価値も与えないことが示されている。
画像の規格化に伴う信号分散の低減のため,画像強度正規化手法はモデル精度に寄与しない。
論文 参考訳(メタデータ) (2022-04-11T17:29:36Z) - Surrogate-based cross-correlation for particle image velocimetry [4.306143768014157]
本稿では,SBCC(Surrogate-based cross-correlation)フレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-10T02:45:42Z) - Photoacoustic Reconstruction Using Sparsity in Curvelet Frame: Image
versus Data Domain [1.6797639124983812]
曲線フレームは光音響トモグラフィー(PAT)において特に重要である
画像空間とデータ空間における波面方向の1対1の写像を導出し、カーベレットフレームの間隔を仮定する際の圧縮・サブサンプリング測定から初期圧力の回復とPATデータとのほぼ同値性を示唆する。
論文 参考訳(メタデータ) (2020-11-26T00:51:39Z) - Cross-Scale Internal Graph Neural Network for Image Super-Resolution [147.77050877373674]
自然画像における非局所的な自己相似性は、画像修復に有効な先行研究として、よく研究されている。
単一の画像超解像(SISR)の場合、既存のディープ非局所法のほとんどは、低解像度(LR)入力画像と同じ規模のパッチしか利用していない。
これは、新しいクロススケールな内部グラフニューラルネットワーク(IGNN)を用いて実現される。
論文 参考訳(メタデータ) (2020-06-30T10:48:40Z) - Manifold-Aware CycleGAN for High-Resolution Structural-to-DTI Synthesis [8.829738147738222]
本稿では,T1w画像から高分解能DTIの生成を学習する多様体対応CycleGANを提案する。
提案手法は,拡散測定値の計算やファイバトラクトグラフィーアルゴリズムの実行に使用可能な,現実的な高分解能DTIを生成することができる。
論文 参考訳(メタデータ) (2020-04-01T00:08:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。