論文の概要: Probabilistic Spatial Transformer Networks
- arxiv url: http://arxiv.org/abs/2004.03637v2
- Date: Wed, 15 Jun 2022 13:50:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-15 23:13:37.602253
- Title: Probabilistic Spatial Transformer Networks
- Title(参考訳): 確率的空間変換器ネットワーク
- Authors: Pola Schw\"obel, Frederik Warburg, Martin J{\o}rgensen, Kristoffer H.
Madsen, S{\o}ren Hauberg
- Abstract要約: 本稿では、決定論的ではなく、変換を推定する確率的拡張を提案する。
これら2つの特性が,分類性能,ロバスト性,モデル校正性の向上につながることを示す。
さらに、時系列データにおけるモデル性能を改善することにより、非視覚領域へのアプローチが一般化されることを実証する。
- 参考スコア(独自算出の注目度): 0.6999740786886537
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Spatial Transformer Networks (STNs) estimate image transformations that can
improve downstream tasks by `zooming in' on relevant regions in an image.
However, STNs are hard to train and sensitive to mis-predictions of
transformations. To circumvent these limitations, we propose a probabilistic
extension that estimates a stochastic transformation rather than a
deterministic one. Marginalizing transformations allows us to consider each
image at multiple poses, which makes the localization task easier and the
training more robust. As an additional benefit, the stochastic transformations
act as a localized, learned data augmentation that improves the downstream
tasks. We show across standard imaging benchmarks and on a challenging
real-world dataset that these two properties lead to improved classification
performance, robustness and model calibration. We further demonstrate that the
approach generalizes to non-visual domains by improving model performance on
time-series data.
- Abstract(参考訳): 空間トランスフォーマーネットワーク(stns)は、画像内の関連領域に「ズームイン」することで下流タスクを改善する画像変換を推定する。
しかし、STNは訓練が難しく、変換の誤予測に敏感である。
これらの制限を回避するために、決定論的ではなく確率的変換を推定する確率的拡張を提案する。
マージナライズ変換により、複数のポーズで各イメージを考慮できるため、ローカライズ作業が簡単になり、トレーニングがより堅牢になる。
追加の利点として、確率変換は、ダウンストリームタスクを改善する局所的な学習データ拡張として機能する。
標準的な画像ベンチマークと、これらの2つの特性が分類性能、堅牢性、モデルのキャリブレーションを改善するための挑戦的な実世界のデータセットについて示す。
さらに,時系列データにおけるモデル性能を向上させることにより,非視覚領域に一般化することを示す。
関連論文リスト
- Scalable Visual State Space Model with Fractal Scanning [16.077348474371547]
State Space Models (SSM) はTransformerモデルの効率的な代替品として登場した。
本稿では, フラクタル走査曲線を用いたパッチシリアライゼーションを提案する。
画像分類,検出,セグメンテーションタスクにおいて,本手法の有効性を検証した。
論文 参考訳(メタデータ) (2024-05-23T12:12:11Z) - Cross-domain and Cross-dimension Learning for Image-to-Graph
Transformers [50.576354045312115]
直接画像からグラフへの変換は、単一のモデルにおけるオブジェクトの検出と関係予測を解決するための課題である。
画像-グラフ変換器のクロスドメインおよびクロス次元変換学習を可能にする一連の手法を提案する。
そこで我々は,2次元の衛星画像上でモデルを事前学習し,それを2次元および3次元の異なるターゲット領域に適用する。
論文 参考訳(メタデータ) (2024-03-11T10:48:56Z) - Random Field Augmentations for Self-Supervised Representation Learning [4.3543354293465155]
本稿では,ガウス確率場に基づく局所変換の新たなファミリーを提案し,自己教師付き表現学習のための画像拡張を生成する。
我々は、ImageNet下流分類のベースラインよりも1.7%のTop-1精度向上と、アウト・オブ・ディストリビューションiNaturalist下流分類の3.6%の改善を実現している。
弱い変換は表現を改善するが、強い変換は画像の構造を劣化させることができる。
論文 参考訳(メタデータ) (2023-11-07T00:35:09Z) - B-cos Alignment for Inherently Interpretable CNNs and Vision
Transformers [97.75725574963197]
本稿では,深層ニューラルネットワーク(DNN)の学習における重み付けの促進による解釈可能性の向上に向けた新たな方向性を提案する。
このような変換の列は、完全なモデル計算を忠実に要約する単一の線形変換を誘導することを示す。
得られた説明は視覚的品質が高く,定量的解釈可能性指標下では良好に機能することを示す。
論文 参考訳(メタデータ) (2023-06-19T12:54:28Z) - ParGAN: Learning Real Parametrizable Transformations [50.51405390150066]
本稿では、画像変換学習のためのサイクル一貫性GANフレームワークの一般化であるParGANを提案する。
提案したジェネレータは、画像と変換のパラメトリゼーションの両方を入力とする。
注釈付きパラメトリゼーションを伴わない不整合画像領域では、このフレームワークはスムーズな生成が可能であり、同時に複数の変換を学習できることを示す。
論文 参考訳(メタデータ) (2022-11-09T16:16:06Z) - Data augmentation with mixtures of max-entropy transformations for
filling-level classification [88.14088768857242]
本稿では,コンテンツレベルの分類作業のための基本データ拡張スキームを用いて,テスト時間データにおける分散シフトの問題に対処する。
このような原理的な拡張スキームは,伝達学習を利用した現在のアプローチを置き換えたり,伝達学習と組み合わせて性能を向上させることができることを示す。
論文 参考訳(メタデータ) (2022-03-08T11:41:38Z) - Topographic VAEs learn Equivariant Capsules [84.33745072274942]
本稿では, 地理的に整理された潜伏変数を用いた深部生成モデルを効率的に学習するための新しい手法であるTopographic VAEを紹介する。
このようなモデルでは,MNIST上での桁数クラス,幅,スタイルなどの健全な特徴に応じて,その活性化を組織化することが実際に学べることが示される。
我々は、既存の群同変ニューラルネットワークの能力を拡張して、複素変換に近似した同値性を示す。
論文 参考訳(メタデータ) (2021-09-03T09:25:57Z) - Robust Training Using Natural Transformation [19.455666609149567]
画像分類アルゴリズムのロバスト性を改善するための逆学習手法であるNaTraを提案する。
クラス識別とは無関係な入力画像の属性をターゲティングし、それらの属性を操作して実世界の自然変換を模倣します。
本手法の有効性を,よく訓練されたGANから導かれる非絡み合った潜在表現を用いて実証する。
論文 参考訳(メタデータ) (2021-05-10T01:56:03Z) - On Robustness and Transferability of Convolutional Neural Networks [147.71743081671508]
現代の深層畳み込みネットワーク(CNN)は、分散シフトの下で一般化しないとしてしばしば批判される。
現代画像分類CNNにおける分布外と転送性能の相互作用を初めて検討した。
トレーニングセットとモデルサイズを増大させることで、分散シフトロバスト性が著しく向上することがわかった。
論文 参考訳(メタデータ) (2020-07-16T18:39:04Z) - Group Equivariant Generative Adversarial Networks [7.734726150561089]
本研究では,グループ同変畳み込みネットワークを通じて,帰納的対称性をネットワークアーキテクチャに明示的に組み込む。
群変換はより表現力が高く、サンプルが少ないため、ジェネレータと判別器の間の勾配フィードバックが向上する。
論文 参考訳(メタデータ) (2020-05-04T17:38:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。