論文の概要: TorMentor: Deterministic dynamic-path, data augmentations with fractals
- arxiv url: http://arxiv.org/abs/2204.03776v1
- Date: Thu, 7 Apr 2022 23:28:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-11 20:13:37.870487
- Title: TorMentor: Deterministic dynamic-path, data augmentations with fractals
- Title(参考訳): TorMentor: 決定論的動的パス、フラクタルによるデータ拡張
- Authors: Anguelos Nicolaou, Vincent Christlein, Edgar Riba, Jian Shi, Georg
Vogeler, Mathias Seuret
- Abstract要約: プラズマフラクタルを用いて局所的な連続変換に大域的な画像拡張変換を適用する。
本稿では,TorMentorの画像拡張フレームワークについて述べる。
- 参考スコア(独自算出の注目度): 8.100004428378066
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose the use of fractals as a means of efficient data augmentation.
Specifically, we employ plasma fractals for adapting global image augmentation
transformations into continuous local transforms. We formulate the diamond
square algorithm as a cascade of simple convolution operations allowing
efficient computation of plasma fractals on the GPU. We present the TorMentor
image augmentation framework that is totally modular and deterministic across
images and point-clouds. All image augmentation operations can be combined
through pipelining and random branching to form flow networks of arbitrary
width and depth. We demonstrate the efficiency of the proposed approach with
experiments on document image segmentation (binarization) with the DIBCO
datasets. The proposed approach demonstrates superior performance to
traditional image augmentation techniques. Finally, we use extended synthetic
binary text images in a self-supervision regiment and outperform the same model
when trained with limited data and simple extensions.
- Abstract(参考訳): 効率的なデータ拡張手段としてのフラクタルの利用を提案する。
具体的には,プラズマフラクタルを用いてグローバル画像拡張変換を連続的局所変換に適応させる。
簡単な畳み込み演算のカスケードとしてダイアモンド四角アルゴリズムを定式化し、GPU上のプラズマフラクタルの効率的な計算を可能にする。
本稿では,画像とポイントクラウドにまたがる完全モジュール性と決定性を備えた tormentor 画像拡張フレームワークを提案する。
すべての画像拡張操作は、パイプライニングとランダム分岐により、任意の幅と深さのフローネットワークを形成することができる。
本稿では,DIBCOデータセットを用いた文書画像分割(バイナリ化)実験により提案手法の有効性を示す。
提案手法は従来の画像強調技術よりも優れた性能を示す。
最後に,拡張合成バイナリ画像を用いた自己スーパービジョン連隊において,限られたデータと単純な拡張でトレーニングした場合に,同じモデルを上回らせる。
関連論文リスト
- MGAug: Multimodal Geometric Augmentation in Latent Spaces of Image
Deformations [2.711740183729759]
本稿では,幾何変形の多モード潜在空間における拡張変換を生成する新しいモデルを提案する。
実験結果から,提案手法は予測精度を大幅に向上させることで,全てのベースラインよりも優れた性能を示すことがわかった。
論文 参考訳(メタデータ) (2023-12-20T21:30:55Z) - Masked Autoencoders are Robust Data Augmentors [90.34825840657774]
ディープニューラルネットワークの一般化には、画像拡張のような正規化技術が必要である。
本稿では,トレーニングプロセスの正規化に向けて,新たな拡張の視点を提案する。
このようなモデルに基づく非線形変換をデータ拡張として活用することで,高レベルの認識タスクを向上できることを示す。
論文 参考訳(メタデータ) (2022-06-10T02:41:48Z) - Feature transforms for image data augmentation [74.12025519234153]
画像分類において、多くの拡張アプローチは単純な画像操作アルゴリズムを利用する。
本研究では,14種類の拡張アプローチを組み合わせて生成した画像を追加することで,データレベルでのアンサンブルを構築する。
事前トレーニングされたResNet50ネットワークは、各拡張メソッドから派生した画像を含むトレーニングセットに基づいて微調整される。
論文 参考訳(メタデータ) (2022-01-24T14:12:29Z) - CSformer: Bridging Convolution and Transformer for Compressive Sensing [65.22377493627687]
本稿では,CNNからの詳細な空間情報を活用するためのハイブリッドフレームワークと,表現学習の強化を目的としたトランスフォーマーが提供するグローバルコンテキストを統合することを提案する。
提案手法は、適応的なサンプリングとリカバリからなるエンドツーエンドの圧縮画像センシング手法である。
実験により, 圧縮センシングにおける専用トランスアーキテクチャの有効性が示された。
論文 参考訳(メタデータ) (2021-12-31T04:37:11Z) - Learning Discriminative Shrinkage Deep Networks for Image Deconvolution [122.79108159874426]
本稿では,これらの用語を暗黙的にモデル化する識別的縮小関数を学習することで,効果的に非盲検デコンボリューション手法を提案する。
実験結果から,提案手法は最先端の手法に対して,効率と精度の点で好適に動作することがわかった。
論文 参考訳(メタデータ) (2021-11-27T12:12:57Z) - Enhancing MR Image Segmentation with Realistic Adversarial Data
Augmentation [17.539828821476224]
本稿では,学習データの利用効率を向上させるために,逆データ拡張手法を提案する。
本稿では,データ拡張モデルとセグメンテーションネットワークを協調的に最適化する汎用的なタスク駆動学習フレームワークを提案する。
提案した逆データ拡張は生成ネットワークに依存しず,汎用セグメンテーションネットワークのプラグインモジュールとして使用できる。
論文 参考訳(メタデータ) (2021-08-07T11:32:37Z) - Scalable Visual Transformers with Hierarchical Pooling [61.05787583247392]
本稿では,視覚的トークンを徐々にプールしてシーケンス長を縮小する階層的ビジュアルトランスフォーマ(hvt)を提案する。
計算の複雑さを増すことなく、深さ/幅/解像度/パッチサイズの寸法をスケールすることで、大きなメリットをもたらします。
当社のHVTはImageNetとCIFAR-100データセットの競合ベースラインを上回っています。
論文 参考訳(メタデータ) (2021-03-19T03:55:58Z) - RG-Flow: A hierarchical and explainable flow model based on
renormalization group and sparse prior [2.274915755738124]
フローベース生成モデルは、教師なし学習アプローチの重要なクラスとなっている。
本研究では, 階層型フローベース生成モデル RG-Flow の設計のために, 再正規化群 (RG) とスパース事前分布の鍵となる概念を取り入れた。
提案手法は, エッジ長が$L$の画像の描画に$O(log L)$の複雑さを伴っているが, 従来より$O(L2)$の複雑性を持つ生成モデルに比べれば, エッジ長が$L$の画像の描画には$O(log L)$の複雑さがある。
論文 参考訳(メタデータ) (2020-09-30T18:04:04Z) - FeatMatch: Feature-Based Augmentation for Semi-Supervised Learning [64.32306537419498]
本稿では,複雑な変換を多様に生成する特徴量に基づく改良・拡張手法を提案する。
これらの変換は、クラスタリングを通じて抽出したクラス内およびクラス間の両方の情報も利用します。
提案手法は,大規模データセットにスケールアップしながら,より小さなデータセットに対して,現在の最先端技術に匹敵するものであることを実証する。
論文 参考訳(メタデータ) (2020-07-16T17:55:31Z) - On Box-Cox Transformation for Image Normality and Pattern Classification [0.6548580592686074]
本稿では,2次元データ変換のための前処理ステップとして,そのようなツールの有用性について論じる。
我々は、この軽量なBox-Cox変換の効果を、最先端の低光画像強調技術と比較した。
また,画像の視覚的外観を汎用的に改善するために,複数のテストベッドデータセットによるアプローチの有効性を実証した。
論文 参考訳(メタデータ) (2020-04-15T17:10:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。