Fugu-MT 論文翻訳(概要): Augmentation Inside the Network

論文の概要: Augmentation Inside the Network

arxiv url: http://arxiv.org/abs/2012.10769v1
Date: Sat, 19 Dec 2020 20:07:03 GMT
ステータス: 翻訳完了
システム内更新日: 2021-05-01 11:13:59.276340
Title: Augmentation Inside the Network
Title（参考訳）: ネットワーク内の拡張
Authors: Maciej Sypetkowski, Jakub Jasiulewicz, Zbigniew Wojna
Abstract要約: 本稿では,コンピュータビジョン問題に対するデータ拡張手法をシミュレートする手法であるネットワーク内の拡張について述べる。本手法をimagenet-2012およびcifar-100データセットで検証した。
参考スコア（独自算出の注目度）: 1.1183543438473607
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In this paper, we present augmentation inside the network, a method that simulates data augmentation techniques for computer vision problems on intermediate features of a convolutional neural network. We perform these transformations, changing the data flow through the network, and sharing common computations when it is possible. Our method allows us to obtain smoother speed-accuracy trade-off adjustment and achieves better results than using standard test-time augmentation (TTA) techniques. Additionally, our approach can improve model performance even further when coupled with test-time augmentation. We validate our method on the ImageNet-2012 and CIFAR-100 datasets for image classification. We propose a modification that is 30% faster than the flip test-time augmentation and achieves the same results for CIFAR-100.
Abstract（参考訳）: 本稿では,畳み込みニューラルネットワークの中間機能に対するコンピュータビジョン問題に対するデータ拡張手法をシミュレートする手法である,ネットワーク内部の拡張について述べる。これらの変換を行い、ネットワーク内のデータフローを変更し、可能であれば共通の計算を共有します。提案手法は,TTA法よりもスムーズな速度-精度トレードオフ調整を実現し,良好な結果が得られる。さらに,テスト時間拡張と組み合わせることで,モデル性能をさらに向上させることができる。本手法をimagenet-2012およびcifar-100データセットで検証した。そこで本研究では,フリップテスト時拡張よりも30%高速で,CIFAR-100と同じ結果が得られる修正を提案する。

関連論文リスト

Diffusion-Enhanced Test-time Adaptation with Text and Image Augmentation [67.37146712877794]
IT3Aは、未知の新しいドメインから各テストサンプルをマルチモーダル拡張するために、事前訓練された生成モデルを利用する新しいテスト時間適応手法である。事前学習された視覚と言語モデルからの強化されたデータを組み合わせることで、未知の新しいテストデータに適応するモデルの能力を高めることができる。ゼロショット設定では、IT3Aは5.50%の精度で最先端のテスト時間プロンプトチューニング手法より優れている。
論文参考訳（メタデータ） (2024-12-12T20:01:24Z)
Image edge enhancement for effective image classification [7.470763273994321]
ニューラルネットワークの精度とトレーニング速度を両立させるエッジ拡張に基づく手法を提案する。我々のアプローチは、利用可能なデータセット内の画像からエッジなどの高周波特徴を抽出し、元の画像と融合させることである。
論文参考訳（メタデータ） (2024-01-13T10:01:34Z)
Sorted Convolutional Network for Achieving Continuous Rotational Invariance [56.42518353373004]
テクスチャ画像のハンドメイドな特徴に着想を得たSorting Convolution (SC)を提案する。 SCは、追加の学習可能なパラメータやデータ拡張を必要とせずに連続的な回転不変性を達成する。以上の結果から, SCは, 上記の課題において, 最高の性能を達成できることが示唆された。
論文参考訳（メタデータ） (2023-05-23T18:37:07Z)
Feature transforms for image data augmentation [74.12025519234153]
画像分類において、多くの拡張アプローチは単純な画像操作アルゴリズムを利用する。本研究では,14種類の拡張アプローチを組み合わせて生成した画像を追加することで,データレベルでのアンサンブルを構築する。事前トレーニングされたResNet50ネットワークは、各拡張メソッドから派生した画像を含むトレーニングセットに基づいて微調整される。
論文参考訳（メタデータ） (2022-01-24T14:12:29Z)
InAugment: Improving Classifiers via Internal Augmentation [14.281619356571724]
本稿では,画像内部統計を活用した新しい拡張操作を提案する。最先端の増補技術による改善を示す。また,imagenetデータセット上では,resnet50 と efficientnet-b3 top-1 の精度も向上している。
論文参考訳（メタデータ） (2021-04-08T15:37:21Z)
Learning Representational Invariances for Data-Efficient Action Recognition [52.23716087656834]
我々は,データ拡張戦略により,Kinetics-100,UCF-101,HMDB-51データセットのパフォーマンスが期待できることを示す。また,完全な教師付き設定でデータ拡張戦略を検証し,性能向上を実証した。
論文参考訳（メタデータ） (2021-03-30T17:59:49Z)
Fusion of CNNs and statistical indicators to improve image classification [65.51757376525798]
畳み込みネットワークは過去10年間、コンピュータビジョンの分野を支配してきた。この傾向を長引かせる主要な戦略は、ネットワーク規模の拡大によるものだ。我々は、異種情報ソースを追加することは、より大きなネットワークを構築するよりもCNNにとって費用対効果が高いと仮定している。
論文参考訳（メタデータ） (2020-12-20T23:24:31Z)
Fast Fourier Transformation for Optimizing Convolutional Neural Networks in Object Recognition [1.0499611180329802]
本稿では、高速フーリエ変換に基づくU-Net(完全畳み込みネットワーク)を用いて、ニューラルネットワークにおける画像畳み込みを実現することを提案する。ネットワークのトレーニング時間を改善するために,FFTベースの畳み込みニューラルネットワークを実装した。コンボリューション期間中のトレーニング時間は600-700$ms/stepから400-500$ms/stepに改善した。
論文参考訳（メタデータ） (2020-10-08T21:07:55Z)
FeatMatch: Feature-Based Augmentation for Semi-Supervised Learning [64.32306537419498]
本稿では,複雑な変換を多様に生成する特徴量に基づく改良・拡張手法を提案する。これらの変換は、クラスタリングを通じて抽出したクラス内およびクラス間の両方の情報も利用します。提案手法は,大規模データセットにスケールアップしながら,より小さなデータセットに対して,現在の最先端技術に匹敵するものであることを実証する。
論文参考訳（メタデータ） (2020-07-16T17:55:31Z)
Learning to Learn Parameterized Classification Networks for Scalable Input Images [76.44375136492827]
畳み込みニューラルネットワーク(CNN)は、入力解像度の変化に関して予測可能な認識動作を持たない。我々はメタラーナーを用いて、様々な入力スケールのメインネットワークの畳み込み重みを生成する。さらに、異なる入力解像度に基づいて、モデル予測よりもフライでの知識蒸留を利用する。
論文参考訳（メタデータ） (2020-07-13T04:27:25Z)
On the Generalization Effects of Linear Transformations in Data Augmentation [32.01435459892255]
データ拡張は、画像やテキストの分類タスクのようなアプリケーションのパフォーマンスを改善するための強力な技術である。我々は線形変換の族を研究し、過度にパラメータ化された線形回帰設定におけるリッジ推定器への影響について研究する。本稿では,モデルが変換データに対してどの程度不確実であるかによって,変換空間を探索する拡張手法を提案する。
論文参考訳（メタデータ） (2020-05-02T04:10:21Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。