論文の概要: Fourier Transform Approximation as an Auxiliary Task for Image
Classification
- arxiv url: http://arxiv.org/abs/2106.11478v2
- Date: Wed, 23 Jun 2021 02:57:42 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-24 12:07:10.326374
- Title: Fourier Transform Approximation as an Auxiliary Task for Image
Classification
- Title(参考訳): 画像分類補助タスクとしてのフーリエ変換近似
- Authors: Chen Liu
- Abstract要約: 本稿では「入力画像のフーリエ変換の近似」を画像再構成の代替として検討する。
提案する補助課題は一般に分類精度を向上することを示す。
- 参考スコア(独自算出の注目度): 3.7277308533705167
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Image reconstruction is likely the most predominant auxiliary task for image
classification. In this paper, we investigate "approximating the Fourier
Transform of the input image" as a potential alternative, in the hope that it
may further boost the performances on the primary task or introduce novel
constraints not well covered by image reconstruction. We experimented with five
popular classification architectures on the CIFAR-10 dataset, and the empirical
results indicated that our proposed auxiliary task generally improves the
classification accuracy. More notably, the results showed that in certain cases
our proposed auxiliary task may enhance the classifiers' resistance to
adversarial attacks generated using the fast gradient sign method.
- Abstract(参考訳): 画像再構成は、画像分類において最も重要な補助課題である。
本稿では「入力画像のフーリエ変換の近似」を潜在的な代替案として検討し、これが主課題における性能をさらに向上させるか、あるいは画像再構成であまりカバーされない新しい制約を導入することを期待する。
cifar-10データセット上で5つの一般的な分類アーキテクチャを実験した結果,提案手法により分類精度が向上した。
さらに,提案する補助タスクが,高速勾配符号法を用いて発生する敵攻撃に対する分類器の抵抗性を高める可能性が示唆された。
関連論文リスト
- Towards Task-Compatible Compressible Representations [0.7980273012483663]
マルチタスクで学習可能な圧縮において、あるタスクで学習した表現が別のタスクの速度歪み性能に肯定的な寄与をしない問題について検討する。
学習可能なスケーラブルコーディングでは、この共有表現を学習する際に入力再構成にも報いることで、入力再構成のためのサイド情報の利用が増加した。
我々はCOCO 2017のオブジェクト検出とCityscapesデータセットの深さ推定のために訓練された表現を用いて実験を行い、画像再構成とセマンティックセグメンテーションタスクを支援する。
論文 参考訳(メタデータ) (2024-05-16T16:47:46Z) - HAT: Hybrid Attention Transformer for Image Restoration [61.74223315807691]
トランスフォーマーに基づく手法は、画像の超解像や復調といった画像復元タスクにおいて顕著な性能を示している。
本稿では,新たなHAT(Hybrid Attention Transformer)を提案する。
我々のHATは,定量的かつ定性的に,最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-09-11T05:17:55Z) - Image Deblurring by Exploring In-depth Properties of Transformer [86.7039249037193]
我々は、事前訓練された視覚変換器(ViT)から抽出した深い特徴を活用し、定量的な測定値によって測定された性能を犠牲にすることなく、回復した画像のシャープ化を促進する。
得られた画像と対象画像の変換器特徴を比較することにより、事前学習された変換器は、高解像度のぼやけた意味情報を提供する。
特徴をベクトルとみなし、抽出された画像から抽出された表現とユークリッド空間における対象表現との差を計算する。
論文 参考訳(メタデータ) (2023-03-24T14:14:25Z) - Revisiting Image Reconstruction for Semi-supervised Semantic
Segmentation [16.27277238968567]
画像再構成を補助課題として利用し、半教師付きセマンティックセグメンテーションフレームワークに組み込むという考え方を再考する。
驚くことに、このような半教師付き学習の古いアイデアは、最先端のセマンティックセグメンテーションアルゴリズムと競合する結果をもたらす。
論文 参考訳(メタデータ) (2023-03-17T06:31:06Z) - Reconstruction Task Finds Universal Winning Tickets [24.52604301906691]
十分に訓練されたニューラルネットワークは、コンピュータビジョンシステムにおいて有望な精度と効率のトレードオフを実現するのに有効である。
既存のプルーニングアルゴリズムのほとんどは、ソースドメインで定義された分類タスクのみに焦点を当てている。
本稿では,画像レベルのプレトレインタスクは,下流の様々なタスクに対して,モデルを刈り取ることができないことを示す。
論文 参考訳(メタデータ) (2022-02-23T13:04:32Z) - Amicable Aid: Perturbing Images to Improve Classification Performance [20.9291591835171]
深層画像分類モデルに攻撃する 画像の敵対的摂動は 実際に深刻なセキュリティ上の懸念を引き起こす
摂動の逆の探索方向を取れば,画像が修正され,高い分類信頼性が得られることを示す。
複数の画像に一定の摂動を印加し,その分類結果を改善できるユニバーサル・アミリタブル・エイズについて検討する。
論文 参考訳(メタデータ) (2021-12-09T06:16:08Z) - Contextual Similarity Aggregation with Self-attention for Visual
Re-ranking [96.55393026011811]
本稿では,自己注意を伴う文脈的類似性集約による視覚的再ランク付け手法を提案する。
提案手法の汎用性と有効性を示すため,4つのベンチマークデータセットの総合的な実験を行った。
論文 参考訳(メタデータ) (2021-10-26T06:20:31Z) - Few-Shot Learning with Part Discovery and Augmentation from Unlabeled
Images [79.34600869202373]
帰納的バイアスは、ラベルなし画像の平坦な集合から学習でき、目に見えるクラスと目に見えないクラスの間で伝達可能な表現としてインスタンス化されることを示す。
具体的には、トランスファー可能な表現を学習するための、新しいパートベース自己教師型表現学習手法を提案する。
我々の手法は印象的な結果をもたらし、それまでの最高の教師なし手法を7.74%、9.24%上回った。
論文 参考訳(メタデータ) (2021-05-25T12:22:11Z) - Ensembling with Deep Generative Views [72.70801582346344]
生成モデルは、色やポーズの変化などの現実世界の変動を模倣する人工画像の「ビュー」を合成することができる。
そこで本研究では, 画像分類などの下流解析作業において, 実画像に適用できるかどうかを検討する。
StyleGAN2を再生増強の源として使用し、顔の属性、猫の顔、車を含む分類タスクについてこの設定を調査します。
論文 参考訳(メタデータ) (2021-04-29T17:58:35Z) - Cross-Modal Retrieval Augmentation for Multi-Modal Classification [61.5253261560224]
画像の非構造化外部知識源とそれに対応するキャプションを用いて視覚的質問応答を改善する。
まず,画像とキャプションを同一空間に埋め込むための新しいアライメントモデルを訓練し,画像検索の大幅な改善を実現する。
第2に、トレーニングされたアライメントモデルを用いた検索強化マルチモーダルトランスは、強いベースライン上でのVQAの結果を改善することを示す。
論文 参考訳(メタデータ) (2021-04-16T13:27:45Z) - Image Inpainting with Learnable Feature Imputation [8.293345261434943]
正規畳み込み層は、未知の領域にフィルターを適用するのと同じ方法で、塗装された画像の視覚的アーティファクトを引き起こす。
本稿では,欠落した入力値の畳み込みに対する(階層的な)特徴計算を提案する。
我々はCelebA-HQとPlaces2を比較し,そのモデルを検証する。
論文 参考訳(メタデータ) (2020-11-02T16:05:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。