論文の概要: SRF-GAN: Super-Resolved Feature GAN for Multi-Scale Representation
- arxiv url: http://arxiv.org/abs/2011.08459v1
- Date: Tue, 17 Nov 2020 06:27:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-24 16:48:00.053499
- Title: SRF-GAN: Super-Resolved Feature GAN for Multi-Scale Representation
- Title(参考訳): SRF-GAN:マルチスケール表現のための超解像GAN
- Authors: Seong-Ho Lee and Seung-Hwan Bae
- Abstract要約: 畳み込み型物体検出器の超解像特性のための新しい生成器を提案する。
本稿では,検出ベースジェネレータと特徴パッチ識別器で構成される超解像GAN(SRF-GAN)を設計する。
我々のSRFジェネレータは従来の方法に代えて、他の従来の検出器と簡単に微調整できる。
- 参考スコア(独自算出の注目度): 5.634825161148483
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent convolutional object detectors exploit multi-scale feature
representations added with top-down pathway in order to detect objects at
different scales and learn stronger semantic feature responses. In general,
during the top-down feature propagation, the coarser feature maps are upsampled
to be combined with the features forwarded from bottom-up pathway, and the
combined stronger semantic features are inputs of detector's headers. However,
simple interpolation methods (e.g. nearest neighbor and bilinear) are still
used for increasing feature resolutions although they cause noisy and blurred
features. In this paper, we propose a novel generator for super-resolving
features of the convolutional object detectors. To achieve this, we first
design super-resolved feature GAN (SRF-GAN) consisting of a detection-based
generator and a feature patch discriminator. In addition, we present SRF-GAN
losses for generating the high quality of super-resolved features and improving
detection accuracy together. Our SRF generator can substitute for the
traditional interpolation methods, and easily fine-tuned combined with other
conventional detectors. To prove this, we have implemented our SRF-GAN by using
the several recent one-stage and two-stage detectors, and improved detection
accuracy over those detectors. Code is available at
https://github.com/SHLee-cv/SRF-GAN.
- Abstract(参考訳): 最近の畳み込み物体検出器は、様々なスケールの物体を検出し、より強い意味的特徴応答を学ぶために、トップダウン経路に付加されたマルチスケール特徴表現を利用する。
一般に、トップダウンの特徴伝達の間、より粗い特徴マップはボトムアップ経路から転送される特徴と組み合わせられ、より強力な意味的特徴は検出器のヘッダの入力である。
しかし、単純な補間法(近辺や双線型など)は、ノイズやぼやけた特徴を生じさせるが、機能分解能を高めるためにも使われている。
本稿では,畳み込み物体検出器の特徴を超解くための新しい生成器を提案する。
そこで我々は,まず,検出ベースジェネレータと特徴パッチ識別器からなる超解像GAN(SRF-GAN)を設計する。
さらに,超解像の高品質化と検出精度の向上を図るため,SRF-GANの損失について述べる。
我々のSRFジェネレータは従来の補間法に代えて、他の検出器と簡単に微調整できる。
これを証明するために、我々は最近の1段検出器と2段検出器を用いてSRF-GANを実装し、検出精度を改善した。
コードはhttps://github.com/SHLee-cv/SRF-GANで公開されている。
関連論文リスト
- Renormalized Connection for Scale-preferred Object Detection in Satellite Imagery [51.83786195178233]
我々は、効率的な特徴抽出の観点から再正規化群理論を実装するために、知識発見ネットワーク(KDN)を設計する。
KDN上の再正規化接続(RC)は、マルチスケール特徴の「相乗的焦点」を可能にする。
RCはFPNベースの検出器のマルチレベル特徴の分割・対数機構を幅広いスケールで予測されたタスクに拡張する。
論文 参考訳(メタデータ) (2024-09-09T13:56:22Z) - Efficient Meta-Learning Enabled Lightweight Multiscale Few-Shot Object Detection in Remote Sensing Images [15.12889076965307]
YOLOv7ワンステージ検出器は、新しいメタラーニングトレーニングフレームワークが組み込まれている。
この変換により、検出器はFSODのタスクに十分対応できると同時に、その固有の軽量化の利点を活かすことができる。
提案検出器の有効性を検証するため, 現状の検出器と性能比較を行った。
論文 参考訳(メタデータ) (2024-04-29T04:56:52Z) - STMixer: A One-Stage Sparse Action Detector [43.62159663367588]
よりフレキシブルな1段アクション検出器のための2つのコア設計を提案する。
まず、クエリベースの適応的特徴サンプリングモジュールを分離し、ビデオ時間領域全体から特徴群をマイニングする柔軟性を備えた検出器を実現する。
第2に,より優れた特徴復号化のために,空間次元と時間次元の混合に動的に参画する分離された特徴混合モジュールを考案する。
論文 参考訳(メタデータ) (2024-04-15T14:52:02Z) - Frequency-Aware Deepfake Detection: Improving Generalizability through
Frequency Space Learning [81.98675881423131]
この研究は、目に見えないディープフェイク画像を効果的に識別できるユニバーサルディープフェイク検出器を開発するという課題に対処する。
既存の周波数ベースのパラダイムは、偽造検出のためにGANパイプラインのアップサンプリング中に導入された周波数レベルのアーティファクトに依存している。
本稿では、周波数領域学習を中心にしたFreqNetと呼ばれる新しい周波数認識手法を導入し、ディープフェイク検出器の一般化性を高めることを目的とする。
論文 参考訳(メタデータ) (2024-03-12T01:28:00Z) - Global Context Aggregation Network for Lightweight Saliency Detection of
Surface Defects [70.48554424894728]
我々は,エンコーダ・デコーダ構造上の表面欠陥を簡易に検出するためのGCANet(Global Context Aggregation Network)を開発した。
まず、軽量バックボーンの上部層に新しいトランスフォーマーエンコーダを導入し、DSA(Depth-wise Self-Attention)モジュールを通じてグローバルなコンテキスト情報をキャプチャする。
3つの公開欠陥データセットの実験結果から,提案したネットワークは,他の17の最先端手法と比較して,精度と実行効率のトレードオフを良好に達成できることが示された。
論文 参考訳(メタデータ) (2023-09-22T06:19:11Z) - Towards Efficient Use of Multi-Scale Features in Transformer-Based
Object Detectors [49.83396285177385]
マルチスケール機能は、オブジェクト検出に非常に効果的であることが証明されているが、多くの場合、巨大な計算コストが伴う。
本稿では,Transformerベースのオブジェクト検出器において,マルチスケール機能を効率的に利用するための汎用パラダイムとして,Iterative Multi-scale Feature Aggregation (IMFA)を提案する。
論文 参考訳(メタデータ) (2022-08-24T08:09:25Z) - Integral Migrating Pre-trained Transformer Encoder-decoders for Visual
Object Detection [78.2325219839805]
imTEDは、数発のオブジェクト検出の最先端を最大7.6%改善する。
MS COCOデータセットの実験は、imTEDが一貫してそのデータセットを2.8%上回っていることを示している。
論文 参考訳(メタデータ) (2022-05-19T15:11:20Z) - Generalizing Face Forgery Detection with High-frequency Features [63.33397573649408]
現在のCNNベースの検出器は、メソッド固有の色テクスチャに過度に適合するため、一般化に失敗する傾向にある。
フェースフォージェリ検出に高周波雑音を用いることを提案する。
1つは、複数のスケールで高周波ノイズを抽出するマルチスケールの高周波特徴抽出モジュールである。
2つ目は、低レベルRGB特徴抽出器を導く残差誘導空間注意モジュールで、新しい視点からフォージェリートレースにもっと集中する。
論文 参考訳(メタデータ) (2021-03-23T08:19:21Z) - Small-Object Detection in Remote Sensing Images with End-to-End
Edge-Enhanced GAN and Object Detector Network [9.135036713000513]
超高分解能GAN(ESRGAN)と呼ばれるGANベースモデルでは,画像強調性能が顕著である。
リモートセンシング画像の画質を向上させるために,新しいエッジ強化超解像GAN(EESRGAN)を提案する。
論文 参考訳(メタデータ) (2020-03-20T03:07:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。