論文の概要: Training Domain-invariant Object Detector Faster with Feature Replay and
Slow Learner
- arxiv url: http://arxiv.org/abs/2105.14693v1
- Date: Mon, 31 May 2021 04:09:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-01 17:39:08.841967
- Title: Training Domain-invariant Object Detector Faster with Feature Replay and
Slow Learner
- Title(参考訳): 特徴リプレイとスローラーニングによるドメイン不変オブジェクト検出の高速化
- Authors: Chaehyeon Lee, Junghoon Seo, Heechul Jung
- Abstract要約: NDFT (Nuisance Disentangled Feature Transformation) は、NDFT(Nuisance Disentangled Feature transformation) の略で、NDFT(Nuisance Disentangled Feature transformation)の略である。
A-NDFTは2つのアクセラレーション技術、フィーチャリプレイとスローラーナーを利用している。
NDFTのトレーニング時間を31時間から3時間に短縮することができる。
- 参考スコア(独自算出の注目度): 2.331160520377439
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In deep learning-based object detection on remote sensing domain, nuisance
factors, which affect observed variables while not affecting predictor
variables, often matters because they cause domain changes. Previously,
nuisance disentangled feature transformation (NDFT) was proposed to build
domain-invariant feature extractor with with knowledge of nuisance factors.
However, NDFT requires enormous time in a training phase, so it has been
impractical. In this paper, we introduce our proposed method, A-NDFT, which is
an improvement to NDFT. A-NDFT utilizes two acceleration techniques, feature
replay and slow learner. Consequently, on a large-scale UAVDT benchmark, it is
shown that our framework can reduce the training time of NDFT from 31 hours to
3 hours while still maintaining the performance. The code will be made publicly
available online.
- Abstract(参考訳): リモートセンシング領域における深層学習に基づくオブジェクト検出では、予測変数に影響を与えることなく観察された変数に影響を与えるニュアンス因子がしばしば重要となる。
これまで、ニュアサンス因子の知識を持つドメイン不変特徴抽出器を構築するために、ニュアサンス不等角化特徴変換(ndft)が提案されてきた。
しかし、NDFTはトレーニングフェーズで膨大な時間を必要とするため、実用的ではない。
本稿では,NDFTの改良であるA-NDFTを提案する。
A-NDFTは2つのアクセラレーション技術、フィーチャリプレイとスローラーナーを利用している。
その結果、大規模uavdtベンチマークでは、性能を維持しながらndftのトレーニング時間を31時間から3時間に短縮できることが示されている。
コードはオンラインで公開されている。
関連論文リスト
- Frequency-Aware Deepfake Detection: Improving Generalizability through
Frequency Space Learning [81.98675881423131]
この研究は、目に見えないディープフェイク画像を効果的に識別できるユニバーサルディープフェイク検出器を開発するという課題に対処する。
既存の周波数ベースのパラダイムは、偽造検出のためにGANパイプラインのアップサンプリング中に導入された周波数レベルのアーティファクトに依存している。
本稿では、周波数領域学習を中心にしたFreqNetと呼ばれる新しい周波数認識手法を導入し、ディープフェイク検出器の一般化性を高めることを目的とする。
論文 参考訳(メタデータ) (2024-03-12T01:28:00Z) - Negative Feedback Training: A Novel Concept to Improve Robustness of NVCIM DNN Accelerators [11.832487701641723]
非揮発性メモリ(NVM)デバイスは、Deep Neural Network(DNN)推論の実行時のエネルギー効率とレイテンシが優れている。
ネットワークから取得したマルチスケールノイズ情報を活用した負フィードバックトレーニング(NFT)を提案する。
提案手法は,既存の最先端手法よりも46.71%の精度向上を実現している。
論文 参考訳(メタデータ) (2023-05-23T22:56:26Z) - Fast Neural Scene Flow [36.29234109363439]
座標ニューラルネットワークは、トレーニングなしで実行時のシーンフローを推定する。
本稿では,損失関数自体から生じる支配的な計算ボトルネックを伴って,シーンフローが異なることを実証する。
我々の高速ニューラルネットワークシーンフロー(FNSF)アプローチは、学習手法に匹敵するリアルタイムパフォーマンスを初めて報告します。
論文 参考訳(メタデータ) (2023-04-18T16:37:18Z) - Transform Once: Efficient Operator Learning in Frequency Domain [69.74509540521397]
本研究では、周波数領域の構造を利用して、空間や時間における長距離相関を効率的に学習するために設計されたディープニューラルネットワークについて検討する。
この研究は、単一変換による周波数領域学習のための青写真を導入している。
論文 参考訳(メタデータ) (2022-11-26T01:56:05Z) - Efficient Few-Shot Object Detection via Knowledge Inheritance [62.36414544915032]
Few-shot Object Detection (FSOD) は、未確認のタスクに少ないトレーニングサンプルで適応できるジェネリック検出器を学習することを目的としている。
計算量の増加を伴わない効率的なプレトレイン・トランスファー・フレームワーク(PTF)のベースラインを提案する。
また,予測された新しいウェイトと事前訓練されたベースウェイトとのベクトル長の不整合を軽減するために,適応長再スケーリング(ALR)戦略を提案する。
論文 参考訳(メタデータ) (2022-03-23T06:24:31Z) - Deep Frequency Filtering for Domain Generalization [55.66498461438285]
Deep Neural Networks(DNN)は、学習プロセスにおいて、いくつかの周波数成分を優先する。
本稿では、ドメイン一般化可能な特徴を学習するためのDeep Frequency Filtering (DFF)を提案する。
提案したDFFをベースラインに適用すると,ドメインの一般化タスクにおける最先端の手法よりも優れることを示す。
論文 参考訳(メタデータ) (2022-03-23T05:19:06Z) - Fourier Disentangled Space-Time Attention for Aerial Video Recognition [54.80846279175762]
本稿では,UAVビデオ行動認識のためのFAR(Fourier Activity Recognition)アルゴリズムを提案する。
我々の定式化は、人間のエージェントを背景から自然に分離するために、新しいフーリエオブジェクト・ディコンタングルメント法を用いています。
我々はUAV Human RGB、UAV Human Night、Drone Action、NEC Droneを含む複数のUAVデータセットに対するアプローチを評価した。
論文 参考訳(メタデータ) (2022-03-21T01:24:53Z) - Depthwise Spatio-Temporal STFT Convolutional Neural Networks for Human
Action Recognition [42.400429835080416]
従来の3D畳み込みニューラルネットワーク(CNN)は計算コストが高く、メモリ集約性があり、過度に適合する傾向がある。
本稿では,3次元CNNにおける3次元畳み込み層の代替として機能する新しい畳み込みブロックのクラスを提案する。
Some-something v1, v2, Jester, Diving Kinetics-400, UCF 101, HMDB 51を含む7つの行動認識データセットについて,STFTブロックをベースとした3D CNNが,現状と比較して同等以上の性能で達成可能であることを示す。
論文 参考訳(メタデータ) (2020-07-22T12:26:04Z) - iffDetector: Inference-aware Feature Filtering for Object Detection [70.8678270164057]
Inference-aware Feature Filtering (IFF)モジュールを導入し、現代の検出器と簡単に組み合わせることができる。
IFFは、畳み込み機能を強化するためにハイレベルなセマンティクスを活用することでクローズドループ最適化を行う。
IFFはCNNベースの物体検出器とプラグアンドプレイ方式で融合でき、計算コストのオーバーヘッドは無視できる。
論文 参考訳(メタデータ) (2020-06-23T02:57:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。