論文の概要: Triple-level Model Inferred Collaborative Network Architecture for Video
Deraining
- arxiv url: http://arxiv.org/abs/2111.04459v1
- Date: Mon, 8 Nov 2021 13:09:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-09 21:49:19.618101
- Title: Triple-level Model Inferred Collaborative Network Architecture for Video
Deraining
- Title(参考訳): ビデオレイニングのための3レベルモデル推論協調ネットワークアーキテクチャ
- Authors: Pan Mu, Zhu Liu, Yaohua Liu, Risheng Liu, Xin Fan
- Abstract要約: 我々は,協調最適化と自動探索機構を用いてネットワークアーキテクチャを推定するモデル誘導三段階最適化フレームワークを開発した。
我々のモデルは、最先端の作業よりも忠実度と時間的一貫性が著しく向上したことを示している。
- 参考スコア(独自算出の注目度): 43.06607185181434
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Video deraining is an important issue for outdoor vision systems and has been
investigated extensively. However, designing optimal architectures by the
aggregating model formation and data distribution is a challenging task for
video deraining. In this paper, we develop a model-guided triple-level
optimization framework to deduce network architecture with cooperating
optimization and auto-searching mechanism, named Triple-level Model Inferred
Cooperating Searching (TMICS), for dealing with various video rain
circumstances. In particular, to mitigate the problem that existing methods
cannot cover various rain streaks distribution, we first design a
hyper-parameter optimization model about task variable and hyper-parameter.
Based on the proposed optimization model, we design a collaborative structure
for video deraining. This structure includes Dominant Network Architecture
(DNA) and Companionate Network Architecture (CNA) that is cooperated by
introducing an Attention-based Averaging Scheme (AAS). To better explore
inter-frame information from videos, we introduce a macroscopic structure
searching scheme that searches from Optical Flow Module (OFM) and Temporal
Grouping Module (TGM) to help restore latent frame. In addition, we apply the
differentiable neural architecture searching from a compact candidate set of
task-specific operations to discover desirable rain streaks removal
architectures automatically. Extensive experiments on various datasets
demonstrate that our model shows significant improvements in fidelity and
temporal consistency over the state-of-the-art works. Source code is available
at https://github.com/vis-opt-group/TMICS.
- Abstract(参考訳): ビデオデラリニングは屋外視覚システムにとって重要な問題であり、広く研究されている。
しかし,集約モデル形成とデータ分散による最適アーキテクチャの設計は,ビデオデレーシングにとって困難な課題である。
本稿では,様々な降雨状況に対処する3段階モデル推論協調探索(TMICS)という,協調最適化と自動探索機構を備えたネットワークアーキテクチャを推定するモデル誘導三段階最適化フレームワークを開発する。
特に,既存の手法では様々な雨量分布をカバーできないという問題を緩和するため,タスク変数とハイパーパラメータに関するハイパーパラメータ最適化モデルをまず設計する。
提案する最適化モデルに基づき,ビデオデレーシングのための協調構造を設計する。
この構造には、AAS(Attention-based Averaging Scheme)を導入して協力する支配的ネットワークアーキテクチャ(DNA)とコンパニオントネットワークアーキテクチャ(CNA)が含まれる。
ビデオからフレーム間情報をよりよく探索するために,光学フローモジュール(OFM)とテンポラルグルーピングモジュール(TGM)から検索して潜在フレームを復元するマクロ構造探索手法を提案する。
さらに,小型のタスク固有操作候補セットから探索可能なニューラルアーキテクチャを応用し,望ましい雨のストリーク除去アーキテクチャを自動的に発見する。
様々なデータセットに対する大規模な実験により、我々のモデルは最先端の作業よりも忠実度と時間的一貫性が著しく向上していることが示されている。
ソースコードはhttps://github.com/vis-opt-group/TMICSで入手できる。
関連論文リスト
- Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - HKNAS: Classification of Hyperspectral Imagery Based on Hyper Kernel
Neural Architecture Search [104.45426861115972]
設計したハイパーカーネルを利用して,構造パラメータを直接生成することを提案する。
我々は1次元または3次元の畳み込みを伴う画素レベルの分類と画像レベルの分類を別々に行う3種類のネットワークを得る。
6つの公開データセットに関する一連の実験は、提案手法が最先端の結果を得ることを示した。
論文 参考訳(メタデータ) (2023-04-23T17:27:40Z) - POPNASv3: a Pareto-Optimal Neural Architecture Search Solution for Image
and Time Series Classification [8.190723030003804]
本稿では、異なるハードウェア環境と複数の分類タスクを対象とした逐次モデルベースNASアルゴリズムの第3版について述べる。
提案手法は,異なるタスクに適応するフレキシブルな構造とデータ処理パイプラインを維持しながら,大規模な検索空間内で競合するアーキテクチャを見つけることができる。
画像と時系列の分類データセットで実施された実験は、POPNASv3が多種多様な演算子を探索し、異なるシナリオで提供されるデータの種類に適した最適なアーキテクチャに収束できることを示す。
論文 参考訳(メタデータ) (2022-12-13T17:14:14Z) - Sparsity-guided Network Design for Frame Interpolation [39.828644638174225]
フレームベースアルゴリズムのための圧縮駆動型ネットワーク設計を提案する。
モデルサイズを大幅に削減するために、スパーシリティ誘導最適化によるモデルプルーニングを活用する。
原型AdaCoFの4分の1の大きさで大幅な性能向上を実現しています。
論文 参考訳(メタデータ) (2022-09-09T23:13:25Z) - Multi-scale Attentive Image De-raining Networks via Neural Architecture
Search [23.53770663034919]
我々は,画像デラリニングのための高性能なマルチスケール注意型ニューラルネットワーク探索(MANAS)フレームワークを開発した。
提案手法は,画像デライニング作業に好適な複数のフレキシブルモジュールを備えた,新しいマルチスケールアテンション検索空間を定式化する。
ディライニングネットワークの内部マルチスケール注意アーキテクチャは、勾配に基づく探索アルゴリズムによって自動的に探索される。
論文 参考訳(メタデータ) (2022-07-02T03:47:13Z) - One-Shot Neural Ensemble Architecture Search by Diversity-Guided Search
Space Shrinking [97.60915598958968]
本稿では,この2つの課題に対処するワンショットニューラルアンサンブルアーキテクチャサーチ(NEAS)ソリューションを提案する。
最初の課題として,探索空間の縮小を導くために,多様性に基づく新しい指標を導入する。
第2の課題として,異なるモデル間の階層共有を効率向上のために学習する新たな探索次元を実現する。
論文 参考訳(メタデータ) (2021-04-01T16:29:49Z) - Towards Automated Neural Interaction Discovery for Click-Through Rate
Prediction [64.03526633651218]
CTR(Click-Through Rate)予測は、レコメンダシステムにおいて最も重要な機械学習タスクの1つである。
本稿では,AutoCTR と呼ばれる CTR 予測のための自動インタラクションアーキテクチャ探索フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-29T04:33:01Z) - Revealing the Invisible with Model and Data Shrinking for
Composite-database Micro-expression Recognition [49.463864096615254]
入力複雑性とモデル複雑性を含む学習複雑性の影響を分析する。
より浅層構造と低分解能入力データを探索する再帰畳み込みネットワーク(RCN)を提案する。
学習可能なパラメータを増やさなくてもRCNと統合できる3つのパラメータフリーモジュールを開発した。
論文 参考訳(メタデータ) (2020-06-17T06:19:24Z) - AlphaGAN: Fully Differentiable Architecture Search for Generative
Adversarial Networks [15.740179244963116]
GAN (Generative Adversarial Networks) はミニマックスゲーム問題として定式化され、ジェネレータは差別者に対する対戦学習によって実際のデータ分布にアプローチしようとする。
本研究は,ネットワークアーキテクチャの観点からのモデル学習を促進することを目的として,GANに自動アーキテクチャ探索の最近の進歩を取り入れた。
我々は,αGANと呼ばれる,生成的敵ネットワークのための,完全に差別化可能な検索フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-16T13:27:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。