論文の概要: NAS-Count: Counting-by-Density with Neural Architecture Search
- arxiv url: http://arxiv.org/abs/2003.00217v2
- Date: Thu, 13 Aug 2020 03:54:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-27 20:53:28.897714
- Title: NAS-Count: Counting-by-Density with Neural Architecture Search
- Title(参考訳): NAS-Count:ニューラルアーキテクチャサーチによる数値分割
- Authors: Yutao Hu, Xiaolong Jiang, Xuhui Liu, Baochang Zhang, Jungong Han,
Xianbin Cao, David Doermann
- Abstract要約: ニューラルアーキテクチャサーチ(NAS)を用いたカウントモデルの設計を自動化する
エンド・ツー・エンドの検索エンコーダ・デコーダアーキテクチャであるAutomatic Multi-Scale Network(AMSNet)を導入する。
- 参考スコア(独自算出の注目度): 74.92941571724525
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most of the recent advances in crowd counting have evolved from hand-designed
density estimation networks, where multi-scale features are leveraged to
address the scale variation problem, but at the expense of demanding design
efforts. In this work, we automate the design of counting models with Neural
Architecture Search (NAS) and introduce an end-to-end searched encoder-decoder
architecture, Automatic Multi-Scale Network (AMSNet). Specifically, we utilize
a counting-specific two-level search space. The encoder and decoder in AMSNet
are composed of different cells discovered from micro-level search, while the
multi-path architecture is explored through macro-level search. To solve the
pixel-level isolation issue in MSE loss, AMSNet is optimized with an
auto-searched Scale Pyramid Pooling Loss (SPPLoss) that supervises the
multi-scale structural information. Extensive experiments on four datasets show
AMSNet produces state-of-the-art results that outperform hand-designed models,
fully demonstrating the efficacy of NAS-Count.
- Abstract(参考訳): 近年のクラウドカウンティングの進歩のほとんどは、大規模化の問題に対処するために多スケールの特徴を活用できる手作り密度推定ネットワークから発展してきたが、設計の努力を犠牲にしている。
本研究では,ニューラルアーキテクチャサーチ(NAS)を用いたモデルカウントの設計を自動化し,エンドツーエンドのエンコーダデコーダアーキテクチャである自動マルチスケールネットワーク(AMSNet)を導入する。
具体的には、カウント特化二段階探索空間を利用する。
AMSNetのエンコーダとデコーダはマイクロレベルサーチから検出された異なるセルで構成され、マルチパスアーキテクチャはマクロレベルサーチによって探索される。
MSE損失における画素レベルの分離問題を解決するため、AMSNetはマルチスケール構造情報を監督する自動探索型スケールピラミッドプール損失(SPPLoss)で最適化される。
4つのデータセットに対する大規模な実験により、AMSNetは手作業で設計したモデルよりも優れており、NAS-Countの有効性を完全に実証している。
関連論文リスト
- DNA Family: Boosting Weight-Sharing NAS with Block-Wise Supervisions [121.05720140641189]
蒸留型ニューラルアーキテクチャ(DNA)技術を用いたモデル群を開発した。
提案するDNAモデルでは,アルゴリズムを用いてサブサーチ空間にのみアクセス可能な従来の手法とは対照的に,すべてのアーキテクチャ候補を評価できる。
当社のモデルでは,モバイルコンボリューションネットワークと小型ビジョントランスフォーマーにおいて,ImageNet上で78.9%,83.6%の最先端トップ1精度を実現している。
論文 参考訳(メタデータ) (2024-03-02T22:16:47Z) - DONNAv2 -- Lightweight Neural Architecture Search for Vision tasks [6.628409795264665]
計算効率の良いニューラルアーキテクチャ蒸留 - DONNAv2 のための次世代ニューラルアーキテクチャ設計について述べる。
DONNAv2は、より大きなデータセットに対して、DONNAの計算コストを10倍削減する。
NASサーチスペースの品質を向上させるため、DONNAv2はブロック知識蒸留フィルタを利用して推論コストの高いブロックを除去する。
論文 参考訳(メタデータ) (2023-09-26T04:48:50Z) - Efficient Search of Multiple Neural Architectures with Different
Complexities via Importance Sampling [3.759936323189417]
本研究では、2つのメトリクスの重み付け和からなる目的関数を最適化するアーキテクチャの複雑性を考慮したワンショットNASに焦点を当てた。
提案手法は,CIAFR-10およびImageNetデータセット上の畳み込みニューラルネットワークのアーキテクチャ探索に適用される。
論文 参考訳(メタデータ) (2022-07-21T07:06:03Z) - NAS-TC: Neural Architecture Search on Temporal Convolutions for Complex
Action Recognition [45.168746142597946]
ニューラルアーキテクチャサーチ-時間畳み込み(NAS-TC)と呼ばれる新しい処理フレームワークを提案する。
第1段階では、古典的なCNNネットワークがバックボーンネットワークとして使われ、計算集約的な特徴抽出タスクが完了する。
第2段階では、セルへの簡単な縫合探索を用いて、比較的軽量な長時間時間依存情報抽出を完了させる。
論文 参考訳(メタデータ) (2021-03-17T02:02:11Z) - Hierarchical Neural Architecture Search for Deep Stereo Matching [131.94481111956853]
本稿では, ディープステレオマッチングのための最初のエンドツーエンド階層型NASフレームワークを提案する。
我々のフレームワークは、タスク固有の人間の知識をニューラルアーキテクチャ検索フレームワークに組み込んでいる。
KITTI stereo 2012、2015、Middleburyベンチマークで1位、SceneFlowデータセットで1位にランクインしている。
論文 参考訳(メタデータ) (2020-10-26T11:57:37Z) - MS-RANAS: Multi-Scale Resource-Aware Neural Architecture Search [94.80212602202518]
我々は,MS-RANAS(Multi-Scale Resource-Aware Neural Architecture Search)を提案する。
我々は,検索コストの削減を図るために,ワンショットのアーキテクチャ探索手法を採用した。
我々は精度-速度トレードオフの観点から最先端の結果を得る。
論文 参考訳(メタデータ) (2020-09-29T11:56:01Z) - AutoPose: Searching Multi-Scale Branch Aggregation for Pose Estimation [96.29533512606078]
本稿では,新しいニューラルアーキテクチャサーチ(NAS)フレームワークであるAutoPoseを紹介する。
高精度で高解像度な2次元ポーズ推定に向けて、クロススケール接続の複数の並列ブランチを自動的に検出することができる。
論文 参考訳(メタデータ) (2020-08-16T22:27:43Z) - Stage-Wise Neural Architecture Search [65.03109178056937]
ResNetやNASNetのような現代の畳み込みネットワークは、多くのコンピュータビジョンアプリケーションで最先端の結果を得た。
これらのネットワークは、同じ解像度で表現を操作するレイヤのセットであるステージで構成されている。
各ステージにおけるレイヤー数の増加はネットワークの予測能力を向上させることが示されている。
しかし、結果として得られるアーキテクチャは、浮動小数点演算、メモリ要求、推論時間の観点から計算的に高価になる。
論文 参考訳(メタデータ) (2020-04-23T14:16:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。