論文の概要: AutoPose: Searching Multi-Scale Branch Aggregation for Pose Estimation
- arxiv url: http://arxiv.org/abs/2008.07018v1
- Date: Sun, 16 Aug 2020 22:27:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-28 11:49:27.972314
- Title: AutoPose: Searching Multi-Scale Branch Aggregation for Pose Estimation
- Title(参考訳): AutoPose: ポース推定のためのマルチスケールブランチ集約検索
- Authors: Xinyu Gong, Wuyang Chen, Yifan Jiang, Ye Yuan, Xianming Liu, Qian
Zhang, Yuan Li, Zhangyang Wang
- Abstract要約: 本稿では,新しいニューラルアーキテクチャサーチ(NAS)フレームワークであるAutoPoseを紹介する。
高精度で高解像度な2次元ポーズ推定に向けて、クロススケール接続の複数の並列ブランチを自動的に検出することができる。
- 参考スコア(独自算出の注目度): 96.29533512606078
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present AutoPose, a novel neural architecture search(NAS) framework that
is capable of automatically discovering multiple parallel branches of
cross-scale connections towards accurate and high-resolution 2D human pose
estimation. Recently, high-performance hand-crafted convolutional networks for
pose estimation show growing demands on multi-scale fusion and high-resolution
representations. However, current NAS works exhibit limited flexibility on
scale searching, they dominantly adopt simplified search spaces of
single-branch architectures. Such simplification limits the fusion of
information at different scales and fails to maintain high-resolution
representations. The presentedAutoPose framework is able to search for
multi-branch scales and network depth, in addition to the cell-level
microstructure. Motivated by the search space, a novel bi-level optimization
method is presented, where the network-level architecture is searched via
reinforcement learning, and the cell-level search is conducted by the
gradient-based method. Within 2.5 GPU days, AutoPose is able to find very
competitive architectures on the MS COCO dataset, that are also transferable to
the MPII dataset. Our code is available at
https://github.com/VITA-Group/AutoPose.
- Abstract(参考訳): 我々は,高精度かつ高解像度な2次元ポーズ推定に向けて,クロススケール接続の複数の並列分岐を自動的に検出できる新しいニューラルネットワーク探索(NAS)フレームワークであるAutoPoseを提案する。
近年,ポーズ推定のための高性能手作り畳み込みネットワークは,マルチスケール融合や高解像度表現への需要が高まっている。
しかし、現在のNASはスケール探索の柔軟性に限界があり、単一ブランチアーキテクチャの単純化された検索空間が主流である。
このような単純化は、異なるスケールでの情報の融合を制限し、高解像度表現の維持に失敗する。
presentedAutoPoseフレームワークは、セルレベルのマイクロ構造に加えて、マルチブランチスケールとネットワーク深さを検索できる。
探索空間をモチベーションとして,ネットワークレベルのアーキテクチャを強化学習により探索し,勾配法を用いてセルレベルの探索を行う,新しい二段階最適化手法を提案する。
2.5GPU日以内にAutoPoseは、MPIIデータセットにも転送可能なMS COCOデータセット上で、非常に競争力のあるアーキテクチャを見つけることができる。
私たちのコードはhttps://github.com/VITA-Group/AutoPose.comで利用可能です。
関連論文リスト
- SimQ-NAS: Simultaneous Quantization Policy and Neural Architecture
Search [6.121126813817338]
最近のワンショットニューラルネットワーク検索アルゴリズムは、特定のタスクに適したハードウェアに依存しないスーパーネットワークをトレーニングし、異なるハードウェアプラットフォームのための効率的なサブネットワークを抽出する。
我々は,光学習された予測器と組み合わせた多目的探索アルゴリズムを用いることで,サブネットワークアーキテクチャとそれに対応する量子化ポリシーの両方を効率的に探索できることを示す。
論文 参考訳(メタデータ) (2023-12-19T22:08:49Z) - HKNAS: Classification of Hyperspectral Imagery Based on Hyper Kernel
Neural Architecture Search [104.45426861115972]
設計したハイパーカーネルを利用して,構造パラメータを直接生成することを提案する。
我々は1次元または3次元の畳み込みを伴う画素レベルの分類と画像レベルの分類を別々に行う3種類のネットワークを得る。
6つの公開データセットに関する一連の実験は、提案手法が最先端の結果を得ることを示した。
論文 参考訳(メタデータ) (2023-04-23T17:27:40Z) - Multi-Objective Evolutionary for Object Detection Mobile Architectures
Search [21.14296703753317]
NASシナリオの非支配的ソートに基づく移動体検出バックボーンネットワークアーキテクチャ探索アルゴリズムを提案する。
提案手法は,重みマッピング手法を用いて,異なる深さ,幅,拡張サイズでバックボーンネットワークを探索することができる。
類似の計算複雑性の下では、検索したバックボーンネットワークアーキテクチャの精度は、MobileDetよりも2.0% mAP高い。
論文 参考訳(メタデータ) (2022-11-05T00:28:49Z) - Adaptive Linear Span Network for Object Skeleton Detection [56.78705071830965]
本研究では,適応線形スパンネットワーク(AdaLSN)を提案する。
AdaLSNは、精度とレイテンシのトレードオフを著しく高めることで、その汎用性を裏付ける。
また、エッジ検出や道路抽出といったイメージ・ツー・マスクのタスクに適用可能であることも示している。
論文 参考訳(メタデータ) (2020-11-08T12:51:14Z) - Auto-Panoptic: Cooperative Multi-Component Architecture Search for
Panoptic Segmentation [144.50154657257605]
本稿では、バックボーン、セグメンテーションブランチ、フィーチャーフュージョンモジュールを含むすべての主要コンポーネントを同時に検索する効率的なフレームワークを提案する。
検索したアーキテクチャ、すなわちAuto-Panopticは、挑戦的なCOCOとADE20Kベンチマークに関する新しい最先端技術を実現します。
論文 参考訳(メタデータ) (2020-10-30T08:34:35Z) - Real-Time Semantic Segmentation via Auto Depth, Downsampling Joint
Decision and Feature Aggregation [54.28963233377946]
本稿では,セグメンテーション戦略の自動化を目的として,AutoRTNetという共同検索フレームワークを提案する。
具体的には,ネットワーク深度とダウンサンプリング戦略を協調的に決定するハイパーセルと,自動マルチスケール機能アグリゲーションを実現するアグリゲーションセルを提案する。
論文 参考訳(メタデータ) (2020-03-31T14:02:25Z) - DCNAS: Densely Connected Neural Architecture Search for Semantic Image
Segmentation [44.46852065566759]
Densely Connected NAS (DCNAS) フレームワークを提案し、視覚情報のマルチスケール表現に対して最適なネットワーク構造を直接検索する。
具体的には,学習可能な重みを使ってセルを相互に接続することにより,多数の主流ネットワーク設計をカバーするために,密結合された検索空間を導入する。
我々は、DCNASアルゴリズムから得られたアーキテクチャが、公開セマンティックイメージセグメンテーションベンチマーク上で最先端のパフォーマンスを達成することを実証した。
論文 参考訳(メタデータ) (2020-03-26T13:21:33Z) - NAS-Count: Counting-by-Density with Neural Architecture Search [74.92941571724525]
ニューラルアーキテクチャサーチ(NAS)を用いたカウントモデルの設計を自動化する
エンド・ツー・エンドの検索エンコーダ・デコーダアーキテクチャであるAutomatic Multi-Scale Network(AMSNet)を導入する。
論文 参考訳(メタデータ) (2020-02-29T09:18:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。