論文の概要: Spatial Attention-based Distribution Integration Network for Human Pose
Estimation
- arxiv url: http://arxiv.org/abs/2311.05323v1
- Date: Thu, 9 Nov 2023 12:43:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-10 15:31:02.236434
- Title: Spatial Attention-based Distribution Integration Network for Human Pose
Estimation
- Title(参考訳): 空間的注意に基づく人文推定のための分布統合ネットワーク
- Authors: Sihan Gao, Jing Zhu, Xiaoxuan Zhuang, Zhaoyue Wang, and Qijin Li
- Abstract要約: 本研究では,空間アテンションに基づく分布統合ネットワーク(SADI-NET)を提案する。
我々のネットワークは、受容強化モジュール(RFM)、空間融合モジュール(SFM)、分散学習モジュール(DLM)の3つの効率的なモデルで構成されている。
我々のモデルは、MPIIテストデータセットで920.10%の精度を得、既存のモデルよりも大幅に改善され、最先端のパフォーマンスが確立された。
- 参考スコア(独自算出の注目度): 0.8052382324386398
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, human pose estimation has made significant progress through
the implementation of deep learning techniques. However, these techniques still
face limitations when confronted with challenging scenarios, including
occlusion, diverse appearances, variations in illumination, and overlap. To
cope with such drawbacks, we present the Spatial Attention-based Distribution
Integration Network (SADI-NET) to improve the accuracy of localization in such
situations. Our network consists of three efficient models: the receptive
fortified module (RFM), spatial fusion module (SFM), and distribution learning
module (DLM). Building upon the classic HourglassNet architecture, we replace
the basic block with our proposed RFM. The RFM incorporates a dilated residual
block and attention mechanism to expand receptive fields while enhancing
sensitivity to spatial information. In addition, the SFM incorporates
multi-scale characteristics by employing both global and local attention
mechanisms. Furthermore, the DLM, inspired by residual log-likelihood
estimation (RLE), reconfigures a predicted heatmap using a trainable
distribution weight. For the purpose of determining the efficacy of our model,
we conducted extensive experiments on the MPII and LSP benchmarks.
Particularly, our model obtained a remarkable $92.10\%$ percent accuracy on the
MPII test dataset, demonstrating significant improvements over existing models
and establishing state-of-the-art performance.
- Abstract(参考訳): 近年,人間のポーズ推定は深層学習技術の実装を通じて大きな進歩を遂げている。
しかし、これらのテクニックは、隠蔽、多様な外観、照明のバリエーション、重複など、困難なシナリオに直面した場合でも制限に直面している。
そこで,このような欠点に対処するため,spatial attention-based distribution integration network (sadi-net) を提案する。
我々のネットワークは, 受容強化モジュール(RFM), 空間融合モジュール(SFM), 分散学習モジュール(DLM)の3つの効率的なモデルで構成されている。
古典的なHourglassNetアーキテクチャを基盤として,提案したRAMを基本ブロックに置き換える。
rfmは、空間情報に対する感度を高めつつ受容野を広げるために拡張された残留ブロックと注意機構を組み込んでいる。
さらに、sfmは、グローバルとローカルの両方の注意機構を使用することで、マルチスケールの特徴を取り入れている。
さらに、残ログ類似度推定(RLE)にインスパイアされたDLMは、トレーニング可能な分布重みを使って予測されたヒートマップを再構成する。
本モデルの有効性を決定するため,MPIIおよびLSPベンチマークで広範囲にわたる実験を行った。
特に,MPIIテストデータセットの精度は92.10 %で,既存のモデルよりも大幅に改善され,最先端のパフォーマンスが確立した。
関連論文リスト
- A Collaborative Model-driven Network for MRI Reconstruction [9.441882492801174]
本稿では,様々な正規化器の相補性を生かした協調型モデル駆動ネットワークを提案する。
計算コストを伴わずに最終結果に大幅な改善が見られた。
論文 参考訳(メタデータ) (2024-02-04T07:29:00Z) - Enhancing Automatic Modulation Recognition through Robust Global Feature
Extraction [12.868218616042292]
変調信号は長時間の時間依存性を示す。
人間の専門家は星座図のパターンを分析し、変調スキームを分類する。
古典的な畳み込みベースのネットワークは、局所的な特徴を抽出することに長けているが、グローバルな関係を捉えるのに苦労している。
論文 参考訳(メタデータ) (2024-01-02T06:31:24Z) - Embedded feature selection in LSTM networks with multi-objective
evolutionary ensemble learning for time series forecasting [49.1574468325115]
本稿では,Long Short-Term Memory Networkに埋め込まれた特徴選択手法を提案する。
本手法はLSTMの重みと偏りを分割的に最適化する。
イタリアとスペイン南東部の大気質時系列データの実験的評価により,従来のLSTMの能力一般化が著しく向上することが確認された。
論文 参考訳(メタデータ) (2023-12-29T08:42:10Z) - Diffusion Models Without Attention [110.5623058129782]
Diffusion State Space Model (DiffuSSM) は、よりスケーラブルな状態空間モデルバックボーンで注目メカニズムを置き換えるアーキテクチャである。
拡散訓練におけるFLOP効率の高いアーキテクチャへの注力は、大きな前進となる。
論文 参考訳(メタデータ) (2023-11-30T05:15:35Z) - SatDM: Synthesizing Realistic Satellite Image with Semantic Layout
Conditioning using Diffusion Models [0.0]
Denoising Diffusion Probabilistic Models (DDPM) は意味的レイアウトから現実的なイメージを合成する上で大きな可能性を証明している。
本稿では,セマンティックマップを用いて高品質で多様な衛星画像を生成する条件付きDDPMモデルを提案する。
提案モデルの有効性は,本研究の文脈内で導入した詳細なラベル付きデータセットを用いて検証する。
論文 参考訳(メタデータ) (2023-09-28T19:39:13Z) - Multi-Agent Reinforcement Learning for Adaptive Mesh Refinement [17.72127385405445]
完全協調型マルコフゲームとしてアダプティブメッシュリファインメント(AMR)の新たな定式化を提案する。
VDGN(Value Decomposition Graph Network)と呼ばれる新しい深層マルチエージェント強化学習アルゴリズムを設計する。
VDGNポリシは,グローバルエラーおよびコスト指標において,エラーしきい値に基づくポリシよりも大幅に優れていることを示す。
論文 参考訳(メタデータ) (2022-11-02T00:41:32Z) - FedDM: Iterative Distribution Matching for Communication-Efficient
Federated Learning [87.08902493524556]
フェデレートラーニング(FL)は近年、学術や産業から注目を集めている。
我々は,複数の局所的代理関数からグローバルなトレーニング目標を構築するためのFedDMを提案する。
そこで本研究では,各クライアントにデータ集合を構築し,元のデータから得られた損失景観を局所的にマッチングする。
論文 参考訳(メタデータ) (2022-07-20T04:55:18Z) - Batch-Ensemble Stochastic Neural Networks for Out-of-Distribution
Detection [55.028065567756066]
Out-of-Distribution(OOD)検出は、機械学習モデルを現実世界のアプリケーションにデプロイすることの重要性から、マシンラーニングコミュニティから注目を集めている。
本稿では,特徴量の分布をモデル化した不確実な定量化手法を提案する。
バッチアンサンブルニューラルネットワーク(BE-SNN)の構築と機能崩壊問題の克服を目的として,効率的なアンサンブル機構,すなわちバッチアンサンブルを組み込んだ。
We show that BE-SNNs yield superior performance on the Two-Moons dataset, the FashionMNIST vs MNIST dataset, FashionM。
論文 参考訳(メタデータ) (2022-06-26T16:00:22Z) - Interpretable AI-based Large-scale 3D Pathloss Prediction Model for
enabling Emerging Self-Driving Networks [3.710841042000923]
本稿では,新しい鍵予測器を応用した機械学習モデルを提案する。
予測,一般化,計算性能の観点から各種MLアルゴリズムの性能を定量的に評価することにより,光グラディエントブースティングマシン(LightGBM)アルゴリズムが全体として他のアルゴリズムより優れていることを示す。
論文 参考訳(メタデータ) (2022-01-30T19:50:16Z) - Multi-Branch Deep Radial Basis Function Networks for Facial Emotion
Recognition [80.35852245488043]
放射状基底関数(RBF)ユニットによって形成された複数の分岐で拡張されたCNNベースのアーキテクチャを提案する。
RBFユニットは、中間表現を用いて類似のインスタンスで共有される局所パターンをキャプチャする。
提案手法は,提案手法の競争力を高めるためのローカル情報の導入であることを示す。
論文 参考訳(メタデータ) (2021-09-07T21:05:56Z) - Edge-assisted Democratized Learning Towards Federated Analytics [67.44078999945722]
本稿では,エッジ支援型民主化学習機構であるEdge-DemLearnの階層的学習構造を示す。
また、Edge-DemLearnを柔軟なモデルトレーニングメカニズムとして検証し、リージョンに分散制御と集約の方法論を構築する。
論文 参考訳(メタデータ) (2020-12-01T11:46:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。