論文の概要: SEAL-pose: Enhancing 3D Human Pose Estimation via a Learned Loss for Structural Consistency
- arxiv url: http://arxiv.org/abs/2602.20051v1
- Date: Mon, 23 Feb 2026 17:00:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-24 17:42:02.913522
- Title: SEAL-pose: Enhancing 3D Human Pose Estimation via a Learned Loss for Structural Consistency
- Title(参考訳): SEAL-pose: 構造整合性のための学習損失による3次元人文推定の強化
- Authors: Yeonsung Kim, Junggeun Do, Seunguk Do, Sangmin Kim, Jaesik Park, Jay-Yoon Lee,
- Abstract要約: SEAL-poseは、構造的妥当性を評価することでポーズネットを訓練する学習可能な損失ネットである。
SEAL-poseは、すべての設定で対応するバックボーンと比較して、接合誤差を低減し、ポーズの妥当性を向上させる。
また、損失ネットと構造的整合性の関係を解析し、SEAL配置をクロスデータセットおよびインザウェア設定で評価する。
- 参考スコア(独自算出の注目度): 37.57946444102409
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3D human pose estimation (HPE) is characterized by intricate local and global dependencies among joints. Conventional supervised losses are limited in capturing these correlations because they treat each joint independently. Previous studies have attempted to promote structural consistency through manually designed priors or rule-based constraints; however, these approaches typically require manual specification and are often non-differentiable, limiting their use as end-to-end training objectives. We propose SEAL-pose, a data-driven framework in which a learnable loss-net trains a pose-net by evaluating structural plausibility. Rather than relying on hand-crafted priors, our joint-graph-based design enables the loss-net to learn complex structural dependencies directly from data. Extensive experiments on three 3D HPE benchmarks with eight backbones show that SEAL-pose reduces per-joint errors and improves pose plausibility compared with the corresponding backbones across all settings. Beyond improving each backbone, SEAL-pose also outperforms models with explicit structural constraints, despite not enforcing any such constraints. Finally, we analyze the relationship between the loss-net and structural consistency, and evaluate SEAL-pose in cross-dataset and in-the-wild settings.
- Abstract(参考訳): 3次元人間のポーズ推定(HPE)は、関節間の局所的および大域的依存関係が複雑である。
従来の教師付き損失は、それぞれの関節を独立して扱うため、これらの相関を捉える際に制限される。
従来の研究では、手作業による事前設計やルールベースの制約を通じて構造的整合性を促進する試みがあったが、これらのアプローチは通常手動の仕様が必要であり、しばしば区別不可能であり、エンドツーエンドのトレーニング目的としての使用を制限する。
学習可能な損失ネットが、構造的妥当性を評価してポーズネットを訓練するデータ駆動型フレームワークSEAL-poseを提案する。
手作りの先行技術に頼るのではなく、我々の共同グラフベースの設計により、ロスネットはデータから直接複雑な構造的依存関係を学習することができる。
8つのバックボーンを持つ3つの3次元HPEベンチマークの大規模な実験により、SEAL-poseは結合毎のエラーを低減し、すべての設定で対応するバックボーンと比較してポーズの妥当性を向上させる。
バックボーンの改善以外にも、SEAL-poseは、そのような制約を課さないにもかかわらず、明示的な構造的制約でモデルよりも優れています。
最後に,ロスネットと構造的整合性の関係を解析し,SEAL-poseをクロスデータセットおよびインザミル設定で評価する。
関連論文リスト
- Causal Discovery with Mixed Latent Confounding via Precision Decomposition [0.0]
微分可能およびスコアベースDAG学習者は、グローバル潜伏効果を因果エッジと誤解釈することができる。
我々は,これらの役割を分離したモジュール型高精度パイプラインであるtextscDCL-DECORを提案する。
論文 参考訳(メタデータ) (2025-12-31T08:03:41Z) - Feedback Alignment Meets Low-Rank Manifolds: A Structured Recipe for Local Learning [7.034739490820967]
バックプロパゲーション(BP)を用いたディープニューラルネットワーク(DNN)のトレーニングは、最先端の精度を実現するが、大域的なエラー伝搬と完全なパラメータ化が必要である。
ダイレクトフィードバックアライメント(DFA)は、メモリ要件の低いローカルで並列化可能な更新を可能にする。
低ランク多様体上で直接動作する構造化局所学習フレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-29T15:03:46Z) - Determination Of Structural Cracks Using Deep Learning Frameworks [0.0]
本研究では,構造き裂検出の精度と効率を高めるために,新しいディープラーニングアーキテクチャを提案する。
本研究では, 残留U-Netモデルの各種構成を応用した。
アンサンブルモデルが最も高いスコアを獲得し、精度が向上したことを示している。
論文 参考訳(メタデータ) (2025-07-03T08:24:47Z) - Iterative Graph Filtering Network for 3D Human Pose Estimation [5.177947445379688]
グラフ畳み込みネットワーク(GCN)は3次元人間のポーズ推定に有効な手法であることが証明されている。
本稿では,3次元ポーズ推定のための反復グラフフィルタリングフレームワークを提案する。
我々のアプローチは、ラプラシア正規化によるグラフフィルタリングを反復的に解くという考え方に基づいている。
論文 参考訳(メタデータ) (2023-07-29T20:46:44Z) - Joint Training of Deep Ensembles Fails Due to Learner Collusion [61.557412796012535]
機械学習モデルのアンサンブルは、単一のモデルよりもパフォーマンスを改善する強力な方法として確立されている。
伝統的に、アンサンブルアルゴリズムは、ジョイントパフォーマンスの最適化を目標として、ベースラーナーを独立または逐次訓練する。
アンサンブルの損失を最小化することは、実際にはほとんど適用されないことを示す。
論文 参考訳(メタデータ) (2023-01-26T18:58:07Z) - Non-Local Latent Relation Distillation for Self-Adaptive 3D Human Pose
Estimation [63.199549837604444]
3次元ポーズ推定アプローチは、強い(2D/3Dポーズ)または弱い(複数ビューまたは深さ)ペアによる監督の異なる形態を利用する。
我々は3Dポーズ学習を,ラベル付きソースドメインから完全に損なわれないターゲットへのタスク知識の転送を目的とした,自己指導型適応問題として捉えた。
我々は、異なる自己適応設定を評価し、標準ベンチマークで最先端の3Dポーズ推定性能を示す。
論文 参考訳(メタデータ) (2022-04-05T03:52:57Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Robust Self-Supervised LiDAR Odometry via Representative Structure
Discovery and 3D Inherent Error Modeling [67.75095378830694]
そこで我々は,2段階のオドメトリ推定ネットワークを構築し,一連の部分領域変換を推定してエゴモーメントを求める。
本稿では,トレーニング,推論,マッピングフェーズにおける信頼できない構造の影響を軽減することを目的とする。
我々の2フレームのオードメトリーは、翻訳/回転誤差の点で、過去の芸術の状態を16%/12%上回っている。
論文 参考訳(メタデータ) (2022-02-27T12:52:27Z) - Kinematic-Structure-Preserved Representation for Unsupervised 3D Human
Pose Estimation [58.72192168935338]
大規模インスタディオデータセットの監視を用いて開発された人間のポーズ推定モデルの一般化可能性については疑問が残る。
本稿では,2対あるいは2対の弱い監督者によって抑制されない,新しいキネマティック構造保存型非教師付き3次元ポーズ推定フレームワークを提案する。
提案モデルでは,前方運動学,カメラ投影,空間マップ変換という3つの連続的な微分可能変換を用いる。
論文 参考訳(メタデータ) (2020-06-24T23:56:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。