論文の概要: Edge Weight Prediction For Category-Agnostic Pose Estimation
- arxiv url: http://arxiv.org/abs/2411.16665v1
- Date: Mon, 25 Nov 2024 18:53:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-26 14:20:11.520689
- Title: Edge Weight Prediction For Category-Agnostic Pose Estimation
- Title(参考訳): カテゴリーに依存しないポース推定のためのエッジウェイト予測
- Authors: Or Hirschorn, Shai Avidan,
- Abstract要約: Category-Agnostic Pose Estimation (CAPE) は、様々なオブジェクトカテゴリにまたがるキーポイントを1つのモデルでローカライズする。
グラフのエッジ重みを予測することによって制限を克服する新しいフレームワークであるEdgeCapeを紹介する。
これにより,グローバルな空間依存を捕捉するモデルの能力が向上することを示す。
- 参考スコア(独自算出の注目度): 12.308036453869033
- License:
- Abstract: Category-Agnostic Pose Estimation (CAPE) localizes keypoints across diverse object categories with a single model, using one or a few annotated support images. Recent works have shown that using a pose graph (i.e., treating keypoints as nodes in a graph rather than isolated points) helps handle occlusions and break symmetry. However, these methods assume a static pose graph with equal-weight edges, leading to suboptimal results. We introduce EdgeCape, a novel framework that overcomes these limitations by predicting the graph's edge weights which optimizes localization. To further leverage structural priors, we propose integrating Markovian Structural Bias, which modulates the self-attention interaction between nodes based on the number of hops between them. We show that this improves the model's ability to capture global spatial dependencies. Evaluated on the MP-100 benchmark, which includes 100 categories and over 20K images, EdgeCape achieves state-of-the-art results in the 1-shot setting and leads among similar-sized methods in the 5-shot setting, significantly improving keypoint localization accuracy. Our code is publicly available.
- Abstract(参考訳): Category-Agnostic Pose Estimation (CAPE)は、1つまたはいくつかの注釈付きサポートイメージを使用して、さまざまなオブジェクトカテゴリにまたがるキーポイントを1つのモデルでローカライズする。
最近の研究は、ポーズグラフ(すなわち、キーポイントを孤立点ではなくグラフ内のノードとして扱う)を使用することで、オクルージョンを処理し対称性を壊すことが示されている。
しかし、これらの手法は、等重エッジを持つ静的ポーズグラフを仮定し、最適以下の結果をもたらす。
これは、ローカライゼーションを最適化するグラフのエッジウェイトを予測することによって、これらの制限を克服する新しいフレームワークである。
構造的先行を更に活用するために,ノード間の自己注意相互作用を,その間のホップ数に基づいて変調するマルコフ構造バイアスを統合することを提案する。
これにより,グローバルな空間依存を捕捉するモデルの能力が向上することを示す。
100のカテゴリと20K以上のイメージを含むMP-100ベンチマークで評価されたEdgeCapeは、1ショット設定で最先端の結果を達成し、5ショット設定で同様のサイズのメソッドを導いており、キーポイントのローカライゼーション精度が大幅に向上している。
私たちのコードは公開されています。
関連論文リスト
- ScaleNet: Scale Invariance Learning in Directed Graphs [4.235697905699222]
グラフニューラルネットワーク(GNN)を用いたノード分類では、実際には分類される中心ノードのエゴグラフである。
複数方向エッジの順序列である非方向のシングルエッジをスケールドエッジに置き換える「スケールドエゴグラフ」の概念を提案する。
スケール不変性に基づくグラフ学習は、よりシンプルで、より速く、より正確に、ランダムウォークから派生した開始モデルより優れている。
論文 参考訳(メタデータ) (2024-11-13T16:42:59Z) - KGpose: Keypoint-Graph Driven End-to-End Multi-Object 6D Pose Estimation via Point-Wise Pose Voting [0.0]
KGposeは、複数のオブジェクトの6Dポーズ推定のためのエンドツーエンドフレームワークである。
我々のアプローチはキーポイントベースの手法とキーポイントグラフによる学習可能なポーズ回帰を組み合わせる。
論文 参考訳(メタデータ) (2024-07-12T01:06:00Z) - CapeX: Category-Agnostic Pose Estimation from Textual Point Explanation [10.951186766576173]
カテゴリーに依存しないポーズ推定(CAPE)は、多様な対象カテゴリに対するキーポイントのローカライゼーションを促進することを目的としている。
本研究は,サポート画像の代わりにテキストベースのアプローチを採用することで,従来のCAPE手法から逸脱する。
我々は、100以上のカテゴリと18,000のイメージにまたがる包括的なデータセットであるMP-100ベンチマークを用いて、新しいアプローチを検証する。
論文 参考訳(メタデータ) (2024-06-01T09:50:13Z) - A Graph-Based Approach for Category-Agnostic Pose Estimation [12.308036453869033]
任意のオブジェクトカテゴリに対するキーポイントのローカライズを可能にするために、カテゴリに依存しないポーズ推定(CAPE)を導入した。
本稿では、入力ポーズデータをグラフとして扱うことにより、キーポイントを独立したエンティティとして扱う従来のCAPE技術との大きな違いを示す。
提案手法は1ショット設定で0.98%向上し,CAPEの新たな最先端を実現する。
論文 参考訳(メタデータ) (2023-11-29T18:44:12Z) - Bring Your Own View: Graph Neural Networks for Link Prediction with
Personalized Subgraph Selection [57.34881616131377]
異なるエッジに対して最適なサブグラフを自動,個人的,帰納的に識別するプラグイン・アンド・プレイ・フレームワークとしてパーソナライズされたサブグラフセレクタ(PS2)を導入する。
PS2は二段階最適化問題としてインスタンス化され、効率よく解ける。
GNNLPトレーニングに対する新たなアプローチとして,まずエッジの最適な部分グラフを識別し,次にサンプル部分グラフを用いて推論モデルをトレーニングすることを提案する。
論文 参考訳(メタデータ) (2022-12-23T17:30:19Z) - Pose for Everything: Towards Category-Agnostic Pose Estimation [93.07415325374761]
Category-Agnostic Pose Estimation (CAPE) は、キーポイント定義を持つ少数のサンプルのみを与えられた任意の種類のオブジェクトのポーズを検出することができるポーズ推定モデルを作成することを目的としている。
異なるキーポイント間のインタラクションと、サポートとクエリイメージの関係をキャプチャするために、トランスフォーマーベースのキーポイントインタラクションモジュール(KIM)を提案する。
また、20K以上のインスタンスを含む100のオブジェクトカテゴリの2次元ポーズデータセットであるMP-100データセットを導入し、CAPEアルゴリズムの開発に適している。
論文 参考訳(メタデータ) (2022-07-21T09:40:54Z) - Graph-PCNN: Two Stage Human Pose Estimation with Graph Pose Refinement [54.29252286561449]
グラフPCNNと呼ばれる2段階のグラフベースおよびモデルに依存しないフレームワークを提案する。
第1段階では、粗局化結果を得るために熱マップ回帰ネットワークを適用し、ガイドポイントと呼ばれる一連の提案キーポイントをサンプリングする。
第2段階では、各案内点について、ローカライゼーションにより異なる視覚特徴を抽出する。
ガイドされた点間の関係は、より正確なローカライゼーション結果を得るためにグラフポーズ精製モジュールによって探索される。
論文 参考訳(メタデータ) (2020-07-21T04:59:15Z) - Sequential Graph Convolutional Network for Active Learning [53.99104862192055]
逐次グラフ畳み込みネットワーク(GCN)を用いた新しいプールベースアクティブラーニングフレームワークを提案する。
少数のランダムなサンプル画像がシードラベル付き例であるので、グラフのパラメータを学習してラベル付きノードと非ラベル付きノードを区別する。
我々はGCNの特性を利用してラベル付けされたものと十分に異なる未ラベルの例を選択する。
論文 参考訳(メタデータ) (2020-06-18T00:55:10Z) - Self-Supervised Tuning for Few-Shot Segmentation [82.32143982269892]
Few-shotのセグメンテーションは、アノテートされたサンプルがほとんどない各画像ピクセルにカテゴリラベルを割り当てることを目的としている。
既存のメタラーニング手法では, 画像から抽出した視覚的特徴を埋め込み空間に埋め込むと, カテゴリー別識別記述子の生成に失敗する傾向にある。
本稿では,複数のエピソードにまたがる潜在特徴の分布を,自己分割方式に基づいて動的に調整する適応型フレームワークチューニングを提案する。
論文 参考訳(メタデータ) (2020-04-12T03:53:53Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。