論文の概要: EGL++: Extending Expected Gradient Length to Active Learning for Human
Pose Estimation
- arxiv url: http://arxiv.org/abs/2104.09493v1
- Date: Mon, 19 Apr 2021 17:56:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-20 14:25:44.521590
- Title: EGL++: Extending Expected Gradient Length to Active Learning for Human
Pose Estimation
- Title(参考訳): egl++:人間のポーズ推定のための推定勾配長をアクティブラーニングに拡張する
- Authors: Megh Shukla
- Abstract要約: 最先端の人間のポーズ推定モデルは、堅牢なパフォーマンスのために大量のラベル付きデータに依存する。
EGL++は、予測勾配長を離散ラベルが利用できないタスクに拡張する新しいアルゴリズムである。
- 参考スコア(独自算出の注目度): 2.0305676256390934
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: State of the art human pose estimation models continue to rely on large
quantities of labelled data for robust performance. Since labelling budget is
often constrained, active learning algorithms are important in retaining the
overall performance of the model at a lower cost. Although active learning has
been well studied in literature, few techniques are reported for human pose
estimation. In this paper, we theoretically derive expected gradient length for
regression, and propose EGL++, a novel heuristic algorithm that extends
expected gradient length to tasks where discrete labels are not available. We
achieve this by computing low dimensional representations of the original
images which are then used to form a neighborhood graph. We use this graph to:
1) Obtain a set of neighbors for a given sample, with each neighbor iteratively
assumed to represent the ground truth for gradient calculation 2) Quantify the
probability of each sample being a neighbor in the above set, facilitating the
expected gradient step. Such an approach allows us to provide an approximate
solution to the otherwise intractable task of integrating over the continuous
output domain. To validate EGL++, we use the same datasets (Leeds Sports Pose,
MPII) and experimental design as suggested by previous literature, achieving
competitive results in comparison to these methods.
- Abstract(参考訳): 最先端の人間のポーズ推定モデルは、堅牢なパフォーマンスのために大量のラベル付きデータに依存し続けている。
ラベル付け予算はしばしば制限されるため、アクティブラーニングアルゴリズムはモデル全体のパフォーマンスを低コストで維持する上で重要である。
アクティブラーニングは文献でよく研究されているが、人間のポーズ推定のための技術はほとんど報告されていない。
本稿では,回帰のための予測勾配長を理論的に導出し,離散ラベルが利用できないタスクまで予測勾配長を拡張する新しいヒューリスティックアルゴリズム EGL++ を提案する。
これを,近傍グラフを形成するために使用する原画像の低次元表現を計算することで実現する。
1) 与えられたサンプルの近傍の集合を求め, 勾配計算のために各サンプルが基底真理を表すことを反復的に仮定し, 2) 上記集合における各サンプルが近傍である確率を定量化し, 期待される勾配ステップを容易にする。
このようなアプローチにより、連続的な出力領域をまたいで統合する、さもなければ難解なタスクに対する近似的な解を提供することができます。
EGL++の検証には,従来の文献と同様のデータセット(Leeds Sports Pose, MPII)と実験設計を用い,これらの手法と比較して競合的な結果を得た。
関連論文リスト
- LPLgrad: Optimizing Active Learning Through Gradient Norm Sample Selection and Auxiliary Model Training [2.762397703396293]
LPLgrad(Loss Prediction Loss with Gradient Norm)は、モデルの不確実性を効果的に定量化し、画像分類タスクの精度を向上させる。
LPLgradは2つの異なるフェーズで動作する: (i) Em Training Phaseは、メインモデルと補助モデルとを併用して入力特徴の損失を予測することを目的としている。
この二重モデルアプローチは、複雑な入力特徴を抽出し、データから本質的なパターンを効果的に学習する能力を高める。
論文 参考訳(メタデータ) (2024-11-20T18:12:59Z) - Occlusion Handling in 3D Human Pose Estimation with Perturbed Positional Encoding [15.834419910916933]
固有基底から一貫した正規成分を抽出する新しい位置符号化手法PerturbPEを提案する。
実験結果では,Human3.6Mデータセットで最大12%のパフォーマンス向上が観測された。
我々の新しいアプローチは、2つのエッジが欠落しているシナリオのパフォーマンスを大幅に向上させ、最先端のベンチマークを新たに設定する。
論文 参考訳(メタデータ) (2024-05-27T17:48:54Z) - The Languini Kitchen: Enabling Language Modelling Research at Different
Scales of Compute [66.84421705029624]
本稿では,アクセル時間で測定された等価計算に基づくモデル比較を可能にする実験的プロトコルを提案する。
私たちは、既存の学術的ベンチマークを上回り、品質、多様性、文書の長さで上回る、大規模で多様で高品質な書籍データセットを前処理します。
この研究は、GPT-2アーキテクチャから派生したフィードフォワードモデルと、10倍のスループットを持つ新しいLSTMの形式でのリカレントモデルという2つのベースラインモデルも提供する。
論文 参考訳(メタデータ) (2023-09-20T10:31:17Z) - SimTeG: A Frustratingly Simple Approach Improves Textual Graph Learning [131.04781590452308]
テキストグラフ学習におけるフラストレーションに富んだアプローチであるSimTeGを提案する。
まず、下流タスクで予め訓練されたLM上で、教師付きパラメータ効率の微調整(PEFT)を行う。
次に、微調整されたLMの最後の隠れ状態を用いてノード埋め込みを生成する。
論文 参考訳(メタデータ) (2023-08-03T07:00:04Z) - Learning Large Graph Property Prediction via Graph Segment Training [61.344814074335304]
本稿では,メモリフットプリントを一定にして大きなグラフ特性予測を学習できる汎用フレームワークを提案する。
バックプロパゲーションのためにサンプリングされていないセグメントに対する埋め込みを効率的に得るために,歴史的埋め込みテーブルを導入することにより,GSTパラダイムを洗練する。
実験の結果,GST-EFDはメモリ効率が良く,高速でありながら,通常の全グラフ学習システムよりもテスト精度が若干向上していることがわかった。
論文 参考訳(メタデータ) (2023-05-21T02:53:25Z) - Reinforcement Learning Enhanced Weighted Sampling for Accurate Subgraph
Counting on Fully Dynamic Graph Streams [35.943447765433774]
完全動的グラフストリームにおける部分グラフ数を推定するための重み付きサンプリングアルゴリズムWSDを提案する。
強化学習に基づく新しい手法を用いて,エッジの重みをデータ駆動方式で決定する。
論文 参考訳(メタデータ) (2022-11-13T03:01:34Z) - From Spectral Graph Convolutions to Large Scale Graph Convolutional
Networks [0.0]
グラフ畳み込みネットワーク(GCN)は、様々なタスクにうまく適用された強力な概念であることが示されている。
古典グラフ理論の関連部分を含むGCNの定義への道を開いた理論を考察する。
論文 参考訳(メタデータ) (2022-07-12T16:57:08Z) - Condensing Graphs via One-Step Gradient Matching [50.07587238142548]
ネットワーク重みを訓練せずに1ステップのみの勾配マッチングを行う1ステップ勾配マッチング方式を提案する。
我々の理論的分析は、この戦略が実際のグラフの分類損失を減少させる合成グラフを生成することができることを示している。
特に、元のパフォーマンスの最大98%を近似しながら、データセットサイズを90%削減することが可能です。
論文 参考訳(メタデータ) (2022-06-15T18:20:01Z) - Self-Supervised Representation Learning via Latent Graph Prediction [41.64774038444827]
グラフニューラルネットワークの自己教師付き学習(SSL)は、ラベルのないデータを活用するための有望な方法として浮上している。
ラグラフ(LaGraph)は、遅延グラフ予測に基づく理論的に基礎付けられた予測型SSLフレームワークである。
実験結果から,LaGraphの性能向上と,グラフレベルとノードレベルの両方のタスクにおけるトレーニングサンプルサイズ削減に対する堅牢性を示す。
論文 参考訳(メタデータ) (2022-02-16T21:10:33Z) - Bayesian Graph Contrastive Learning [55.36652660268726]
本稿では,ランダムな拡張がエンコーダにつながることを示すグラフコントラスト学習手法の新たな視点を提案する。
提案手法は,各ノードを決定論的ベクトルに埋め込む既存の手法とは対照的に,各ノードを潜在空間の分布で表現する。
いくつかのベンチマークデータセットにおける既存の最先端手法と比較して,性能が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2021-12-15T01:45:32Z) - Goal-directed Generation of Discrete Structures with Conditional
Generative Models [85.51463588099556]
本稿では,強化学習目標を直接最適化し,期待される報酬を最大化するための新しいアプローチを提案する。
提案手法は、ユーザ定義プロパティを持つ分子の生成と、所定の目標値を評価する短いピソン表現の同定という2つのタスクで検証する。
論文 参考訳(メタデータ) (2020-10-05T20:03:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。