論文の概要: Learning Dense Hand Contact Estimation from Imbalanced Data
- arxiv url: http://arxiv.org/abs/2505.11152v1
- Date: Fri, 16 May 2025 11:54:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-19 14:36:14.866511
- Title: Learning Dense Hand Contact Estimation from Imbalanced Data
- Title(参考訳): 不均衡データを用いた難易度接触推定の学習
- Authors: Daniel Sungho Jung, Kyoung Mu Lee,
- Abstract要約: 密接な接触推定の学習には2つの大きな課題がある。
まず、ほとんどのサンプルが接触していないハンドコンタクトデータセットからクラス不均衡の問題が存在する。
第2に、手接触データセットには、指先で示されるほとんどの手接触と空間的不均衡の問題が含まれている。
- 参考スコア(独自算出の注目度): 51.54990464786128
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Hands are essential to human interaction, and understanding contact between hands and the world can promote comprehensive understanding of their function. Recently, there have been growing number of hand interaction datasets that cover interaction with object, other hand, scene, and body. Despite the significance of the task and increasing high-quality data, how to effectively learn dense hand contact estimation remains largely underexplored. There are two major challenges for learning dense hand contact estimation. First, there exists class imbalance issue from hand contact datasets where majority of samples are not in contact. Second, hand contact datasets contain spatial imbalance issue with most of hand contact exhibited in finger tips, resulting in challenges for generalization towards contacts in other hand regions. To tackle these issues, we present a framework that learns dense HAnd COntact estimation (HACO) from imbalanced data. To resolve the class imbalance issue, we introduce balanced contact sampling, which builds and samples from multiple sampling groups that fairly represent diverse contact statistics for both contact and non-contact samples. Moreover, to address the spatial imbalance issue, we propose vertex-level class-balanced (VCB) loss, which incorporates spatially varying contact distribution by separately reweighting loss contribution of each vertex based on its contact frequency across dataset. As a result, we effectively learn to predict dense hand contact estimation with large-scale hand contact data without suffering from class and spatial imbalance issue. The codes will be released.
- Abstract(参考訳): 手は人間の相互作用に不可欠であり、手と世界の間の接触を理解することは、その機能に対する包括的な理解を促進することができる。
最近、オブジェクト、他のハンド、シーン、ボディとのインタラクションをカバーするハンドインタラクションデータセットが増えている。
タスクの重要性と高品質なデータの増加にもかかわらず、密接な接触推定を効果的に学習する方法はほとんど探索されていない。
密接な接触推定の学習には2つの大きな課題がある。
まず、ほとんどのサンプルが接触していないハンドコンタクトデータセットからクラス不均衡の問題が存在する。
第2に、手接触データセットには、指先で示されるほとんどの手接触と空間的不均衡の問題が含まれており、他の手接触領域への一般化が課題となっている。
これらの問題に対処するために、不均衡なデータから密度H And COntact Estimation (HACO)を学習するフレームワークを提案する。
クラス不均衡の問題を解決するために,複数のサンプリンググループから,接触と非接触の双方について,多種多様な接触統計をかなり表わした,バランスの取れた接触サンプリングを導入する。
さらに,空間的不均衡問題に対処するために,データセット間の接触周波数に基づいて各頂点の損失寄与を個別に重み付けすることで,空間的に異なる接触分布を含む頂点レベルのクラスバランス損失(VCB)を提案する。
その結果,クラスや空間的不均衡の問題に悩まされることなく,大規模ハンドコンタクトデータによる密接な接触推定の予測を効果的に行うことができた。
コードはリリースされます。
関連論文リスト
- Collaborative Imputation of Urban Time Series through Cross-city Meta-learning [54.438991949772145]
メタ学習型暗黙的ニューラル表現(INR)を利用した新しい協調的計算パラダイムを提案する。
次に,モデルに依存しないメタ学習による都市間協調学習手法を提案する。
20のグローバル都市から得られた多様な都市データセットの実験は、我々のモデルの優れた計算性能と一般化可能性を示している。
論文 参考訳(メタデータ) (2025-01-20T07:12:40Z) - Ask, Pose, Unite: Scaling Data Acquisition for Close Interactions with Vision Language Models [5.541130887628606]
密接な人間間相互作用における社会的ダイナミクスはヒューマンメッシュ推定(HME)に重大な課題をもたらす
本稿では,LVLM(Large Vision Language Models)を用いた新しいデータ生成手法を提案する。
この手法は、アノテーションの負担を軽減するだけでなく、HME内の密接な相互作用に適した包括的なデータセットの組み立てを可能にする。
論文 参考訳(メタデータ) (2024-10-01T01:14:24Z) - Ins-HOI: Instance Aware Human-Object Interactions Recovery [44.02128629239429]
本稿では,エンド・ツー・エンドのインスタンス・アウェアなヒューマン・オブジェクト・インタラクション・リカバリ(Ins-HOI)フレームワークを提案する。
Ins-HOIはインスタンスレベルの再構築をサポートし、合理的で現実的な接触面を提供する。
我々は、現実世界の人間-椅子と手-物体の相互作用を伴う5.2kの高品質スキャンを含む、大規模で高忠実な3Dスキャンデータセットを収集します。
論文 参考訳(メタデータ) (2023-12-15T09:30:47Z) - DECO: Dense Estimation of 3D Human-Scene Contact In The Wild [54.44345845842109]
SMPL体上の接触を推定するために、身体部分駆動とシーンコンテキスト駆動の両方の注意を用いた新しい3D接触検出器を訓練する。
すべてのベンチマークで既存のSOTAメソッドよりも大幅に優れています。
また、DECが自然画像における多様で挑戦的な現実世界の人間のインタラクションによく当てはまることを定性的に示す。
論文 参考訳(メタデータ) (2023-09-26T21:21:07Z) - MathDial: A Dialogue Tutoring Dataset with Rich Pedagogical Properties
Grounded in Math Reasoning Problems [74.73881579517055]
そこで本稿では,一般学生の誤りを表現した大規模言語モデルを用いて,人間教師の対話を生成する枠組みを提案する。
このフレームワークを用いて3kの1対1の教師-学生対話のデータセットであるMathDialを収集する方法について述べる。
論文 参考訳(メタデータ) (2023-05-23T21:44:56Z) - Collaborative Learning for Hand and Object Reconstruction with
Attention-guided Graph Convolution [49.10497573378427]
インタラクション中の手や物体のポーズと形状を推定すると、拡張現実や仮想現実を含む多くの応用が見つかる。
我々のアルゴリズムはオブジェクトモデルへの最適化であり、手動オブジェクトの相互作用を管理する物理規則を学習する。
広範に使用されている4つのベンチマークを用いて実験したところ、我々のフレームワークは3次元ポーズ推定における最先端の精度を超えて達成でき、また、密集した3次元手や物体の形状を復元できることがわかった。
論文 参考訳(メタデータ) (2022-04-27T17:00:54Z) - Hand-Object Contact Prediction via Motion-Based Pseudo-Labeling and
Guided Progressive Label Correction [27.87570749976023]
本稿では,手と物体の接触を予測するビデオベース手法を提案する。
多数のハンドオブジェクトトラックやコンタクトラベルに注釈をつけるのはコストがかかる。
i)モーションベース擬似ラベルを用いたトレーニングデータの自動収集と(ii)ガイド付きプログレッシブラベル補正(gPLC)からなる半教師付きフレームワークを提案する。
論文 参考訳(メタデータ) (2021-10-19T18:00:02Z) - Data Profiling for Adversarial Training: On the Ruin of Problematic Data [27.11328449349065]
相手のトレーニングの問題は、堅牢な精度のトレードオフ、堅牢なオーバーフィッティング、グラデーションマスキングです。
これらの問題は、データセットの低品質サンプルという共通の原因を共有していることを示しています。
問題のあるデータが削除されると、ロバストなオーバーフィッティングと勾配マスキングがほとんど緩和される。
論文 参考訳(メタデータ) (2021-02-15T10:17:24Z) - ContactPose: A Dataset of Grasps with Object Contact and Hand Pose [27.24450178180785]
本研究では、手ポーズ、オブジェクトポーズ、RGB-D画像と組み合わせた、手オブジェクト接触の最初のデータセットであるContactPoseを紹介する。
ContactPoseは25の家庭用物体の2306のユニークな把握能力を持ち、50人の被験者による2つの機能的意図と2.9 M RGB-Dの把握画像を持っている。
論文 参考訳(メタデータ) (2020-07-19T01:01:14Z) - Long-Tailed Recognition Using Class-Balanced Experts [128.73438243408393]
本稿では,多様な分類器の強度を組み合わせたクラスバランスの専門家のアンサンブルを提案する。
私たちのクラスバランスの専門家のアンサンブルは、最先端に近い結果に到達し、長い尾の認識のための2つのベンチマークで新たな最先端のアンサンブルを確立します。
論文 参考訳(メタデータ) (2020-04-07T20:57:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。