論文の概要: Forward and Inverse models in HCI:Physical simulation and deep learning
for inferring 3D finger pose
- arxiv url: http://arxiv.org/abs/2109.03366v1
- Date: Tue, 7 Sep 2021 23:11:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-09 13:34:19.821394
- Title: Forward and Inverse models in HCI:Physical simulation and deep learning
for inferring 3D finger pose
- Title(参考訳): hciにおける前方および逆モデル:3d指ポーズ推定のための物理シミュレーションとディープラーニング
- Authors: Roderick Murray-Smith, John H. Williamson, Andrew Ramsay, Francesco
Tonolini, Simon Rogers, Antoine Loriette
- Abstract要約: 機械学習を用いて、位置、ポーズ、センサーの読み取りを推測するために、データ駆動モデルを開発する。
条件付き変分オートエンコーダとドメインの専門知識/モデルを実験的に収集したデータを組み合わせる。
- 参考スコア(独自算出の注目度): 2.8952292379640636
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We outline the role of forward and inverse modelling approaches in the design
of human--computer interaction systems. Causal, forward models tend to be
easier to specify and simulate, but HCI requires solutions of the inverse
problem. We infer finger 3D position $(x,y,z)$ and pose (pitch and yaw) on a
mobile device using capacitive sensors which can sense the finger up to 5cm
above the screen. We use machine learning to develop data-driven models to
infer position, pose and sensor readings, based on training data from: 1. data
generated by robots, 2. data from electrostatic simulators 3. human-generated
data. Machine learned emulation is used to accelerate the electrostatic
simulation performance by a factor of millions. We combine a Conditional
Variational Autoencoder with domain expertise/models experimentally collected
data. We compare forward and inverse model approaches to direct inference of
finger pose. The combination gives the most accurate reported results on
inferring 3D position and pose with a capacitive sensor on a mobile device.
- Abstract(参考訳): 人-コンピュータインタラクションシステムの設計における前方・逆モデリング手法の役割について概説する。
因果的フォワードモデルは指定やシミュレートが容易であるが、HCIは逆問題の解を必要とする。
我々は3D位置を$(x,y,z)$で推定し、画面上5cmまでの指を感知できる容量センサーを使って、モバイルデバイスでポーズ(ピッチとヨー)を行う。
1. ロボットによるデータ, 2. 静電シミュレータによるデータ, 3. 人間が生成したデータに基づいて,位置,ポーズ,センサの読み込みを推測するデータ駆動モデルを開発する。
機械学習エミュレーションは、静電シミュレーションの性能を数百万倍に加速するために用いられる。
条件付き変分オートエンコーダとドメインの専門知識/モデルを実験的に収集したデータを組み合わせる。
指のポーズの直接推定における前方モデルと逆モデルの比較を行った。
この組み合わせは、モバイルデバイス上の静電容量センサーで3d位置とポーズを推測する最も正確な結果を与える。
関連論文リスト
- CameraHMR: Aligning People with Perspective [54.05758012879385]
モノクロ画像からの正確な3次元ポーズと形状推定の課題に対処する。
既存のトレーニングデータセットには、擬似基底真理(pGT)を持つ実画像が含まれている。
pGTの精度を向上させる2つの貢献をしている。
論文 参考訳(メタデータ) (2024-11-12T19:12:12Z) - VR-based generation of photorealistic synthetic data for training
hand-object tracking models [0.0]
ブレンダー・ホアシンス (blender-hoisynth) は、ブレンダーソフトウェアに基づくインタラクティブな合成データ生成装置である。
ユーザーは標準のバーチャルリアリティハードウェアを使用して、仮想手でオブジェクトと対話することができる。
私たちは、よく知られたDexYCBデータセットのトレーニングデータの大部分をホアシンスデータに置き換え、最先端のHOI再構築モデルをトレーニングします。
論文 参考訳(メタデータ) (2024-01-31T14:32:56Z) - Reconfigurable Data Glove for Reconstructing Physical and Virtual Grasps [100.72245315180433]
本研究では,人間の手-物体相互作用の異なるモードを捉えるために,再構成可能なデータグローブの設計を提案する。
グローブは3つのモードで動作し、異なる特徴を持つ様々な下流タスクを実行する。
i)手の動きと関連力を記録し,(ii)VRの操作流速を改善するとともに,(iii)様々なツールの現実的なシミュレーション効果を生み出すことにより,システムの3つのモードを評価する。
論文 参考訳(メタデータ) (2023-01-14T05:35:50Z) - Decanus to Legatus: Synthetic training for 2D-3D human pose lifting [26.108023246654646]
10個の手作り3Dポーズ(Decanus)に基づく3Dポーズ分布から無限個の合成人間のポーズ(Legatus)を生成するアルゴリズムを提案する。
この結果から,特定データセットの実際のデータを用いた手法に匹敵する3次元ポーズ推定性能を,ゼロショット設定で実現し,フレームワークの可能性を示した。
論文 参考訳(メタデータ) (2022-10-05T13:10:19Z) - Towards Multimodal Multitask Scene Understanding Models for Indoor
Mobile Agents [49.904531485843464]
本稿では,現実世界の屋内環境におけるラベル付きデータの不十分,あるいは不可能,といった主な課題について論じる。
MMISM (Multi-modality input Multi-task output Indoor Scene Understanding Model) について述べる。
MMISMは、RGB画像だけでなく、スパースライダーポイントを入力と3Dオブジェクト検出、深さ完了、人間のポーズ推定、セマンティックセグメンテーションを出力タスクとみなしている。
MMISMはシングルタスクモデルよりも同等かそれ以上の性能を示す。
論文 参考訳(メタデータ) (2022-09-27T04:49:19Z) - T3VIP: Transformation-based 3D Video Prediction [49.178585201673364]
本稿では,シーンを対象部品に分解することで3次元動きを明示的にモデル化する3次元映像予測手法を提案する。
我々のモデルは、完全に教師なしであり、現実世界の性質を捉え、画像と点のクラウド領域における観察の手がかりがその学習信号を構成する。
我々の知る限り、我々のモデルは、静止カメラの未来をRGB-Dビデオで予測する最初の生成モデルである。
論文 参考訳(メタデータ) (2022-09-19T15:01:09Z) - CROMOSim: A Deep Learning-based Cross-modality Inertial Measurement
Simulator [7.50015216403068]
慣性測定装置 (IMU) のデータは, 人体移動の監視と評価に利用されてきた。
データ不足を緩和するため,クロスモーダルセンサシミュレータであるCROMOSimを設計した。
モーションキャプチャシステムや単眼RGBカメラから高忠実度仮想IMUセンサーデータをシミュレートする。
論文 参考訳(メタデータ) (2022-02-21T22:30:43Z) - Adapted Human Pose: Monocular 3D Human Pose Estimation with Zero Real 3D
Pose Data [14.719976311208502]
トレーニングとテストデータドメインのギャップは、しばしばモデルのパフォーマンスに悪影響を及ぼします。
本稿では、外見とポーズ空間の両方における適応問題に対処する適応的ヒューマンポーズ(AHuP)アプローチを提案する。
AHuPは、実際のアプリケーションでは、ターゲットドメインからのデータはアクセスできないか、限られた情報しか取得できないという現実的な前提に基づいて構築されている。
論文 参考訳(メタデータ) (2021-05-23T01:20:40Z) - Yet it moves: Learning from Generic Motions to Generate IMU data from
YouTube videos [5.008235182488304]
我々は、加速度計とジャイロ信号の両方の一般的な動きの回帰モデルをトレーニングして、合成IMUデータを生成する方法を示す。
我々は、回帰モデルにより生成されたシミュレーションデータに基づいてトレーニングされたシステムが、実センサデータに基づいてトレーニングされたシステムのF1スコアの平均の約10%に到達できることを実証した。
論文 参考訳(メタデータ) (2020-11-23T18:16:46Z) - Physics-Based Dexterous Manipulations with Estimated Hand Poses and
Residual Reinforcement Learning [52.37106940303246]
ノイズの多い入力ポーズをターゲットの仮想ポーズにマッピングするモデルを学習する。
モデルフリーハイブリッドRL+ILアプローチを用いて残留条件下で訓練する。
筆者らは,VRにおける手動物体の相互作用と,それを用いた手動物体の動作再構成という,手動姿勢推定を用いた2つのアプリケーションで,我々のフレームワークを検証した。
論文 参考訳(メタデータ) (2020-08-07T17:34:28Z) - Combining Implicit Function Learning and Parametric Models for 3D Human
Reconstruction [123.62341095156611]
深層学習近似として表される暗黙の関数は、3次元曲面の再構成に強力である。
このような機能は、コンピュータグラフィックスとコンピュータビジョンの両方に柔軟なモデルを構築するのに不可欠である。
詳細に富んだ暗黙関数とパラメトリック表現を組み合わせた方法論を提案する。
論文 参考訳(メタデータ) (2020-07-22T13:46:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。