論文の概要: Recognition of 26 Degrees of Freedom of Hands Using Model-based approach
and Depth-Color Images
- arxiv url: http://arxiv.org/abs/2005.07068v1
- Date: Wed, 13 May 2020 08:05:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-03 13:35:58.386403
- Title: Recognition of 26 Degrees of Freedom of Hands Using Model-based approach
and Depth-Color Images
- Title(参考訳): モデルベースアプローチと奥行きカラー画像を用いた26自由度ハンド認識
- Authors: Cong Hoang Quach, Minh Trien Pham, Anh Viet Dang, Dinh Tuan Pham,
Thuan Hoang Tran, Manh Duong Phung
- Abstract要約: このシステムは、1フレームあたり0.8秒の処理時間で26自由度を認識できる。
アルゴリズムはノイズに対して堅牢であり、ハードウェア要件は単一のカメラで単純である。
- 参考スコア(独自算出の注目度): 1.304892050913381
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this study, we present an model-based approach to recognize full 26
degrees of freedom of a human hand. Input data include RGB-D images acquired
from a Kinect camera and a 3D model of the hand constructed from its anatomy
and graphical matrices. A cost function is then defined so that its minimum
value is achieved when the model and observation images are matched. To solve
the optimization problem in 26 dimensional space, the particle swarm
optimization algorimth with improvements are used. In addition, parallel
computation in graphical processing units (GPU) is utilized to handle
computationally expensive tasks. Simulation and experimental results show that
the system can recognize 26 degrees of freedom of hands with the processing
time of 0.8 seconds per frame. The algorithm is robust to noise and the
hardware requirement is simple with a single camera.
- Abstract(参考訳): 本研究では,人間の手の26自由度を完全に認識するためのモデルベースアプローチを提案する。
入力データにはKinectカメラから取得したRGB-D画像と、その解剖学的およびグラフィカルな行列から構築された手の3Dモデルが含まれる。
コスト関数は、モデルと観測画像が一致するときに最小値が達成されるように定義される。
26次元空間における最適化問題を解くために、改良を伴う粒子群最適化アルゴリズムを用いる。
さらに、グラフィカル処理ユニット(GPU)における並列計算を用いて計算コストの高いタスクを処理する。
シミュレーションおよび実験結果から,フレームあたり0.8秒の処理時間で26自由度を認識できることが示唆された。
アルゴリズムはノイズに対して堅牢であり、ハードウェア要件は単一のカメラで単純である。
関連論文リスト
- iComMa: Inverting 3D Gaussian Splatting for Camera Pose Estimation via Comparing and Matching [14.737266480464156]
コンピュータビジョンにおける6次元カメラのポーズ推定問題に対処するため,iComMaという手法を提案する。
3次元ガウススプラッティング(3DGS)の反転による高精度カメラポーズ推定法を提案する。
論文 参考訳(メタデータ) (2023-12-14T15:31:33Z) - Multi-task Learning for Camera Calibration [3.274290296343038]
一対の画像から内在性(主点オフセットと焦点長)と外因性(ベースライン,ピッチ,翻訳)を予測できるユニークな手法を提案する。
カメラモデルニューラルネットワークを用いて3Dポイントを再構成し、再構成の損失を利用してカメラ仕様を得ることにより、この革新的なカメラ投影損失(CPL)法により、所望のパラメータを推定できる。
論文 参考訳(メタデータ) (2022-11-22T17:39:31Z) - Multi-View Object Pose Refinement With Differentiable Renderer [22.040014384283378]
本稿では,合成データの学習方法の改善に焦点をあてた,新しい多視点6 DoFオブジェクトポーズ改善手法を提案する。
これはDPOD検出器に基づいており、各フレーム内のモデル頂点と画像画素との間の密度の高い2D-3D対応を生成する。
合成および実データに基づいて訓練された最先端の手法と比較して優れた性能を報告した。
論文 参考訳(メタデータ) (2022-07-06T17:02:22Z) - RiCS: A 2D Self-Occlusion Map for Harmonizing Volumetric Objects [68.85305626324694]
カメラ空間における光マーチング (RiCS) は、3次元における前景物体の自己閉塞を2次元の自己閉塞マップに表現する新しい手法である。
表現マップは画像の質を高めるだけでなく,時間的コヒーレントな複雑な影効果をモデル化できることを示す。
論文 参考訳(メタデータ) (2022-05-14T05:35:35Z) - Accurate, Interpretable, and Fast Animation: AnIterative, Sparse, and
Nonconvex Approach [0.9176056742068814]
フェイスリグは正確でなければならないと同時に、その問題を解決するために高速に計算する必要がある。
各共通アニメーションモデルのパラメータの1つは、スパーシティ正規化である。
複雑性を低減するため、パラダイム・プライマリゼーション・ミニ(MM)が適用される。
論文 参考訳(メタデータ) (2021-09-17T05:42:07Z) - Synthetic Training for Monocular Human Mesh Recovery [100.38109761268639]
本稿では,RGB画像と大規模に異なる複数の身体部位の3次元メッシュを推定することを目的とする。
主な課題は、2D画像のすべての身体部分の3Dアノテーションを完備するトレーニングデータがないことである。
本稿では,D2S(Deep-to-scale)投影法を提案する。
論文 参考訳(メタデータ) (2020-10-27T03:31:35Z) - Human Body Model Fitting by Learned Gradient Descent [48.79414884222403]
画像に3次元の人体形状を適合させる新しいアルゴリズムを提案する。
このアルゴリズムは高速(約120ms収束)で、データセットに頑健であり、公開評価データセットの最先端結果が得られることを示す。
論文 参考訳(メタデータ) (2020-08-19T14:26:47Z) - Real-time Dense Reconstruction of Tissue Surface from Stereo Optical
Video [10.181846237133167]
立体光学ビデオから組織表面の高密度3次元モデル(3次元)をリアルタイムに再構成する手法を提案する。
まずステレオマッチングを用いてビデオフレームから3D情報を抽出し,再構成した3Dモデルをモザイクする。
2mm未満の精度で高分解能テクスチャを有する復元3Dモデルについて, 生体内および生体内データによる実験結果を得た。
論文 参考訳(メタデータ) (2020-07-16T19:14:05Z) - PerMO: Perceiving More at Once from a Single Image for Autonomous
Driving [76.35684439949094]
単一画像から完全テクスチャ化された車両の3次元モデルを検出し,セグメント化し,再構成する新しい手法を提案する。
私たちのアプローチは、ディープラーニングの強みと従来のテクニックの優雅さを組み合わせています。
我々はこれらのアルゴリズムを自律運転システムに統合した。
論文 参考訳(メタデータ) (2020-07-16T05:02:45Z) - Intrinsic Autoencoders for Joint Neural Rendering and Intrinsic Image
Decomposition [67.9464567157846]
合成3Dモデルからリアルな画像を生成するためのオートエンコーダを提案し,同時に実像を本質的な形状と外観特性に分解する。
実験により, レンダリングと分解の併用処理が有益であることが確認され, 画像から画像への翻訳の質的, 定量的なベースラインよりも優れた結果が得られた。
論文 参考訳(メタデータ) (2020-06-29T12:53:58Z) - Monocular Real-time Hand Shape and Motion Capture using Multi-modal Data [77.34069717612493]
本稿では,100fpsの単眼手形状とポーズ推定の新たな手法を提案する。
これは、利用可能なハンドトレーニングデータのソースをすべて活用できるように設計された、新しい学習ベースのアーキテクチャによって実現されている。
3次元手関節検出モジュールと逆キネマティクスモジュールを備えており、3次元手関節位置だけでなく、1つのフィードフォワードパスでそれらを関節回転にマッピングする。
論文 参考訳(メタデータ) (2020-03-21T03:51:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。