論文の概要: Evaluation of deep lift pose models for 3D rodent pose estimation based
on geometrically triangulated data
- arxiv url: http://arxiv.org/abs/2106.12993v1
- Date: Thu, 24 Jun 2021 13:08:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-25 21:02:00.889382
- Title: Evaluation of deep lift pose models for 3D rodent pose estimation based
on geometrically triangulated data
- Title(参考訳): 幾何三角データに基づく3次元ロジェントポーズ推定のための深部リフトポーズモデルの評価
- Authors: Indrani Sarkar, Indranil Maji, Charitha Omprakash, Sebastian Stober,
Sanja Mikulovic, Pavol Bauer
- Abstract要約: 行動は3次元で理想的に捉えられるポーズの変化の観点から研究されるのが一般的である。
これは、異なる角度から動物を見るマルチカメラシステムに対する三角測量を必要とする。
そこで本研究では,単視点カメラビューから自由に動くロジトを頑健な3次元ポーズ推定が可能なリフトプレイスモデルを提案する。
- 参考スコア(独自算出の注目度): 1.84316002191515
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The assessment of laboratory animal behavior is of central interest in modern
neuroscience research. Behavior is typically studied in terms of pose changes,
which are ideally captured in three dimensions. This requires triangulation
over a multi-camera system which view the animal from different angles.
However, this is challenging in realistic laboratory setups due to occlusions
and other technical constrains. Here we propose the usage of lift-pose models
that allow for robust 3D pose estimation of freely moving rodents from a single
view camera view. To obtain high-quality training data for the pose-lifting, we
first perform geometric calibration in a camera setup involving bottom as well
as side views of the behaving animal. We then evaluate the performance of two
previously proposed model architectures under given inference perspectives and
conclude that reliable 3D pose inference can be obtained using temporal
convolutions. With this work we would like to contribute to a more robust and
diverse behavior tracking of freely moving rodents for a wide range of
experiments and setups in the neuroscience community.
- Abstract(参考訳): 実験動物行動の評価は、現代の神経科学研究の中心的関心事である。
行動は一般的に3次元で理想的に捉えられるポーズの変化の観点から研究される。
これは動物を異なる角度から見るマルチカメラシステム上での三角測量を必要とする。
しかし、オクルージョンやその他の技術的な制約のため、現実的な実験室でのセットアップでは困難である。
そこで本研究では,単視点カメラビューから自由に動くロジトを頑健な3次元ポーズ推定が可能なリフトプレイスモデルを提案する。
ポーズリフティングのための高品質なトレーニングデータを得るため,まず,底面と側面の視界を含むカメラで幾何学的キャリブレーションを行う。
次に,提案した2つのモデルアーキテクチャの性能評価を行い,時間的畳み込みを用いて信頼性の高い3次元ポーズ推論が得られると結論付けた。
この研究で我々は、神経科学コミュニティにおける幅広い実験とセットアップのために、自由に動くネズミのより堅牢で多様な行動追跡に貢献したいと考えています。
関連論文リスト
- 3D-Aware Hypothesis & Verification for Generalizable Relative Object
Pose Estimation [69.73691477825079]
一般化可能なオブジェクトポーズ推定の問題に対処する新しい仮説検証フレームワークを提案する。
信頼性を計測するために,2つの入力画像から学習した3次元オブジェクト表現に3次元変換を明示的に適用する3D認識検証を導入する。
論文 参考訳(メタデータ) (2023-10-05T13:34:07Z) - Predictive Modeling of Equine Activity Budgets Using a 3D Skeleton
Reconstructed from Surveillance Recordings [0.8602553195689513]
4つの同時監視カメラ記録から馬の3Dポーズを再構築するパイプラインを提案する。
私たちの環境は、カメラの視野の制限や、比較的閉じて小さな環境など、取り組まなければならない興味深い課題を生んでいる。
論文 参考訳(メタデータ) (2023-06-08T16:00:04Z) - Few-View Object Reconstruction with Unknown Categories and Camera Poses [80.0820650171476]
この研究は、カメラのポーズやオブジェクトのカテゴリを知らない少数の画像から、一般的な現実世界のオブジェクトを再構築する。
私たちの研究の要点は、形状再構成とポーズ推定という、2つの基本的な3D視覚問題を解決することです。
提案手法は,各ビューから3次元特徴を予測し,それらを入力画像と組み合わせて活用し,クロスビュー対応を確立する。
論文 参考訳(メタデータ) (2022-12-08T18:59:02Z) - State of the Art in Dense Monocular Non-Rigid 3D Reconstruction [100.9586977875698]
モノクル2D画像から変形可能なシーン(または非剛体)の3D再構成は、コンピュータビジョンとグラフィックスの長年、活発に研究されてきた領域である。
本研究は,モノクラー映像やモノクラービューの集合から,様々な変形可能な物体や複合シーンを高密度に非剛性で再現するための最先端の手法に焦点を当てる。
論文 参考訳(メタデータ) (2022-10-27T17:59:53Z) - MetaPose: Fast 3D Pose from Multiple Views without 3D Supervision [72.5863451123577]
正確な3Dポーズとカメラ推定が可能なニューラルモデルをトレーニングする方法を示す。
本手法は,古典的バンドル調整と弱教師付き単分子3Dベースラインの両方に優れる。
論文 参考訳(メタデータ) (2021-08-10T18:39:56Z) - Kinematic-Structure-Preserved Representation for Unsupervised 3D Human
Pose Estimation [58.72192168935338]
大規模インスタディオデータセットの監視を用いて開発された人間のポーズ推定モデルの一般化可能性については疑問が残る。
本稿では,2対あるいは2対の弱い監督者によって抑制されない,新しいキネマティック構造保存型非教師付き3次元ポーズ推定フレームワークを提案する。
提案モデルでは,前方運動学,カメラ投影,空間マップ変換という3つの連続的な微分可能変換を用いる。
論文 参考訳(メタデータ) (2020-06-24T23:56:33Z) - Self-Supervised 3D Human Pose Estimation via Part Guided Novel Image
Synthesis [72.34794624243281]
ラベルのないビデオフレームからバリエーションを分離する自己教師付き学習フレームワークを提案する。
3Dポーズと空間部分マップの表現ギャップを埋める、微分可能な形式化により、多様なカメラの動きを持つビデオで操作できる。
論文 参考訳(メタデータ) (2020-04-09T07:55:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。