論文の概要: Absolute 3D Pose Estimation and Length Measurement of Severely Deformed
Fish from Monocular Videos in Longline Fishing
- arxiv url: http://arxiv.org/abs/2102.04639v1
- Date: Tue, 9 Feb 2021 04:15:51 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-10 15:04:03.074872
- Title: Absolute 3D Pose Estimation and Length Measurement of Severely Deformed
Fish from Monocular Videos in Longline Fishing
- Title(参考訳): 長線釣りにおける単眼映像からの高度変形魚の絶対3次元ポーズ推定と長さ測定
- Authors: Jie Mei, Jenq-Neng Hwang, Suzanne Romain, Craig Rose, Braden Moore,
Kelsey Magrane
- Abstract要約: 単一視点の2Dセグメンテーションマスクから絶対的な3D魚のポーズと魚の長さを推定するためのフレームベースの新しい手法を提案する。
実験の結果,本手法では, 絶対3次元魚のポーズを正確に推定し, さらに絶対長を計測し, 最先端のマルチビュー法よりも優れていることがわかった。
- 参考スコア(独自算出の注目度): 18.047341991236703
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Monocular absolute 3D fish pose estimation allows for efficient fish length
measurement in the longline fisheries, where fishes are under severe
deformation during the catching process. This task is challenging since it
requires locating absolute 3D fish keypoints based on a short monocular video
clip. Unlike related works, which either require expensive 3D ground-truth data
and/or multiple-view images to provide depth information, or are limited to
rigid objects, we propose a novel frame-based method to estimate the absolute
3D fish pose and fish length from a single-view 2D segmentation mask. We first
introduce a relative 3D fish template. By minimizing an objective function, our
method systematically estimates the relative 3D pose of the target fish and
fish 2D keypoints in the image. Finally, with a closed-form solution, the
relative 3D fish pose can help locate absolute 3D keypoints, resulting in the
frame-based absolute fish length measurement, which is further refined based on
the statistical temporal inference for the optimal fish length measurement from
the video clip. Our experiments show that this method can accurately estimate
the absolute 3D fish pose and further measure the absolute length, even
outperforming the state-of-the-art multi-view method.
- Abstract(参考訳): 漁獲過程において魚が大きな変形を受ける長線漁業において, 単眼的絶対3次元魚類ポーズ推定は効率的な魚長計測を可能にする。
このタスクは、短い単眼ビデオクリップに基づいて絶対的な3D魚のキーポイントを見つける必要があるため、難しい。
深度情報を提供するために高価な3次元地中データおよび/または多視点画像を必要とするか、剛体に限定される関連作品とは異なり、一視点の2次元セグメンテーションマスクから絶対的な3次元魚のポーズと魚長を推定する新しいフレームベース手法を提案する。
まず、相対的な3d fishテンプレートを紹介します。
目的関数を最小化することにより,画像中の対象魚と魚の2dキーポイントの相対的3dポーズを体系的に推定する。
最後に、閉じた形状の溶液により、相対的な3dフィッシュポーズは絶対3dキーポイントを見つけるのに役立ち、ビデオクリップから最適な魚長測定のための統計的時間的推論に基づいて、フレームベースの絶対魚長測定がさらに洗練される。
本実験では, 本手法により, 3D魚のポーズを正確に推定し, さらに絶対長を計測し, 最新のマルチビュー法を上回った。
関連論文リスト
- FisheyeDepth: A Real Scale Self-Supervised Depth Estimation Model for Fisheye Camera [8.502741852406904]
魚眼カメラに適した自己監督深度推定モデルである魚眼深度について述べる。
魚眼カメラモデルを訓練中の投射と再投射の段階に組み込んで画像歪みの処理を行う。
また、連続するフレーム間の幾何学的投影に実際のポーズ情報を組み込んで、従来のポーズネットワークで推定されたポーズを置き換える。
論文 参考訳(メタデータ) (2024-09-23T14:31:42Z) - Egocentric Whole-Body Motion Capture with FisheyeViT and Diffusion-Based
Motion Refinement [65.08165593201437]
本研究では,人体と手の動きを同時に推定する単一魚眼カメラを用いて,自我中心型全体モーションキャプチャーを探索する。
この課題は、高品質なデータセットの欠如、魚眼カメラの歪み、人間の身体の自己閉塞など、重大な課題を提起する。
そこで本研究では,魚眼画像の特徴を3次元人体ポーズ予測のための3次元熱マップ表現に変換した魚眼画像の特徴を抽出する手法を提案する。
論文 参考訳(メタデータ) (2023-11-28T07:13:47Z) - Scene-Aware 3D Multi-Human Motion Capture from a Single Camera [83.06768487435818]
静止カメラで記録された1枚のRGBビデオから、シーン内の複数の人間の3次元位置を推定し、その身体形状と調音を推定する問題を考察する。
コンピュータビジョンの最近の進歩を,2次元の人体関節,関節角度,正規化不均等マップ,人間のセグメンテーションマスクなど,様々なモダリティのための大規模事前訓練モデルを用いて活用している。
特に,2次元の関節と関節角度を用いた正規化不均等予測から,シーン深度とユニークな人格尺度を推定する。
論文 参考訳(メタデータ) (2023-01-12T18:01:28Z) - Weakly Supervised 3D Multi-person Pose Estimation for Large-scale Scenes
based on Monocular Camera and Single LiDAR [41.39277657279448]
大規模シーンにおける3次元多人数ポーズ推定のためのモノクロカメラとLiDARによる単一手法を提案する。
具体的には,画像や点クラウドを含むマルチモーダル入力データを活用するための効果的な融合戦略を設計する。
本手法は, 点雲の固有な幾何学的制約を自己監督のために利用し, 画像上の2次元キーポイントを弱監督のために利用する。
論文 参考訳(メタデータ) (2022-11-30T12:50:40Z) - MetaPose: Fast 3D Pose from Multiple Views without 3D Supervision [72.5863451123577]
正確な3Dポーズとカメラ推定が可能なニューラルモデルをトレーニングする方法を示す。
本手法は,古典的バンドル調整と弱教師付き単分子3Dベースラインの両方に優れる。
論文 参考訳(メタデータ) (2021-08-10T18:39:56Z) - Learning Geometry-Guided Depth via Projective Modeling for Monocular 3D Object Detection [70.71934539556916]
射影モデルを用いて幾何学誘導深度推定を学習し, モノクル3次元物体検出を推し進める。
具体的には,モノクロ3次元物体検出ネットワークにおける2次元および3次元深度予測の投影モデルを用いた原理的幾何式を考案した。
本手法は, 適度なテスト設定において, 余分なデータを2.80%も加えることなく, 最先端単分子法の検出性能を著しく向上させる。
論文 参考訳(メタデータ) (2021-07-29T12:30:39Z) - Disentangling and Vectorization: A 3D Visual Perception Approach for
Autonomous Driving Based on Surround-View Fisheye Cameras [3.485767750936058]
多次元ベクトルは、異なる次元と段階で生成される有効情報を含むことが提案されている。
実魚眼画像実験により,本手法は実時間で最先端の精度を達成できることが実証された。
論文 参考訳(メタデータ) (2021-07-19T13:24:21Z) - Multi-View Multi-Person 3D Pose Estimation with Plane Sweep Stereo [71.59494156155309]
既存のマルチビュー3Dポーズ推定手法は、複数のカメラビューからグループ2Dポーズ検出に対するクロスビュー対応を明確に確立する。
平面スイープステレオに基づくマルチビュー3Dポーズ推定手法を提案し、クロスビュー融合と3Dポーズ再構築を1ショットで共同で解決します。
論文 参考訳(メタデータ) (2021-04-06T03:49:35Z) - Residual Pose: A Decoupled Approach for Depth-based 3D Human Pose
Estimation [18.103595280706593]
我々は,CNNによる信頼度の高い2次元ポーズ推定の最近の進歩を活用し,深度画像から人物の3次元ポーズを推定する。
提案手法は2つの公開データセットの精度と速度の両面で非常に競争力のある結果が得られる。
論文 参考訳(メタデータ) (2020-11-10T10:08:13Z) - Lightweight Multi-View 3D Pose Estimation through Camera-Disentangled
Representation [57.11299763566534]
空間校正カメラで撮影した多視点画像から3次元ポーズを復元する手法を提案する。
我々は3次元形状を利用して、入力画像をカメラ視点から切り離したポーズの潜在表現に融合する。
アーキテクチャは、カメラプロジェクション演算子に学習した表現を条件付け、ビュー当たりの正確な2次元検出を生成する。
論文 参考訳(メタデータ) (2020-04-05T12:52:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。