Fugu-MT 論文翻訳(概要): SilhoNet-Fisheye: Adaptation of A ROI Based Object Pose Estimation Network to Monocular Fisheye Images

論文の概要: SilhoNet-Fisheye: Adaptation of A ROI Based Object Pose Estimation Network to Monocular Fisheye Images

arxiv url: http://arxiv.org/abs/2002.12415v1
Date: Thu, 27 Feb 2020 19:57:33 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-28 08:59:02.838610
Title: SilhoNet-Fisheye: Adaptation of A ROI Based Object Pose Estimation Network to Monocular Fisheye Images
Title（参考訳）: SilhoNet-Fisheye: ROIに基づく単眼魚眼画像へのオブジェクトポース推定ネットワークの適応
Authors: Gideon Billings, Matthew Johnson-Roberson
Abstract要約: 本稿では、ROIに基づく6Dオブジェクトのポーズ推定手法を魚眼画像に適用するための新しいフレームワークを提案する。また、6Dオブジェクトポーズと2Dバウンディングボックスアノテーションを備えたUWHandlesと呼ばれる魚眼画像データセットも提供しています。
参考スコア（独自算出の注目度）: 15.573003283204958
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: There has been much recent interest in deep learning methods for monocular image based object pose estimation. While object pose estimation is an important problem for autonomous robot interaction with the physical world, and the application space for monocular-based methods is expansive, there has been little work on applying these methods with fisheye imaging systems. Also, little exists in the way of annotated fisheye image datasets on which these methods can be developed and tested. The research landscape is even more sparse for object detection methods applied in the underwater domain, fisheye image based or otherwise. In this work, we present a novel framework for adapting a ROI-based 6D object pose estimation method to work on full fisheye images. The method incorporates the gnomic projection of regions of interest from an intermediate spherical image representation to correct for the fisheye distortions. Further, we contribute a fisheye image dataset, called UWHandles, collected in natural underwater environments, with 6D object pose and 2D bounding box annotations.
Abstract（参考訳）: 近年,単眼画像に基づく物体ポーズ推定のためのディープラーニング手法が注目されている。物体のポーズ推定は,ロボットと物理的世界との自律的相互作用において重要な問題であり,モノクラー法の適用範囲は拡大するが,魚眼画像システムにこれらの手法を適用する研究はほとんど行われていない。また、これらの手法を開発・テストできる注釈付き魚眼画像データセットの方法もほとんど存在しない。研究の風景は、水中ドメインや魚眼画像などに適用される物体検出方法として、さらに疎い。本研究では、ROIに基づく6Dオブジェクトのポーズ推定手法を魚眼画像に適用するための新しいフレームワークを提案する。この方法は、魚眼歪みの補正のために、中間球面画像表現から興味領域のゲノム投影を組み込む。さらに,魚眼画像データセットであるUWHandlesを,自然水中で収集し,6Dオブジェクトポーズと2Dバウンディングボックスアノテーションを付加した。

関連論文リスト

ReFlow6D: Refraction-Guided Transparent Object 6D Pose Estimation via Intermediate Representation Learning [48.29147383536012]
透明な物体6次元ポーズ推定のための新しい手法であるReFlow6Dを提案する。従来の手法とは異なり,RGB画像空間の変化や深度情報に依存しない特徴空間を利用する。 ReFlow6Dは,RGB画像のみを入力として,透明物体の正確な6次元ポーズ推定を実現する。
論文参考訳（メタデータ） (2024-12-30T09:53:26Z)
FisheyeDepth: A Real Scale Self-Supervised Depth Estimation Model for Fisheye Camera [8.502741852406904]
魚眼カメラに適した自己監督深度推定モデルである魚眼深度について述べる。魚眼カメラモデルを訓練中の投射と再投射の段階に組み込んで画像歪みの処理を行う。また、連続するフレーム間の幾何学的投影に実際のポーズ情報を組み込んで、従来のポーズネットワークで推定されたポーズを置き換える。
論文参考訳（メタデータ） (2024-09-23T14:31:42Z)
RoFIR: Robust Fisheye Image Rectification Framework Impervious to Optical Center Deviation [88.54817424560056]
局所歪みの度合いと方向を測定する歪みベクトルマップ(DVM)を提案する。 DVMを学習することで、大域的な歪みパターンに頼ることなく、各ピクセルの局所歪みを独立に識別することができる。事前学習段階では、歪みベクトルマップを予測し、各画素の局所歪み特徴を知覚する。微調整段階では、魚眼画像修正のための画素単位のフローマップを予測する。
論文参考訳（メタデータ） (2024-06-27T06:38:56Z)
MegaPose: 6D Pose Estimation of Novel Objects via Render & Compare [84.80956484848505]
MegaPoseは、トレーニング中に見えない新しいオブジェクトの6Dポーズを推定する方法である。本稿では,新しいオブジェクトに適用可能なR&Compare戦略に基づく6次元ポーズリファインダを提案する。第2に,合成レンダリングと同一物体の観察画像間のポーズ誤差をリファインダで補正できるか否かを分類するために訓練されたネットワークを利用する,粗いポーズ推定のための新しいアプローチを提案する。
論文参考訳（メタデータ） (2022-12-13T19:30:03Z)
Learning Geometry-Guided Depth via Projective Modeling for Monocular 3D Object Detection [70.71934539556916]
射影モデルを用いて幾何学誘導深度推定を学習し, モノクル3次元物体検出を推し進める。具体的には,モノクロ3次元物体検出ネットワークにおける2次元および3次元深度予測の投影モデルを用いた原理的幾何式を考案した。本手法は, 適度なテスト設定において, 余分なデータを2.80%も加えることなく, 最先端単分子法の検出性能を著しく向上させる。
論文参考訳（メタデータ） (2021-07-29T12:30:39Z)
DONet: Learning Category-Level 6D Object Pose and Size Estimation from Depth Observation [53.55300278592281]
単一深度画像からカテゴリレベルの6次元オブジェクト・ポースとサイズ推定(COPSE)を提案する。筆者らのフレームワークは,深度チャネルのみの物体のリッチな幾何学的情報に基づいて推論を行う。我々のフレームワークは、ラベル付き現実世界の画像を必要とする最先端のアプローチと競合する。
論文参考訳（メタデータ） (2021-06-27T10:41:50Z)
FisheyeSuperPoint: Keypoint Detection and Description Network for Fisheye Images [2.187613144178315]
キーポイントの検出と記述はコンピュータビジョンシステムで一般的に使用されるビルディングブロックである。 SuperPointは、ホモグラフィー推定における最先端の結果を達成した自己監視型キーポイント検出器およびディスクリプタです。本稿では,魚眼画像の学習を可能にする魚眼適応パイプラインを提案する。
論文参考訳（メタデータ） (2021-02-27T11:26:34Z)
Supervised Training of Dense Object Nets using Optimal Descriptors for Industrial Robotic Applications [57.87136703404356]
Florence、Manuelli、TedrakeによるDense Object Nets(DON)は、ロボットコミュニティのための新しいビジュアルオブジェクト表現として高密度オブジェクト記述子を導入した。本稿では, 物体の3次元モデルを考えると, 記述子空間画像を生成することができ, DON の教師付きトレーニングが可能であることを示す。産業用物体の6次元グリップ生成のためのトレーニング手法を比較し,新しい教師付きトレーニング手法により,産業関連タスクのピック・アンド・プレイス性能が向上することを示す。
論文参考訳（メタデータ） (2021-02-16T11:40:12Z)
Neural Ray Surfaces for Self-Supervised Learning of Depth and Ego-motion [51.19260542887099]
カメラモデルの事前知識を必要とせずに、自己超越を用いて正確な深度とエゴモーション推定を学習できることが示される。 Grossberg と Nayar の幾何学モデルにインスパイアされた我々は、ピクセルワイド射影線を表す畳み込みネットワークである Neural Ray Surfaces (NRS) を導入する。本研究では,多種多様なカメラシステムを用いて得られた生ビデオから,視覚計測の自己教師付き学習と深度推定にNRSを用いることを実証する。
論文参考訳（メタデータ） (2020-08-15T02:29:13Z)
SynDistNet: Self-Supervised Monocular Fisheye Camera Distance Estimation Synergized with Semantic Segmentation for Autonomous Driving [37.50089104051591]
モノクル深度推定のための最先端の自己教師型学習アプローチは、通常、スケールの曖昧さに悩まされる。本稿では,魚眼カメラ画像とピンホールカメラ画像の自己教師付き単眼距離推定を改善するための,新しいマルチタスク学習手法を提案する。
論文参考訳（メタデータ） (2020-08-10T10:52:47Z)
DeepURL: Deep Pose Estimation Framework for Underwater Relative Localization [21.096166727043077]
本研究では,自律型水中車両(AUV)の6次元相対姿勢を1つの画像から決定するためのリアルタイム深層学習手法を提案する。画像間翻訳ネットワークを用いて、レンダリングされた実画像間のギャップを埋めて、トレーニング用合成画像を生成する。
論文参考訳（メタデータ） (2020-03-11T21:11:05Z)
3D Object Detection from a Single Fisheye Image Without a Single Fisheye Training Image [7.86363825307044]
魚眼カメラから画像中の3次元物体を検出するために,リチリニア画像のみを用いて訓練された既存のモノクロ3次元物体検出モデルを使用する方法を示す。合成データのベンチマークにより,パノラマにおけるモノクロ3次元物体検出法は,既存の手法よりも優れていた。
論文参考訳（メタデータ） (2020-03-08T11:03:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。