論文の概要: BOP Challenge 2020 on 6D Object Localization
- arxiv url: http://arxiv.org/abs/2009.07378v2
- Date: Tue, 13 Oct 2020 12:09:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-18 05:58:40.439615
- Title: BOP Challenge 2020 on 6D Object Localization
- Title(参考訳): 6Dオブジェクトローカライゼーションに関するBOP Challenge 2020
- Authors: Tomas Hodan, Martin Sundermeyer, Bertram Drost, Yann Labbe, Eric
Brachmann, Frank Michel, Carsten Rother, Jiri Matas
- Abstract要約: BOP Challenge 2020は、RGB-D画像から6Dオブジェクトのポーズを推定する分野における現状を捉えることを目標とする、一連の公開コンペティションの3番目である。
参加者はBlenderProc4BOPが生成した350Kのトレーニング画像、新しいオープンソースで軽量な物理ベース(PBR)と手続きデータジェネレータが提供された。
トップパフォーマンスの手法はRGB-D画像チャンネルに依存しているが、トレーニングとテストの両方でRGBチャンネルのみを使用した場合、強い結果が得られた。
- 参考スコア(独自算出の注目度): 56.591561228575635
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents the evaluation methodology, datasets, and results of the
BOP Challenge 2020, the third in a series of public competitions organized with
the goal to capture the status quo in the field of 6D object pose estimation
from an RGB-D image. In 2020, to reduce the domain gap between synthetic
training and real test RGB images, the participants were provided 350K
photorealistic training images generated by BlenderProc4BOP, a new open-source
and light-weight physically-based renderer (PBR) and procedural data generator.
Methods based on deep neural networks have finally caught up with methods based
on point pair features, which were dominating previous editions of the
challenge. Although the top-performing methods rely on RGB-D image channels,
strong results were achieved when only RGB channels were used at both training
and test time - out of the 26 evaluated methods, the third method was trained
on RGB channels of PBR and real images, while the fifth on RGB channels of PBR
images only. Strong data augmentation was identified as a key component of the
top-performing CosyPose method, and the photorealism of PBR images was
demonstrated effective despite the augmentation. The online evaluation system
stays open and is available on the project website: bop.felk.cvut.cz.
- Abstract(参考訳): 本稿では,RGB-D画像からの6次元オブジェクトのポーズ推定の分野における現状の把握を目的とした,一連の公開コンペティションの3番目であるBOP Challenge 2020の評価方法論,データセット,結果について述べる。
2020年、合成トレーニングと実際のRGB画像の間の領域ギャップを減らすために、参加者はBlenderProc4BOPが生成した350Kのフォトリアリスティックなトレーニング画像、新しいオープンソースで軽量な物理ベースレンダラー(PBR)と手続きデータジェネレータを提供した。
ディープニューラルネットワークに基づく手法がついにポイントペアの特徴に基づく手法に到達した。
トップパフォーマンスの手法はRGB-D画像チャンネルに依存しているが、トレーニング時間とテスト時間の両方でRGBチャンネルのみを使用すると強い結果が得られ、26の評価手法のうち、第3の手法はPBRのRGBチャンネルと実画像でトレーニングされ、第5の手法はPBR画像のRGBチャンネルでのみトレーニングされた。
トップパフォーミングcosypose法では,強いデータ拡張が重要成分として同定され,pbr画像のフォトリアリズムが有効であった。
オンライン評価システムは引き続き公開されており、プロジェクトのwebサイト(bop.felk.cvut.cz)で入手できる。
関連論文リスト
- RGB-based Category-level Object Pose Estimation via Decoupled Metric
Scale Recovery [72.13154206106259]
本研究では、6次元のポーズとサイズ推定を分離し、不完全なスケールが剛性変換に与える影響を緩和するパイプラインを提案する。
具体的には,事前学習した単分子推定器を用いて局所的な幾何学的情報を抽出する。
別個のブランチは、カテゴリレベルの統計に基づいてオブジェクトのメートル法スケールを直接復元するように設計されている。
論文 参考訳(メタデータ) (2023-09-19T02:20:26Z) - MSDA: Monocular Self-supervised Domain Adaptation for 6D Object Pose
Estimation [12.773040823634908]
実画像からラベル付き6Dポーズを取得するための自己教師付きドメイン適応手法を提案する。
まず、合成RGB画像を用いてモデルを事前訓練し、次に実RGB(-D)画像を用いて事前訓練されたモデルを微調整する。
我々は,本手法が完全教師付き手法と同等の性能を発揮することを実験的に実証した。
論文 参考訳(メタデータ) (2023-02-14T19:34:41Z) - A Combined Approach Toward Consistent Reconstructions of Indoor Spaces
Based on 6D RGB-D Odometry and KinectFusion [7.503338065129185]
キーポイント抽出により連続したRGB-Dフレーム間の相対的なカメラポーズを求める6次元RGB-Dオドメトリー手法を提案する。
推定されたポーズを、フレーム間相対的なポーズを微調整するKinectFusionアルゴリズムに入力する。
提案アルゴリズムは,ポストプロセッシングのステップを使わずに,利用可能なポリゴンメッシュ(3次元仮想世界を作成するのに非常に適している)を出力する。
論文 参考訳(メタデータ) (2022-12-25T22:52:25Z) - Learning 6D Pose Estimation from Synthetic RGBD Images for Robotic
Applications [0.6299766708197883]
提案したパイプラインは、興味のある対象のために大量の写真リアリスティックなRGBD画像を生成することができる。
オブジェクト検出器YOLO-V4-tinyと6次元ポーズ推定アルゴリズムPVN3Dを統合し,リアルタイム2次元ポーズ推定手法を開発した。
結果として得られたネットワークは、LineModデータセットで評価した場合の最先端手法と比較して、競合性能を示す。
論文 参考訳(メタデータ) (2022-08-30T14:17:15Z) - Towards Two-view 6D Object Pose Estimation: A Comparative Study on
Fusion Strategy [16.65699606802237]
現在のRGBベースの6Dオブジェクトポーズ推定手法は、データセットや実世界のアプリケーションで顕著なパフォーマンスを達成した。
本稿では2枚のRGB画像から暗黙的な3D情報を学習する6次元オブジェクトポーズ推定フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-01T08:22:34Z) - Blind Face Restoration: Benchmark Datasets and a Baseline Model [63.053331687284064]
Blind Face Restoration (BFR) は、対応する低品質 (LQ) 入力から高品質 (HQ) の顔画像を構築することを目的としている。
EDFace-Celeb-1M (BFR128) と EDFace-Celeb-150K (BFR512) と呼ばれる2つのブラインドフェイス復元ベンチマークデータセットを最初に合成する。
最先端の手法は、ブラー、ノイズ、低解像度、JPEG圧縮アーティファクト、それらの組み合わせ(完全な劣化)の5つの設定でベンチマークされる。
論文 参考訳(メタデータ) (2022-06-08T06:34:24Z) - Semantic-embedded Unsupervised Spectral Reconstruction from Single RGB
Images in the Wild [48.44194221801609]
この課題に対処するため、我々は、新しい軽量でエンドツーエンドの学習ベースのフレームワークを提案する。
我々は、効率的なカメラスペクトル応答関数推定により、検索されたHS画像から入力されたRGB画像と再投影されたRGB画像の差を徐々に広げる。
提案手法は最先端の教師なし手法よりも優れており,いくつかの設定下では最新の教師付き手法よりも優れている。
論文 参考訳(メタデータ) (2021-08-15T05:19:44Z) - A New Mask R-CNN Based Method for Improved Landslide Detection [54.7905160534631]
本稿では,Mask R-CNN機能を利用した地すべり検出手法を提案する。
地すべり及び非地すべり画像を含む160個の要素からなるデータセットを作成する。
提案アルゴリズムは丘陵地帯の土地利用計画立案者や政策立案者にとって潜在的に有用である。
論文 参考訳(メタデータ) (2020-10-04T07:46:37Z) - NTIRE 2020 Challenge on Spectral Reconstruction from an RGB Image [61.71186808848108]
本稿では,RGB画像からのスペクトル再構成に関する第2の課題についてレビューする。
3チャンネルのRGB画像から全シーンハイパースペクトル(HS)情報を復元する。
新しい、より大きく、自然なハイパースペクトル画像データセットが提示される。
論文 参考訳(メタデータ) (2020-05-07T12:23:56Z) - Two-Level Attention-based Fusion Learning for RGB-D Face Recognition [21.735238213921804]
RGBと深度という2つの画像モダリティを融合させてRGB-D顔認識を向上する新しいアテンションアウェアメント手法を提案する。
提案手法はまず,畳み込み特徴抽出器を用いて両モードから特徴を抽出する。
これらの特徴は、2層アテンション機構を用いて融合される。
論文 参考訳(メタデータ) (2020-02-29T03:18:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。