論文の概要: Improving 6D Object Pose Estimation of metallic Household and Industry Objects
- arxiv url: http://arxiv.org/abs/2503.03655v1
- Date: Wed, 05 Mar 2025 16:35:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-06 15:53:24.309931
- Title: Improving 6D Object Pose Estimation of metallic Household and Industry Objects
- Title(参考訳): 金属系家庭用品・工業品の6次元オブジェクトポース推定の改善
- Authors: Thomas Pöllabauer, Michael Gasser, Tristan Wirth, Sarah Berkei, Volker Knauthe, Arjan Kuijper,
- Abstract要約: 6Dオブジェクトのポーズ推定は,金属オブジェクトに適用した場合の精度の低下に悩まされる。
我々は,産業アプリケーションにおけるリフレクションや特異なハイライトといった課題に対処することで,最先端技術の改善を図った。
我々の新しいBOP互換データセットは、様々な照明および背景条件下で様々な金属オブジェクトを特徴付け、幾何学的および視覚的手がかりを提供する。
- 参考スコア(独自算出の注目度): 4.280535500519799
- License:
- Abstract: 6D object pose estimation suffers from reduced accuracy when applied to metallic objects. We set out to improve the state-of-the-art by addressing challenges such as reflections and specular highlights in industrial applications. Our novel BOP-compatible dataset, featuring a diverse set of metallic objects (cans, household, and industrial items) under various lighting and background conditions, provides additional geometric and visual cues. We demonstrate that these cues can be effectively leveraged to enhance overall performance. To illustrate the usefulness of the additional features, we improve upon the GDRNPP algorithm by introducing an additional keypoint prediction and material estimator head in order to improve spatial scene understanding. Evaluations on the new dataset show improved accuracy for metallic objects, supporting the hypothesis that additional geometric and visual cues can improve learning.
- Abstract(参考訳): 6Dオブジェクトのポーズ推定は,金属オブジェクトに適用した場合の精度の低下に悩まされる。
我々は,産業アプリケーションにおけるリフレクションや特異なハイライトといった課題に対処することで,最先端技術の改善を図った。
我々の新しいBOP互換データセットは、様々な照明および背景条件下で様々な金属オブジェクト(缶、家庭用品、工業品)を特徴とし、幾何学的および視覚的手がかりを提供する。
これらのキューを効果的に活用し、全体的なパフォーマンスを向上させることを実証する。
追加機能の有用性を説明するために,空間的シーン理解を改善するために,追加のキーポイント予測と材料推定用ヘッドを導入することで,GDRNPPアルゴリズムの改良を行った。
新しいデータセットの評価では、金属オブジェクトの精度が向上し、幾何学的および視覚的な手がかりが学習を改善するという仮説が支持された。
関連論文リスト
- Correlation of Object Detection Performance with Visual Saliency and Depth Estimation [0.09208007322096533]
本稿では,物体検出精度と,深度予測と視覚塩分率予測の2つの基本的な視覚的課題の相関について検討する。
分析の結果,これらの相関は対象のカテゴリ間で有意な変化を示し,相関値がより小さいオブジェクトの最大3倍も大きいことが判明した。
これらの結果から, 物体検出アーキテクチャに視覚的サリエンシ機能を組み込むことは, 深度情報よりも有益であることが示唆された。
論文 参考訳(メタデータ) (2024-11-05T06:34:19Z) - AugInsert: Learning Robust Visual-Force Policies via Data Augmentation for Object Assembly Tasks [7.631503105866245]
本稿では,高精度オブジェクト集合タスクの文脈における堅牢な視覚力ポリシーの学習に主眼を置いている。
我々は,オンラインデータ拡張を通じて人間による実演を拡大することにより,限られた専門家データに基づいて多感覚入力によるコンタクトリッチな操作ポリシーを学習することを目指している。
論文 参考訳(メタデータ) (2024-10-19T04:19:52Z) - Improving Neural Surface Reconstruction with Feature Priors from Multi-View Image [87.00660347447494]
ニューラルサーフェス・コンストラクション(NSR)の最近の進歩は、ボリュームレンダリングと組み合わせることで、マルチビュー・コンストラクションを著しく改善している。
本稿では,多種多様な視覚的タスクから価値ある特徴を活用すべく,特徴レベルの一貫した損失について検討する。
DTU と EPFL を用いて解析した結果,画像マッチングと多視点ステレオデータセットによる特徴が,他のプリテキストタスクよりも優れていたことが判明した。
論文 参考訳(メタデータ) (2024-08-04T16:09:46Z) - A Simple Background Augmentation Method for Object Detection with Diffusion Model [53.32935683257045]
コンピュータビジョンでは、データの多様性の欠如がモデル性能を損なうことはよく知られている。
本稿では, 生成モデルの進歩を生かして, 単純かつ効果的なデータ拡張手法を提案する。
背景強化は、特にモデルの堅牢性と一般化能力を大幅に改善する。
論文 参考訳(メタデータ) (2024-08-01T07:40:00Z) - Shape-biased Texture Agnostic Representations for Improved Textureless and Metallic Object Detection and 6D Pose Estimation [9.227450931458907]
テクスチャレスおよびメタリックオブジェクトは、CNNの視覚的手がかりやテクスチャバイアスが少ないため、依然として重要な課題である。
形状バイアスをCNNトレーニングに誘導する手法を提案する。
この手法は、シームレスなデータレンダリングと、一貫性のあるテクスチャ面のないトレーニングデータの結果を可能にする。
論文 参考訳(メタデータ) (2024-02-07T14:18:19Z) - Context-Aware Indoor Point Cloud Object Generation through User Instructions [6.398660996031915]
本稿では,その周辺環境とシームレスに統合された点雲オブジェクトを生成することができる,新しいエンドツーエンドのマルチモーダルディープニューラルネットワークを提案する。
我々のモデルは、これまで見えなかったオブジェクトレイアウトで新しい環境を作成できるようにすることで、シーン修正に革命をもたらす。
論文 参考訳(メタデータ) (2023-11-26T06:40:16Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Evaluating Robustness of Visual Representations for Object Assembly Task
Requiring Spatio-Geometrical Reasoning [8.626019848533707]
本稿では,オブジェクト・アセンブリ・タスクのコンテキストにおける視覚表現の堅牢性の評価と評価に焦点をあてる。
我々は視覚前訓練モデルを視覚エンコーダとして利用するビズモータ政策学習の一般的な枠組みを用いる。
本研究は、両腕操作装置に適用する場合、特にグリップ変動に対して、この枠組みの頑健性について検討する。
論文 参考訳(メタデータ) (2023-10-15T20:41:07Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - Progressive Self-Guided Loss for Salient Object Detection [102.35488902433896]
画像中の深層学習に基づくサラエント物体検出を容易にするプログレッシブ自己誘導損失関数を提案する。
我々のフレームワークは適応的に集約されたマルチスケール機能を利用して、健全な物体の探索と検出を効果的に行う。
論文 参考訳(メタデータ) (2021-01-07T07:33:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。