Fugu-MT 論文翻訳(概要): STAR: Shape-focused Texture Agnostic Representations for Improved Object Detection and 6D Pose Estimation

論文の概要: STAR: Shape-focused Texture Agnostic Representations for Improved Object Detection and 6D Pose Estimation

arxiv url: http://arxiv.org/abs/2402.04878v1
Date: Wed, 7 Feb 2024 14:18:19 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-08 15:01:54.243794
Title: STAR: Shape-focused Texture Agnostic Representations for Improved Object Detection and 6D Pose Estimation
Title（参考訳）: STAR:形状中心のテクスチャ非依存表現による物体検出と6次元空間推定
Authors: Peter H\"onig, Stefan Thalhammer, Jean-Baptiste Weibel, Matthias Hirschmanner, Markus Vincze
Abstract要約: 本稿では,CADモデルからの学習に焦点を当てたテクスチャに依存しないアプローチを提案し,オブジェクト形状の特徴を強調する。学習形状特徴に焦点を合わせるために、トレーニングデータのレンダリング中にテクスチャをランダム化する。テクスチャ非依存性はまた、画像ノイズ、動きのぼかし、明るさ変化などの画像摂動に対する堅牢性を高める。
参考スコア（独自算出の注目度）: 9.899633398596672
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Recent advances in machine learning have greatly benefited object detection and 6D pose estimation for robotic grasping. However, textureless and metallic objects still pose a significant challenge due to fewer visual cues and the texture bias of CNNs. To address this issue, we propose a texture-agnostic approach that focuses on learning from CAD models and emphasizes object shape features. To achieve a focus on learning shape features, the textures are randomized during the rendering of the training data. By treating the texture as noise, the need for real-world object instances or their final appearance during training data generation is eliminated. The TLESS and ITODD datasets, specifically created for industrial settings in robotics and featuring textureless and metallic objects, were used for evaluation. Texture agnosticity also increases the robustness against image perturbations such as imaging noise, motion blur, and brightness changes, which are common in robotics applications. Code and datasets are publicly available at github.com/hoenigpeter/randomized_texturing.
Abstract（参考訳）: 機械学習の最近の進歩は、ロボット把持のための物体検出と6次元ポーズ推定に大きな恩恵を受けている。しかしながら、テクスチャレスやメタリックオブジェクトは、視覚の手がかりが少なく、cnnのテクスチャバイアスが小さいため、依然として大きな課題となっている。この問題に対処するために,cadモデルからの学習に着目し,オブジェクト形状の特徴を強調するテクスチャ非依存アプローチを提案する。学習形状特徴に焦点を合わせるために、トレーニングデータのレンダリング中にテクスチャをランダム化する。テクスチャをノイズとして扱うことにより、実世界のオブジェクトインスタンスやトレーニングデータ生成時の最終的な外観の必要性がなくなる。 TLESSとITODDデータセットは、特にロボット工学の工業的設定のために作成され、テクスチャレスと金属の物体を特徴とする。テクスチャ非依存性はまた、画像ノイズ、動きのぼかし、明るさの変化などの画像摂動に対する堅牢性を高める。コードとデータセットはgithub.com/hoenigpeter/randomized_texturingで公開されている。

関連論文リスト

Real-time Free-view Human Rendering from Sparse-view RGB Videos using Double Unprojected Textures [87.80984588545589]
スパースビューのRGB入力からのリアルタイム自由視点人体レンダリングは、センサー不足と厳しい時間予算のために難しい課題である。本稿では,2重非投影テクスチャについて述べる。その中心部では外観合成から粗い幾何学的変形推定を行う。
論文参考訳（メタデータ） (2024-12-17T18:57:38Z)
Inverse Neural Rendering for Explainable Multi-Object Tracking [35.072142773300655]
我々はRGBカメラから3Dマルチオブジェクト追跡をEmphInverse Rendering (IR)問題として再放送した。我々は、本質的に形状と外観特性を歪ませる生成潜在空間上の画像損失を最適化する。本手法の一般化とスケーリング能力は,合成データのみから生成前を学習することで検証する。
論文参考訳（メタデータ） (2024-04-18T17:37:53Z)
SplatPose & Detect: Pose-Agnostic 3D Anomaly Detection [18.796625355398252]
最先端のアルゴリズムは、ますます困難な設定やデータモダリティの欠陥を検出することができる。本稿では,3次元ガウススプラッティングに基づくフレームワークSplatPoseを提案する。競合手法に比べてトレーニングデータが少ない場合でも,トレーニング速度と推論速度,検出性能の両面で最先端の成果が得られている。
論文参考訳（メタデータ） (2024-04-10T08:48:09Z)
What You See Is What You Detect: Towards better Object Densification in 3D detection [2.3436632098950456]
広く使われているフル形状のコンプリートアプローチは、特に遠く離れた物や歩行者のような小さな物に対して、エラーのアップバウンドを高くする。従来の手法が生成した予測ポイントの11.3%しか必要としない可視部分補完法を提案する。密表現を復元するために,目に見える前景オブジェクトに関連付けられた点集合を拡大するメッシュデフォーメーションに基づく手法を提案する。
論文参考訳（メタデータ） (2023-10-27T01:46:37Z)
CheckerPose: Progressive Dense Keypoint Localization for Object Pose Estimation with Graph Neural Network [66.24726878647543]
単一のRGB画像から固い物体の6-DoFのポーズを推定することは、非常に難しい課題である。近年の研究では、高密度対応型解の大きな可能性を示している。そこで本研究では,CheckerPoseというポーズ推定アルゴリズムを提案する。
論文参考訳（メタデータ） (2023-03-29T17:30:53Z)
BundleSDF: Neural 6-DoF Tracking and 3D Reconstruction of Unknown Objects [89.2314092102403]
モノクロRGBDビデオシーケンスから未知物体の6-DoF追跡をリアルタイムに行う手法を提案する。視覚的テクスチャがほとんど欠如している場合でも,任意の剛体オブジェクトに対して有効である。
論文参考訳（メタデータ） (2023-03-24T17:13:49Z)
TexPose: Neural Texture Learning for Self-Supervised 6D Object Pose Estimation [55.94900327396771]
合成データから6次元オブジェクトポーズ推定のためのニューラルネットワークによるテクスチャ学習を提案する。実画像からオブジェクトの現実的なテクスチャを予測することを学ぶ。画素完全合成データからポーズ推定を学習する。
論文参考訳（メタデータ） (2022-12-25T13:36:32Z)
NeRF-Pose: A First-Reconstruct-Then-Regress Approach for Weakly-supervised 6D Object Pose Estimation [44.42449011619408]
トレーニング中に2次元オブジェクトセグメンテーションと既知の相対カメラポーズしか必要としないNeRF-Poseという,弱教師付き再構築型パイプラインを提案する。予測応答から安定かつ正確なポーズを推定するために、NeRF対応RAN+SACアルゴリズムを用いる。 LineMod-Occlusion 実験の結果,提案手法は6次元ポーズ推定法と比較して最先端の精度を持つことがわかった。
論文参考訳（メタデータ） (2022-03-09T15:28:02Z)
RandomRooms: Unsupervised Pre-training from Synthetic Shapes and Randomized Layouts for 3D Object Detection [138.2892824662943]
有望な解決策は、CADオブジェクトモデルで構成される合成データセットをよりよく利用して、実際のデータセットでの学習を促進することである。最近の3次元事前学習の研究は、合成物体から他の実世界の応用へ学習した伝達特性が失敗することを示している。本研究では,この目的を達成するためにRandomRoomsという新しい手法を提案する。
論文参考訳（メタデータ） (2021-08-17T17:56:12Z)
Unsupervised Learning of 3D Object Categories from Videos in the Wild [75.09720013151247]
オブジェクトインスタンスの大規模なコレクションの複数のビューからモデルを学ぶことに重点を置いています。再構成を大幅に改善するワープコンディショニングレイ埋め込み(WCR)と呼ばれる新しいニューラルネットワーク設計を提案する。本評価は,既存のベンチマークを用いた複数の深部単眼再構成ベースラインに対する性能改善を示す。
論文参考訳（メタデータ） (2021-03-30T17:57:01Z)
Data Augmentation for Object Detection via Differentiable Neural Rendering [71.00447761415388]
注釈付きデータが乏しい場合、堅牢なオブジェクト検出器を訓練することは困難です。この問題に対処する既存のアプローチには、ラベル付きデータからラベル付きデータを補間する半教師付き学習が含まれる。オブジェクト検出のためのオフラインデータ拡張手法を導入し、新しいビューでトレーニングデータを意味的に補間する。
論文参考訳（メタデータ） (2021-03-04T06:31:06Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。