論文の概要: Textureless Object Recognition: An Edge-based Approach
- arxiv url: http://arxiv.org/abs/2403.06107v1
- Date: Sun, 10 Mar 2024 06:27:04 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-13 08:31:27.679864
- Title: Textureless Object Recognition: An Edge-based Approach
- Title(参考訳): テクスチャレスオブジェクト認識:エッジベースアプローチ
- Authors: Frincy Clement, Kirtan Shah, Dhara Pancholi, Gabriel Lugo Bustillo and
Dr. Irene Cheng
- Abstract要約: 初期不均衡な小さなデータセットから堅牢な拡張データセットを作成します。
エッジ機能、機能の組み合わせ、機能/機能の組み合わせで強化されたRGBイメージを抽出して、15のデータセットを生成します。
実験と解析の結果から,RGB画像は3つのエッジ特徴を組み合わせて向上し,他の画像と比較した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Textureless object recognition has become a significant task in Computer
Vision with the advent of Robotics and its applications in manufacturing
sector. It has been challenging to obtain good accuracy in real time because of
its lack of discriminative features and reflectance properties which makes the
techniques for textured object recognition insufficient for textureless
objects. A lot of work has been done in the last 20 years, especially in the
recent 5 years after the TLess and other textureless dataset were introduced.
In this project, by applying image processing techniques we created a robust
augmented dataset from initial imbalanced smaller dataset. We extracted edge
features, feature combinations and RGB images enhanced with feature/feature
combinations to create 15 datasets, each with a size of ~340,000. We then
trained four classifiers on these 15 datasets to arrive at a conclusion as to
which dataset performs the best overall and whether edge features are important
for textureless objects. Based on our experiments and analysis, RGB images
enhanced with combination of 3 edge features performed the best compared to all
others. Model performance on dataset with HED edges performed comparatively
better than other edge detectors like Canny or Prewitt.
- Abstract(参考訳): テクスチャレス物体認識は、ロボティクスとその製造分野への応用によって、コンピュータビジョンにおいて重要なタスクとなっている。
特徴の判別や反射特性の欠如により、テクスチャレスオブジェクトに対するテクスチャ物体認識技術が不十分なため、リアルタイムに精度が向上することが課題となっている。
特にTLessや他のテクスチャレスデータセットが導入されてから5年が経つと、この20年間で多くの作業が行われています。
このプロジェクトでは、画像処理技術を適用することで、初期不均衡な小さなデータセットから堅牢な拡張データセットを作成しました。
エッジ機能,機能コンビネーション,rgbイメージを抽出して,機能/機能コンビネーションを拡張して15のデータセットを作成しました。
次に、これらの15のデータセットで4つの分類器をトレーニングし、どのデータセットが全体的なパフォーマンスが最も良く、エッジ機能がテクスチャのないオブジェクトにとって重要であるかという結論に達した。
実験と解析の結果から,RGB画像は3つのエッジ特徴を組み合わせて向上し,他の画像と比較した。
HEDエッジを持つデータセットのモデルパフォーマンスは、CannyやPrewittのような他のエッジ検出よりも比較的良好だった。
関連論文リスト
- Meta 3D AssetGen: Text-to-Mesh Generation with High-Quality Geometry, Texture, and PBR Materials [58.178540282148475]
AssetGenはテキストから3D生成の大幅な進歩である。
テクスチャと素材制御を備えた忠実で高品質なメッシュを生成する。
論文 参考訳(メタデータ) (2024-07-02T17:21:47Z) - Shape2.5D: A Dataset of Texture-less Surfaces for Depth and Normals Estimation [12.757150641117077]
シェープ2.5Dは、このギャップに対処するために設計された、新しい大規模データセットである。
提案するデータセットは、3Dモデリングソフトウェアでレンダリングされた合成画像を含む。
また、深度カメラで撮影される4,672フレームからなる現実世界のサブセットも含まれている。
論文 参考訳(メタデータ) (2024-06-22T12:24:49Z) - Virtually Enriched NYU Depth V2 Dataset for Monocular Depth Estimation: Do We Need Artificial Augmentation? [61.234412062595155]
我々は、単眼深度推定のために設計された、ニューヨーク深度v2データセットの事実上拡張版であるANYUを紹介する。
仮想世界の完全な3Dシーンを利用して人工データセットを生成する、よく知られたアプローチとは対照的に、ANYUはバーチャルリアリティーオブジェクトのRGB-D表現を取り入れて作成された。
ANYUは,アーキテクチャがかなり異なるディープニューラルネットワークの単眼深度推定性能と一般化を改善したことを示す。
論文 参考訳(メタデータ) (2024-04-15T05:44:03Z) - Msmsfnet: a multi-stream and multi-scale fusion net for edge detection [6.1932429715357165]
エッジ検出は、コンピュータビジョンにおける長年の問題である。
最近のディープラーニングベースのアルゴリズムは、公開データセットで最先端のパフォーマンスを実現する。
しかし、それらのパフォーマンスは、ImageNetデータセット上のバックボーンネットワークのトレーニング済みの重みに大きく依存している。
論文 参考訳(メタデータ) (2024-04-07T08:03:42Z) - 3D Video Object Detection with Learnable Object-Centric Global
Optimization [65.68977894460222]
対応性に基づく最適化は3次元シーン再構成の基盤となるが、3次元ビデオオブジェクト検出では研究されていない。
オブジェクト中心の時間対応学習と特徴量付きオブジェクトバンドル調整を備えた、エンドツーエンドで最適化可能なオブジェクト検出器であるBA-Detを提案する。
論文 参考訳(メタデータ) (2023-03-27T17:39:39Z) - A large scale multi-view RGBD visual affordance learning dataset [4.3773754388936625]
大規模マルチビューRGBDビジュアルアプライアンス学習データセットを提案する。
これは、初めてかつ最大のマルチビューRGBDビジュアルアプライアンス学習データセットである。
いくつかの最先端のディープラーニングネットワークを,それぞれが可視性認識とセグメンテーションタスクのために評価する。
論文 参考訳(メタデータ) (2022-03-26T14:31:35Z) - Multi-sensor large-scale dataset for multi-view 3D reconstruction [63.59401680137808]
マルチビュー3次元表面再構成のための新しいマルチセンサデータセットを提案する。
スマートフォン、Intel RealSense、Microsoft Kinect、産業用カメラ、構造化光スキャナーなどだ。
14の照明条件下で100方向から取得した107の異なるシーンの約1.4万枚の画像を提供する。
論文 参考訳(メタデータ) (2022-03-11T17:32:27Z) - Towards Robustness of Neural Networks [0.0]
我々は、画像Net-A/O と ImageNet-R と、合成環境とテストスイートである CAOS を紹介した。
すべてのデータセットは、ロバストネスのテストとロバストネスの進捗測定のために作成されました。
我々は、単純なベースラインを最大ロジット、典型スコアの形式で構築するとともに、DeepAugmentの形式で新しいデータ拡張手法を作成します。
論文 参考訳(メタデータ) (2021-12-30T19:41:10Z) - Dense Extreme Inception Network for Edge Detection [0.0]
エッジ検出は多くのコンピュータビジョンアプリケーションの基礎となっている。
公開されているデータセットのほとんどは、エッジ検出タスクのためにキュレーションされていない。
エッジの新しいデータセットを提示する。
エッジ検出のためのDense Extreme Inception Network (DexiNed) と呼ばれる新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-12-04T05:38:50Z) - Contemplating real-world object classification [53.10151901863263]
Barbuらが最近提案したObjectNetデータセットを再分析した。
日常の状況に物を含むこと。
分離されたオブジェクトにディープモデルを適用すると、元の論文のようにシーン全体ではなく、約20~30%の性能改善が得られます。
論文 参考訳(メタデータ) (2021-03-08T23:29:59Z) - Refined Plane Segmentation for Cuboid-Shaped Objects by Leveraging Edge
Detection [63.942632088208505]
本稿では,セグメント化された平面マスクを画像に検出されたエッジと整列するための後処理アルゴリズムを提案する。
これにより、立方体形状の物体に制限を加えながら、最先端のアプローチの精度を高めることができます。
論文 参考訳(メタデータ) (2020-03-28T18:51:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。