論文の概要: Investigating the Importance of Shape Features, Color Constancy, Color
Spaces and Similarity Measures in Open-Ended 3D Object Recognition
- arxiv url: http://arxiv.org/abs/2002.03779v2
- Date: Sat, 26 Sep 2020 12:18:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-02 09:27:53.654214
- Title: Investigating the Importance of Shape Features, Color Constancy, Color
Spaces and Similarity Measures in Open-Ended 3D Object Recognition
- Title(参考訳): オープンエンド3次元物体認識における形状特徴, 色濃度, 色空間, 類似度尺度の重要性の検討
- Authors: S. Hamidreza Kasaei, Maryam Ghorbani, Jits Schilperoort, Wessel van
der Rest
- Abstract要約: オープンエンド3次元物体認識における形状情報,色濃度,色空間,および様々な類似度尺度の重要性について検討した。
実験結果から, 色と形状のテクスタイピングは, テクスタイピングのみのアプローチ, テクスタイピングのみのアプローチよりも大幅に改善されていることが明らかとなった。
- 参考スコア(独自算出の注目度): 4.437005770487858
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite the recent success of state-of-the-art 3D object recognition
approaches, service robots are frequently failed to recognize many objects in
real human-centric environments. For these robots, object recognition is a
challenging task due to the high demand for accurate and real-time response
under changing and unpredictable environmental conditions. Most of the recent
approaches use either the shape information only and ignore the role of color
information or vice versa. Furthermore, they mainly utilize the $L_n$ Minkowski
family functions to measure the similarity of two object views, while there are
various distance measures that are applicable to compare two object views. In
this paper, we explore the importance of shape information, color constancy,
color spaces, and various similarity measures in open-ended 3D object
recognition. Towards this goal, we extensively evaluate the performance of
object recognition approaches in three different configurations, including
\textit{color-only}, \textit{shape-only}, and \textit{ combinations of color
and shape}, in both offline and online settings. Experimental results
concerning scalability, memory usage, and object recognition performance show
that all of the \textit{combinations of color and shape} yields significant
improvements over the \textit{shape-only} and \textit{color-only} approaches.
The underlying reason is that color information is an important feature to
distinguish objects that have very similar geometric properties with different
colors and vice versa. Moreover, by combining color and shape information, we
demonstrate that the robot can learn new object categories from very few
training examples in a real-world setting.
- Abstract(参考訳): 最近の最先端の3Dオブジェクト認識アプローチの成功にもかかわらず、サービスロボットは実際の人間中心の環境で多くのオブジェクトを認識できないことが多い。
これらのロボットにとって、オブジェクト認識は、変化や予測不能な環境下での正確かつリアルタイムな応答の要求が高いため、難しい課題である。
最近のアプローチのほとんどは、形状情報のみを使用し、色情報の役割を無視するか、その逆を使う。
さらに、主に2つのオブジェクトビューの類似度を測定するために$l_n$ minkowskiファミリー関数を使用し、2つのオブジェクトビューを比較するのに適用できる様々な距離測度がある。
本稿では, 3次元物体認識における形状情報, 色構成, 色空間, 様々な類似性尺度の重要性について検討する。
この目標に向けて、オフラインおよびオンライン両方の設定において、オブジェクト認識アプローチの性能を、 \textit{color-only} 、 \textit{shape-only} 、 \textit{ combinations of color and shape} の3つの異なる設定で広範囲に評価する。
スケーラビリティ、メモリ使用量、オブジェクト認識性能に関する実験結果から、 \textit{combination of color and shape} は \textit{shape-only} および \textit{color-only} アプローチよりも大幅に改善されている。
基本となる理由は、色情報は異なる色を持つ非常に類似した幾何学的性質を持つオブジェクトを識別するための重要な特徴である。
さらに,色情報と形状情報を組み合わせることで,ロボットが実環境において,非常に少ない訓練例から新たな対象カテゴリを学習できることを実証する。
関連論文リスト
- THOR2: Leveraging Topological Soft Clustering of Color Space for Human-Inspired Object Recognition in Unseen Environments [1.9950682531209158]
本研究では,RGB-D画像から生成された点群に対する3次元形状と色に基づく記述子TOPS2と,それに付随する認識フレームワークTHOR2を提案する。
TOPS2ディスクリプタは、TOPSディスクリプタから3D形状のスライシングに基づくトポロジカル表現を保持することにより、人間の認知機構であるオブジェクト単位を具現化する。
合成データを用いてトレーニングされたTHOR2は、3D形状をベースとしたTHORに比べて認識精度が著しく向上した。
論文 参考訳(メタデータ) (2024-08-02T21:24:14Z) - Learning-based Relational Object Matching Across Views [63.63338392484501]
本稿では,RGB画像間のオブジェクト検出をマッチングするための,局所キーポイントと新たなオブジェクトレベルの特徴を組み合わせた学習ベースアプローチを提案する。
我々は、連想グラフニューラルネットワークにおいて、オブジェクト間の外観とフレーム間およびフレーム間空間関係に基づいて、オブジェクトレベルのマッチング機能を訓練する。
論文 参考訳(メタデータ) (2023-05-03T19:36:51Z) - ColorSense: A Study on Color Vision in Machine Visual Recognition [57.916512479603064]
視覚認識ベンチマークから,前景や背景色ラベルの非自明なアノテーション110,000点を収集する。
色識別のレベルがマシン認識モデルの性能に与える影響を実証することにより、データセットの使用を検証した。
その結果,分類や局所化などの物体認識タスクは,色覚バイアスの影響を受けやすいことが示唆された。
論文 参考訳(メタデータ) (2022-12-16T18:51:41Z) - Lifelong Ensemble Learning based on Multiple Representations for
Few-Shot Object Recognition [6.282068591820947]
本稿では,複数表現に基づく一生涯のアンサンブル学習手法を提案する。
生涯学習を容易にするため、各アプローチは、オブジェクト情報を即座に保存して検索するメモリユニットを備える。
提案手法の有効性を,オフラインおよびオープンエンドシナリオで評価するために,幅広い実験を行った。
論文 参考訳(メタデータ) (2022-05-04T10:29:10Z) - Contrastive Object Detection Using Knowledge Graph Embeddings [72.17159795485915]
一つのホットアプローチで学習したクラス埋め込みの誤差統計と、自然言語処理や知識グラフから意味的に構造化された埋め込みを比較した。
本稿では,キーポイントベースおよびトランスフォーマーベースオブジェクト検出アーキテクチャの知識埋め込み設計を提案する。
論文 参考訳(メタデータ) (2021-12-21T17:10:21Z) - ObjectFolder: A Dataset of Objects with Implicit Visual, Auditory, and
Tactile Representations [52.226947570070784]
両課題に対処する100のオブジェクトからなるデータセットであるObjectを,2つの重要なイノベーションで紹介する。
まず、オブジェクトは視覚的、聴覚的、触覚的なすべてのオブジェクトの知覚データをエンコードし、多数の多感覚オブジェクト認識タスクを可能にする。
第2に、Objectは統一されたオブジェクト中心のシミュレーションと、各オブジェクトの視覚的テクスチャ、触覚的読み出し、触覚的読み出しに暗黙的な表現を採用しており、データセットの使用が柔軟で共有が容易である。
論文 参考訳(メタデータ) (2021-09-16T14:00:59Z) - Simultaneous Multi-View Object Recognition and Grasping in Open-Ended
Domains [0.0]
オープンなオブジェクト認識と把握を同時に行うために,メモリ容量を増強したディープラーニングアーキテクチャを提案する。
シミュレーションと実世界設定の両方において,本手法が未確認のオブジェクトを把握し,現場でのごくわずかな例を用いて,新たなオブジェクトカテゴリを迅速に学習できることを実証する。
論文 参考訳(メタデータ) (2021-06-03T14:12:11Z) - Open-Ended Fine-Grained 3D Object Categorization by Combining Shape and
Texture Features in Multiple Colorspaces [5.89118432388542]
本研究では, 形状情報はすべてのカテゴリの共通パターンを符号化し, テクスチャ情報を用いて各インスタンスの外観を詳細に記述する。
提案したネットワークアーキテクチャは、オブジェクト分類の精度とスケーラビリティの観点から、選択した最先端のアプローチよりも優れていた。
論文 参考訳(メタデータ) (2020-09-19T14:06:18Z) - Mask2CAD: 3D Shape Prediction by Learning to Segment and Retrieve [54.054575408582565]
本稿では,既存の3次元モデルの大規模データセットを活用し,画像中の物体の3次元構造を理解することを提案する。
本稿では,実世界の画像と検出対象を共同で検出するMask2CADについて,最も類似したCADモデルとそのポーズを最適化する。
これにより、画像内のオブジェクトのクリーンで軽量な表現が生成される。
論文 参考訳(メタデータ) (2020-07-26T00:08:37Z) - Instance-aware Image Colorization [51.12040118366072]
本稿では,インスタンス認識のカラー化を実現する手法を提案する。
我々のネットワークアーキテクチャは、市販のオブジェクト検出器を利用して、収穫されたオブジェクト画像を取得する。
類似したネットワークを用いて、フルイメージの特徴を抽出し、融合モジュールを適用して最終色を予測する。
論文 参考訳(メタデータ) (2020-05-21T17:59:23Z) - Variable-Viewpoint Representations for 3D Object Recognition [27.913222855275997]
共通表現連続体の2つの極端に2種類の入力表現が存在することを示す。
この2つの極点の間の点にある興味深い中間表現を同定する。
系統的な経験実験を通して、入力情報の関数としてこの連続体に沿って精度がどのように変化するかを示す。
論文 参考訳(メタデータ) (2020-02-08T10:06:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。