論文の概要: Investigating the Importance of Shape Features, Color Constancy, Color
Spaces and Similarity Measures in Open-Ended 3D Object Recognition
- arxiv url: http://arxiv.org/abs/2002.03779v2
- Date: Sat, 26 Sep 2020 12:18:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-02 09:27:53.654214
- Title: Investigating the Importance of Shape Features, Color Constancy, Color
Spaces and Similarity Measures in Open-Ended 3D Object Recognition
- Title(参考訳): オープンエンド3次元物体認識における形状特徴, 色濃度, 色空間, 類似度尺度の重要性の検討
- Authors: S. Hamidreza Kasaei, Maryam Ghorbani, Jits Schilperoort, Wessel van
der Rest
- Abstract要約: オープンエンド3次元物体認識における形状情報,色濃度,色空間,および様々な類似度尺度の重要性について検討した。
実験結果から, 色と形状のテクスタイピングは, テクスタイピングのみのアプローチ, テクスタイピングのみのアプローチよりも大幅に改善されていることが明らかとなった。
- 参考スコア(独自算出の注目度): 4.437005770487858
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite the recent success of state-of-the-art 3D object recognition
approaches, service robots are frequently failed to recognize many objects in
real human-centric environments. For these robots, object recognition is a
challenging task due to the high demand for accurate and real-time response
under changing and unpredictable environmental conditions. Most of the recent
approaches use either the shape information only and ignore the role of color
information or vice versa. Furthermore, they mainly utilize the $L_n$ Minkowski
family functions to measure the similarity of two object views, while there are
various distance measures that are applicable to compare two object views. In
this paper, we explore the importance of shape information, color constancy,
color spaces, and various similarity measures in open-ended 3D object
recognition. Towards this goal, we extensively evaluate the performance of
object recognition approaches in three different configurations, including
\textit{color-only}, \textit{shape-only}, and \textit{ combinations of color
and shape}, in both offline and online settings. Experimental results
concerning scalability, memory usage, and object recognition performance show
that all of the \textit{combinations of color and shape} yields significant
improvements over the \textit{shape-only} and \textit{color-only} approaches.
The underlying reason is that color information is an important feature to
distinguish objects that have very similar geometric properties with different
colors and vice versa. Moreover, by combining color and shape information, we
demonstrate that the robot can learn new object categories from very few
training examples in a real-world setting.
- Abstract(参考訳): 最近の最先端の3Dオブジェクト認識アプローチの成功にもかかわらず、サービスロボットは実際の人間中心の環境で多くのオブジェクトを認識できないことが多い。
これらのロボットにとって、オブジェクト認識は、変化や予測不能な環境下での正確かつリアルタイムな応答の要求が高いため、難しい課題である。
最近のアプローチのほとんどは、形状情報のみを使用し、色情報の役割を無視するか、その逆を使う。
さらに、主に2つのオブジェクトビューの類似度を測定するために$l_n$ minkowskiファミリー関数を使用し、2つのオブジェクトビューを比較するのに適用できる様々な距離測度がある。
本稿では, 3次元物体認識における形状情報, 色構成, 色空間, 様々な類似性尺度の重要性について検討する。
この目標に向けて、オフラインおよびオンライン両方の設定において、オブジェクト認識アプローチの性能を、 \textit{color-only} 、 \textit{shape-only} 、 \textit{ combinations of color and shape} の3つの異なる設定で広範囲に評価する。
スケーラビリティ、メモリ使用量、オブジェクト認識性能に関する実験結果から、 \textit{combination of color and shape} は \textit{shape-only} および \textit{color-only} アプローチよりも大幅に改善されている。
基本となる理由は、色情報は異なる色を持つ非常に類似した幾何学的性質を持つオブジェクトを識別するための重要な特徴である。
さらに,色情報と形状情報を組み合わせることで,ロボットが実環境において,非常に少ない訓練例から新たな対象カテゴリを学習できることを実証する。
関連論文リスト
- Chat-3D v2: Bridging 3D Scene and Large Language Models with Object
Identifiers [62.232809030044116]
会話中にオブジェクトを自由に参照するためにオブジェクト識別子を導入する。
本稿では,属性認識トークンと関係認識トークンを各オブジェクトに対して学習する2段階アライメント手法を提案する。
ScanQA、ScanRefer、Nr3D/Sr3Dといった従来のデータセットで行った実験は、提案手法の有効性を示した。
論文 参考訳(メタデータ) (2023-12-13T14:27:45Z) - Are These the Same Apple? Comparing Images Based on Object Intrinsics [27.43687450076182]
オブジェクトの同一性を定義する固有のオブジェクトプロパティに基づいて、純粋に画像の類似性を測定する。
この問題はコンピュータビジョン文学において再同定として研究されている。
そこで本研究では,オブジェクト固有性に基づく画像類似度尺度を探索し,一般対象カテゴリに拡張することを提案する。
論文 参考訳(メタデータ) (2023-11-01T18:00:03Z) - Learning-based Relational Object Matching Across Views [63.63338392484501]
本稿では,RGB画像間のオブジェクト検出をマッチングするための,局所キーポイントと新たなオブジェクトレベルの特徴を組み合わせた学習ベースアプローチを提案する。
我々は、連想グラフニューラルネットワークにおいて、オブジェクト間の外観とフレーム間およびフレーム間空間関係に基づいて、オブジェクトレベルのマッチング機能を訓練する。
論文 参考訳(メタデータ) (2023-05-03T19:36:51Z) - On Human Visual Contrast Sensitivity and Machine Vision Robustness: A
Comparative Study [68.41864523774164]
色の違いがマシンビジョンにどのように影響するかは、まだよく研究されていない。
我々の研究は、視覚認識の人間の色覚と機械の色覚のギャップを埋めようとしている。
カラーコントラストと劣化画像の効果を広範囲に解析するために,新しい枠組みを2次元で考案した。
論文 参考訳(メタデータ) (2022-12-16T18:51:41Z) - Lifelong Ensemble Learning based on Multiple Representations for
Few-Shot Object Recognition [6.282068591820947]
本稿では,複数表現に基づく一生涯のアンサンブル学習手法を提案する。
生涯学習を容易にするため、各アプローチは、オブジェクト情報を即座に保存して検索するメモリユニットを備える。
提案手法の有効性を,オフラインおよびオープンエンドシナリオで評価するために,幅広い実験を行った。
論文 参考訳(メタデータ) (2022-05-04T10:29:10Z) - Contrastive Object Detection Using Knowledge Graph Embeddings [72.17159795485915]
一つのホットアプローチで学習したクラス埋め込みの誤差統計と、自然言語処理や知識グラフから意味的に構造化された埋め込みを比較した。
本稿では,キーポイントベースおよびトランスフォーマーベースオブジェクト検出アーキテクチャの知識埋め込み設計を提案する。
論文 参考訳(メタデータ) (2021-12-21T17:10:21Z) - ObjectFolder: A Dataset of Objects with Implicit Visual, Auditory, and
Tactile Representations [52.226947570070784]
両課題に対処する100のオブジェクトからなるデータセットであるObjectを,2つの重要なイノベーションで紹介する。
まず、オブジェクトは視覚的、聴覚的、触覚的なすべてのオブジェクトの知覚データをエンコードし、多数の多感覚オブジェクト認識タスクを可能にする。
第2に、Objectは統一されたオブジェクト中心のシミュレーションと、各オブジェクトの視覚的テクスチャ、触覚的読み出し、触覚的読み出しに暗黙的な表現を採用しており、データセットの使用が柔軟で共有が容易である。
論文 参考訳(メタデータ) (2021-09-16T14:00:59Z) - Simultaneous Multi-View Object Recognition and Grasping in Open-Ended
Domains [0.0]
オープンなオブジェクト認識と把握を同時に行うために,メモリ容量を増強したディープラーニングアーキテクチャを提案する。
シミュレーションと実世界設定の両方において,本手法が未確認のオブジェクトを把握し,現場でのごくわずかな例を用いて,新たなオブジェクトカテゴリを迅速に学習できることを実証する。
論文 参考訳(メタデータ) (2021-06-03T14:12:11Z) - Open-Ended Fine-Grained 3D Object Categorization by Combining Shape and
Texture Features in Multiple Colorspaces [5.89118432388542]
本研究では, 形状情報はすべてのカテゴリの共通パターンを符号化し, テクスチャ情報を用いて各インスタンスの外観を詳細に記述する。
提案したネットワークアーキテクチャは、オブジェクト分類の精度とスケーラビリティの観点から、選択した最先端のアプローチよりも優れていた。
論文 参考訳(メタデータ) (2020-09-19T14:06:18Z) - Instance-aware Image Colorization [51.12040118366072]
本稿では,インスタンス認識のカラー化を実現する手法を提案する。
我々のネットワークアーキテクチャは、市販のオブジェクト検出器を利用して、収穫されたオブジェクト画像を取得する。
類似したネットワークを用いて、フルイメージの特徴を抽出し、融合モジュールを適用して最終色を予測する。
論文 参考訳(メタデータ) (2020-05-21T17:59:23Z) - Variable-Viewpoint Representations for 3D Object Recognition [27.913222855275997]
共通表現連続体の2つの極端に2種類の入力表現が存在することを示す。
この2つの極点の間の点にある興味深い中間表現を同定する。
系統的な経験実験を通して、入力情報の関数としてこの連続体に沿って精度がどのように変化するかを示す。
論文 参考訳(メタデータ) (2020-02-08T10:06:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。