論文の概要: Polyhedral Object Recognition by Indexing
- arxiv url: http://arxiv.org/abs/2311.12641v1
- Date: Tue, 21 Nov 2023 14:41:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-23 00:15:07.569738
- Title: Polyhedral Object Recognition by Indexing
- Title(参考訳): インデクシングによる多面体物体認識
- Authors: Radu Horaud and Humberto Sossa
- Abstract要約: コンピュータビジョンにおいて、インデックス化問題は、大規模なオブジェクトデータベース内のいくつかのオブジェクトを認識する問題である。
本稿では,2次元画像から3次元多面体をインデクシングにより認識する問題に対処する。
- 参考スコア(独自算出の注目度): 14.331214486430197
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In computer vision, the indexing problem is the problem of recognizing a few
objects in a large database of objects while avoiding the help of the classical
image-feature-to-object-feature matching paradigm. In this paper we address the
problem of recognizing 3-D polyhedral objects from 2-D images by indexing. Both
the objects to be recognized and the images are represented by weighted graphs.
The indexing problem is therefore the problem of determining whether a graph
extracted from the image is present or absent in a database of model graphs. We
introduce a novel method for performing this graph indexing process which is
based both on polynomial characterization of binary and weighted graphs and on
hashing. We describe in detail this polynomial characterization and then we
show how it can be used in the context of polyhedral object recognition. Next
we describe a practical recognition-by-indexing system that includes the
organization of the database, the representation of polyhedral objects in terms
of 2-D characteristic views, the representation of this views in terms of
weighted graphs, and the associated image processing. Finally, some
experimental results allow the evaluation of the system performance.
- Abstract(参考訳): コンピュータビジョンでは、インデクシング問題は、古典的なイメージ-特徴-オブジェクト-特徴マッチングパラダイムの助けを避けながら、オブジェクトの大規模なデータベース内のいくつかのオブジェクトを認識する問題である。
本稿では,2次元画像から3次元多面体をインデクシングにより認識する問題に対処する。
認識対象と画像の両方を重み付きグラフで表現する。
したがって、インデックス化問題は、モデルグラフのデータベースに画像から抽出されたグラフが存在するか否かを決定する問題である。
本稿では,二進グラフと重み付きグラフの多項式キャラクタリゼーションとハッシュ化の両方に基づいて,このグラフインデックス処理を行う新しい手法を提案する。
本稿では,この多項式の特性を詳細に記述し,多面体物体認識の文脈でどのように利用できるかを示す。
次に,データベースの整理,2次元特徴ビューによる多面体オブジェクトの表現,重み付きグラフによるこのビューの表現,および関連する画像処理を含む,実用的な認識・インデックスシステムについて述べる。
最後に、実験結果によりシステム性能の評価が可能となる。
関連論文リスト
- Composing Object Relations and Attributes for Image-Text Matching [70.47747937665987]
この研究は、シーングラフを利用して、リレーショナルエッジで相互接続されたオブジェクトや属性のノードでキャプションを表現するデュアルエンコーダ画像テキストマッチングモデルを導入する。
本モデルは,オブジェクト属性とオブジェクトオブジェクトの意味関係を効率的に符号化し,ロバストかつ高速な性能システムを実現する。
論文 参考訳(メタデータ) (2024-06-17T17:56:01Z) - SceneGraphLoc: Cross-Modal Coarse Visual Localization on 3D Scene Graphs [81.2396059480232]
SceneGraphLocはシーングラフ内の各ノード(つまりオブジェクトインスタンスを表す)に対する固定サイズの埋め込みを学習する。
画像を利用する場合、SceneGraphLocは、大規模な画像データベースに依存する最先端技術に近いパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-03-30T20:25:16Z) - DisPositioNet: Disentangled Pose and Identity in Semantic Image
Manipulation [83.51882381294357]
DisPositioNetは、シーングラフを用いた画像操作のタスクに対して、各オブジェクトのアンタングル表現を学習するモデルである。
我々のフレームワークは、グラフ内の特徴表現と同様に、変分潜在埋め込みの切り離しを可能にする。
論文 参考訳(メタデータ) (2022-11-10T11:47:37Z) - End-to-End Learning of Multi-category 3D Pose and Shape Estimation [128.881857704338]
本稿では,画像から2次元キーポイントを同時に検出し,それらを3次元に引き上げるエンド・ツー・エンド手法を提案する。
提案手法は2次元キーポイントアノテーションからのみ2次元検出と3次元リフトを学習する。
画像から3D学習へのエンドツーエンド化に加えて,1つのニューラルネットワークを用いて複数のカテゴリからのオブジェクトも処理する。
論文 参考訳(メタデータ) (2021-12-19T17:10:40Z) - Single Image 3D Object Estimation with Primitive Graph Networks [30.315124364682994]
1つの画像から3Dオブジェクトを再構成することは、視覚的シーン理解の基本的な問題である。
プリミティブに基づく3次元オブジェクト推定のための2段階グラフネットワークを提案する。
ステージワイズ戦略でグラフニューラルネットワーク全体をトレーニングし、Pix3D、ModelNet、NYU Depth V2の3つのベンチマークで評価する。
論文 参考訳(メタデータ) (2021-09-09T10:28:37Z) - Learning Spatial Context with Graph Neural Network for Multi-Person Pose
Grouping [71.59494156155309]
イメージベース多人数ポーズ推定のためのボトムアップ手法は,キーポイント検出とグループ化の2段階からなる。
本研究では,グラフ分割問題としてグループ化タスクを定式化し,グラフニューラルネットワーク(gnn)を用いて親和性行列を学習する。
学習された幾何学に基づく親和性は、強固なキーポイント結合を達成するために外観に基づく親和性とさらに融合する。
論文 参考訳(メタデータ) (2021-04-06T09:21:14Z) - Joint Deep Multi-Graph Matching and 3D Geometry Learning from
Inhomogeneous 2D Image Collections [57.60094385551773]
非均質な画像コレクションから変形可能な3Dジオメトリモデルを学ぶためのトレーニング可能なフレームワークを提案する。
さらに,2次元画像で表現された物体の3次元形状も取得する。
論文 参考訳(メタデータ) (2021-03-31T17:25:36Z) - Multi-Modal Retrieval using Graph Neural Networks [1.8911962184174562]
我々は、同じ高次元空間に埋め込まれた共同ビジョンと概念を学ぶ。
視覚と概念の関係をグラフ構造としてモデル化する。
また、選択的近傍接続に基づく新しい推論時間制御も導入する。
論文 参考訳(メタデータ) (2020-10-04T19:34:20Z) - GeoGraph: Learning graph-based multi-view object detection with
geometric cues end-to-end [10.349116753411742]
複数のビューから静的な都市オブジェクトを検出するエンド・ツー・エンドの学習可能なアプローチを提案する。
提案手法はグラフニューラルネットワーク(GNN)を用いて全ての物体を検出し,その位置を出力する。
我々のGNNは、相対的なポーズと画像の証拠を同時にモデル化し、任意の数の入力ビューを扱うことができる。
論文 参考訳(メタデータ) (2020-03-23T09:40:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。