論文の概要: Non-planar Object Detection and Identification by Features Matching and Triangulation Growth
- arxiv url: http://arxiv.org/abs/2506.13769v1
- Date: Mon, 19 May 2025 06:20:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-22 23:32:14.640586
- Title: Non-planar Object Detection and Identification by Features Matching and Triangulation Growth
- Title(参考訳): 特徴マッチングと三角成長による非平面物体の検出と同定
- Authors: Filippo Leveni,
- Abstract要約: シーン画像中のテンプレートの歪みを検知し,識別するための特徴に基づく手法を提案する。
テンプレート機能のDlaunay三角測量は,このアプローチでガイドすべき有用なツールだと考えている。
我々の解は、幾何学的モデル(例えばホモグラフィー)が持たない状況における対象の同定を可能にする。
- 参考スコア(独自算出の注目度): 1.450405446885067
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Object detection and identification is surely a fundamental topic in the computer vision field; it plays a crucial role in many applications such as object tracking, industrial robots control, image retrieval, etc. We propose a feature-based approach for detecting and identifying distorted occurrences of a given template in a scene image by incremental grouping of feature matches between the image and the template. For this purpose, we consider the Delaunay triangulation of template features as an useful tool through which to be guided in this iterative approach. The triangulation is treated as a graph and, starting from a single triangle, neighboring nodes are considered and the corresponding features are identified; then matches related to them are evaluated to determine if they are worthy to be grouped. This evaluation is based on local consistency criteria derived from geometric and photometric properties of local features. Our solution allows the identification of the object in situations where geometric models (e.g. homography) does not hold, thus enable the detection of objects such that the template is non planar or when it is planar but appears distorted in the image. We show that our approach performs just as well or better than application of homography-based RANSAC in scenarios in which distortion is nearly absent, while when the deformation becomes relevant our method shows better description performance.
- Abstract(参考訳): 物体検出と識別は、コンピュータビジョン分野における基本的なトピックであり、物体追跡、産業ロボット制御、画像検索など、多くのアプリケーションにおいて重要な役割を果たす。
本稿では,画像とテンプレート間の特徴マッチングを漸進的にグループ化することで,シーン画像中のテンプレートの歪み発生を検出し,識別するための特徴ベースアプローチを提案する。
この目的のために、テンプレート機能のデラウネー三角測量を、この反復的アプローチでガイドすべき有用なツールとして検討する。
三角測量はグラフとして扱われ、1つの三角形から、隣接するノードを考慮し、対応する特徴を識別し、それらに関連するマッチングを評価して、それらがグループ化に値するかどうかを判断する。
この評価は局所的特徴の幾何学的および測光的特性から導かれる局所的整合性基準に基づく。
我々のソリューションは、幾何学的モデル(例えばホモグラフィー)が保持されない状況において物体の識別を可能にし、テンプレートが平面でない場合や、平面である場合や画像に歪んだように見える場合などの物体の検出を可能にする。
提案手法は, 歪みがほとんどない場合のシナリオにおいて, ホモグラフィに基づくRANSACの適用と同等かそれ以上の性能を示す一方, 変形が関係する場合には, より優れた記述性能を示す。
関連論文リスト
- Mismatched: Evaluating the Limits of Image Matching Approaches and Benchmarks [9.388897214344572]
2次元画像からの3次元3次元再構成はコンピュータビジョンにおける活発な研究分野である。
伝統的にこの作業にはパラメトリック技術が用いられてきた。
近年の進歩は、学習ベースの方法にシフトしている。
論文 参考訳(メタデータ) (2024-08-29T11:16:34Z) - ZeroReg: Zero-Shot Point Cloud Registration with Foundation Models [77.84408427496025]
最先端の3Dポイントクラウド登録方法は、トレーニングのためにラベル付き3Dデータセットに依存している。
我々は2次元基礎モデルを用いて3次元対応を予測するゼロショット登録手法であるZeroRegを紹介する。
論文 参考訳(メタデータ) (2023-12-05T11:33:16Z) - Adaptive Graph Convolution Module for Salient Object Detection [7.278033100480174]
本稿では,複雑なシーンを扱うための適応型グラフ畳み込みモジュール(AGCM)を提案する。
学習可能な領域生成層を用いて入力画像からプロトタイプ特徴を抽出する。
提案したAGCMは,SOD性能を定量的かつ定量的に劇的に向上させる。
論文 参考訳(メタデータ) (2023-03-17T07:07:17Z) - DisPositioNet: Disentangled Pose and Identity in Semantic Image
Manipulation [83.51882381294357]
DisPositioNetは、シーングラフを用いた画像操作のタスクに対して、各オブジェクトのアンタングル表現を学習するモデルである。
我々のフレームワークは、グラフ内の特徴表現と同様に、変分潜在埋め込みの切り離しを可能にする。
論文 参考訳(メタデータ) (2022-11-10T11:47:37Z) - LEAD: Self-Supervised Landmark Estimation by Aligning Distributions of
Feature Similarity [49.84167231111667]
自己監督型ランドマーク検出における既存の研究は、画像から高密度(ピクセルレベルの)特徴表現を学習することに基づいている。
自己教師付き方式で高密度同変表現の学習を強化するアプローチを提案する。
機能抽出器にそのような先行性があることは,アノテーションの数が大幅に制限されている場合でも,ランドマーク検出に役立ちます。
論文 参考訳(メタデータ) (2022-04-06T17:48:18Z) - Fusing Local Similarities for Retrieval-based 3D Orientation Estimation
of Unseen Objects [70.49392581592089]
我々は,モノクロ画像から未確認物体の3次元配向を推定する作業に取り組む。
我々は検索ベースの戦略に従い、ネットワークがオブジェクト固有の特徴を学習するのを防ぐ。
また,LineMOD,LineMOD-Occluded,T-LESSのデータセットを用いた実験により,本手法が従来の手法よりもはるかに優れた一般化をもたらすことが示された。
論文 参考訳(メタデータ) (2022-03-16T08:53:00Z) - Leveraging Unsupervised Image Registration for Discovery of Landmark
Shape Descriptor [5.40076482533193]
本稿では,画像からランドマークを発見するための自己教師型深層学習手法を提案する。
我々は、ランドマーク駆動のイメージ登録を主要なタスクとして使用し、ニューラルネットワークにイメージを適切に登録するランドマークを見つけるように強制する。
提案手法は分割と前処理を回避し、2D画像や3D画像のみを用いて使用可能な形状記述子を直接生成する。
論文 参考訳(メタデータ) (2021-11-13T01:02:10Z) - Unsupervised Domain Adaption of Object Detectors: A Survey [87.08473838767235]
近年のディープラーニングの進歩は、様々なコンピュータビジョンアプリケーションのための正確で効率的なモデルの開発につながっている。
高度に正確なモデルを学ぶには、大量の注釈付きイメージを持つデータセットの可用性に依存する。
このため、ラベルスカースデータセットに視覚的に異なる画像がある場合、モデルの性能は大幅に低下する。
論文 参考訳(メタデータ) (2021-05-27T23:34:06Z) - Localization and Mapping using Instance-specific Mesh Models [12.235379548921061]
本論文では,モノラルカメラを用いて,物体のポーズや形状を含むセマンティックマップの構築に焦点を当てる。
私たちの貢献は,カメラ画像から抽出した意味情報に基づいてオンラインに最適化可能な,オブジェクト形状のインスタンス固有メッシュモデルである。
論文 参考訳(メタデータ) (2021-03-08T00:24:23Z) - Slender Object Detection: Diagnoses and Improvements [74.40792217534]
本稿では,超高アスペクト比,すなわちtextbfslender オブジェクトの特定タイプの検出について検討する。
古典的物体検出法では、細い物体に対してのみ評価される場合、COCO上の18.9%のmAPの劇的な低下が観察される。
論文 参考訳(メタデータ) (2020-11-17T09:39:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。