Fugu-MT 論文翻訳(概要): Fusing Local Similarities for Retrieval-based 3D Orientation Estimation of Unseen Objects

論文の概要: Fusing Local Similarities for Retrieval-based 3D Orientation Estimation of Unseen Objects

arxiv url: http://arxiv.org/abs/2203.08472v1
Date: Wed, 16 Mar 2022 08:53:00 GMT
ステータス: 翻訳完了
システム内更新日: 2022-03-18 00:36:57.856581
Title: Fusing Local Similarities for Retrieval-based 3D Orientation Estimation of Unseen Objects
Title（参考訳）: 検索に基づく未知物体の3次元位置推定のための局所的類似性
Authors: Chen Zhao, Yinlin Hu, Mathieu Salzmann
Abstract要約: 我々は,モノクロ画像から未確認物体の3次元配向を推定する作業に取り組む。我々は検索ベースの戦略に従い、ネットワークがオブジェクト固有の特徴を学習するのを防ぐ。また,LineMOD,LineMOD-Occluded,T-LESSのデータセットを用いた実験により,本手法が従来の手法よりもはるかに優れた一般化をもたらすことが示された。
参考スコア（独自算出の注目度）: 70.49392581592089
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In this paper, we tackle the task of estimating the 3D orientation of previously-unseen objects from monocular images. This task contrasts with the one considered by most existing deep learning methods which typically assume that the testing objects have been observed during training. To handle the unseen objects, we follow a retrieval-based strategy and prevent the network from learning object-specific features by computing multi-scale local similarities between the query image and synthetically-generated reference images. We then introduce an adaptive fusion module that robustly aggregates the local similarities into a global similarity score of pairwise images. Furthermore, we speed up the retrieval process by developing a fast clustering-based retrieval strategy. Our experiments on the LineMOD, LineMOD-Occluded, and T-LESS datasets show that our method yields a significantly better generalization to unseen objects than previous works.
Abstract（参考訳）: 本稿では,モノクロ画像から未確認物体の3次元配向を推定する作業に取り組む。このタスクは、一般的にテスト対象がトレーニング中に観測されたと仮定する、既存のほとんどのディープラーニング手法で検討されているものとは対照的である。未発見のオブジェクトを扱うために,検索ベースの戦略に従い,クエリ画像と合成した参照画像との複数スケールの局所的類似性を計算することにより,ネットワークがオブジェクト固有の特徴を学習することを防止する。次に、局所的な類似性をペア画像のグローバルな類似度スコアに頑健に集約する適応融合モジュールを導入する。さらに,高速なクラスタリングに基づく検索戦略を開発し,検索プロセスを高速化する。また,LineMOD,LineMOD-Occluded,T-LESSのデータセットを用いた実験により,本手法が従来の手法よりもはるかに優れた一般化をもたらすことが示された。

関連論文リスト

Hierarchical Scoring with 3D Gaussian Splatting for Instance Image-Goal Navigation [27.040017548286812]
インスタンスイメージゴールナビゲーション(IIN)では、任意の視点から捉えた参照画像に描かれた対象物や場所を特定し、ナビゲートする必要がある。ターゲットマッチングのための最適視点を推定する階層的スコアリングパラダイムを備えた新しいIINフレームワークを提案する。
論文参考訳（メタデータ） (2025-06-09T00:58:14Z)
BOOTPLACE: Bootstrapped Object Placement with Detection Transformers [23.300369070771836]
本稿では,オブジェクト配置を位置検出問題として定式化する新しいパラダイムであるBOOTPLACEを紹介する。確立されたベンチマークの実験結果は、BOOTPLACEのオブジェクト再配置における優れた性能を示している。
論文参考訳（メタデータ） (2025-03-27T21:21:20Z)
Generalizable Single-view Object Pose Estimation by Two-side Generating and Matching [19.730504197461144]
本稿では,RGB画像のみを用いてオブジェクトのポーズを決定するために,新しい一般化可能なオブジェクトポーズ推定手法を提案する。本手法は,オブジェクトの参照画像1枚で操作し,3次元オブジェクトモデルやオブジェクトの複数ビューの必要性を解消する。
論文参考訳（メタデータ） (2024-11-24T14:31:50Z)
A Modern Take on Visual Relationship Reasoning for Grasp Planning [10.543168383800532]
本稿では,視覚的リレーショナル推論による把握計画を提案する。 D3GDは、97の異なるカテゴリから最大35のオブジェクトを持つビンピックシーンを含む、新しいテストベッドである。また、新しいエンドツーエンドのトランスフォーマーベースの依存性グラフ生成モデルであるD3Gを提案する。
論文参考訳（メタデータ） (2024-09-03T16:30:48Z)
Mismatched: Evaluating the Limits of Image Matching Approaches and Benchmarks [9.388897214344572]
2次元画像からの3次元3次元再構成はコンピュータビジョンにおける活発な研究分野である。伝統的にこの作業にはパラメトリック技術が用いられてきた。近年の進歩は、学習ベースの方法にシフトしている。
論文参考訳（メタデータ） (2024-08-29T11:16:34Z)
Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文参考訳（メタデータ） (2023-07-07T04:03:48Z)
Variable Radiance Field for Real-Life Category-Specifc Reconstruction from Single Image [27.290232027686237]
本稿では,カメラパラメータが未知の単一画像からカテゴリ固有のオブジェクトを再構成できる新しいフレームワークを提案する。マルチスケールグローバル特徴抽出器を用いてオブジェクトの形状と外観をパラメータ化する。また,特徴抽出器の改良のために,コントラスト学習に基づく事前学習戦略を提案する。
論文参考訳（メタデータ） (2023-06-08T12:12:02Z)
Learning-based Relational Object Matching Across Views [63.63338392484501]
本稿では,RGB画像間のオブジェクト検出をマッチングするための,局所キーポイントと新たなオブジェクトレベルの特徴を組み合わせた学習ベースアプローチを提案する。我々は、連想グラフニューラルネットワークにおいて、オブジェクト間の外観とフレーム間およびフレーム間空間関係に基づいて、オブジェクトレベルのマッチング機能を訓練する。
論文参考訳（メタデータ） (2023-05-03T19:36:51Z)
De-coupling and De-positioning Dense Self-supervised Learning [65.56679416475943]
Dense Self-Supervised Learning (SSL)メソッドは、複数のオブジェクトでイメージを処理する際に、画像レベルの特徴表現を使用する際の制限に対処する。本研究は, 層深度やゼロパディングに伴う受容野の増大によって生じる, 結合と位置バイアスに悩まされていることを示す。我々はCOCOにおける本手法の利点と、オブジェクト分類、セマンティックセグメンテーション、オブジェクト検出のための新しい挑戦的ベンチマークであるOpenImage-MINIについて示す。
論文参考訳（メタデータ） (2023-03-29T18:07:25Z)
DETR4D: Direct Multi-View 3D Object Detection with Sparse Attention [50.11672196146829]
サラウンドビュー画像を用いた3次元物体検出は、自動運転にとって必須の課題である。マルチビュー画像における3次元オブジェクト検出のためのスパースアテンションと直接特徴クエリを探索するトランスフォーマーベースのフレームワークであるDETR4Dを提案する。
論文参考訳（メタデータ） (2022-12-15T14:18:47Z)
Object-aware Contrastive Learning for Debiased Scene Representation [74.30741492814327]
オブジェクトを自己教師型でローカライズする,オブジェクト認識型コントラスト学習フレームワークを開発した。また、コントラCAM、オブジェクト認識型乱作、背景混合に基づく2つのデータ拡張を導入し、コントラスト型自己教師型学習における文脈バイアスと背景バイアスを低減した。
論文参考訳（メタデータ） (2021-07-30T19:24:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。