論文の概要: RSD-DOG : A New Image Descriptor based on Second Order Derivatives
- arxiv url: http://arxiv.org/abs/2408.07687v1
- Date: Wed, 14 Aug 2024 17:41:45 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-15 12:33:27.416814
- Title: RSD-DOG : A New Image Descriptor based on Second Order Derivatives
- Title(参考訳): RSD-DOG : 2次微分に基づく新しい画像記述子
- Authors: Darshan Venkatrayappa, Philippe Montesinos, Daniel Diep, Baptiste Magnier,
- Abstract要約: 本稿では,2次画像統計・導出に基づく画像パッチ記述子について紹介する。
検討された3次元表面は、尾根、谷、崖などの2階目の特徴・統計が豊富である。
得られた記述子は、照明、スケール、回転、ぼかし、視点、圧縮のバリエーションを扱う際に優れた識別力を示す。
- 参考スコア(独自算出の注目度): 2.174919458782602
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper introduces the new and powerful image patch descriptor based on second order image statistics/derivatives. Here, the image patch is treated as a 3D surface with intensity being the 3rd dimension. The considered 3D surface has a rich set of second order features/statistics such as ridges, valleys, cliffs and so on, that can be easily captured by using the difference of rotating semi Gaussian filters. The originality of this method is based on successfully combining the response of the directional filters with that of the Difference of Gaussian (DOG) approach. The obtained descriptor shows a good discriminative power when dealing with the variations in illumination, scale, rotation, blur, viewpoint and compression. The experiments on image matching, demonstrates the advantage of the obtained descriptor when compared to its first order counterparts such as SIFT, DAISY, GLOH, GIST and LIDRIC.
- Abstract(参考訳): 本稿では,2次画像統計・導出に基づく画像パッチ記述子について紹介する。
ここで、画像パッチを3次元の強度を有する3次元表面として処理する。
検討された3次元表面は、隆起、谷、崖などの2次の特徴・統計が豊富であり、回転する半ガウスフィルタの差を利用して容易に捉えることができる。
この手法の独創性は、指向性フィルタの応答とガウス差分法(DOG)アプローチの応答をうまく組み合わせることに基づいている。
得られた記述子は、照明、スケール、回転、ぼかし、視点、圧縮のバリエーションを扱う際に優れた識別力を示す。
画像マッチング実験は、SIFT, DAISY, GLOH, GIST, LIDRICなどの第1次記述子と比較して、得られた記述子の利点を示す。
関連論文リスト
- Towards Human-Level 3D Relative Pose Estimation: Generalizable, Training-Free, with Single Reference [62.99706119370521]
人間は、単一のクエリ参照イメージペアのみを与えられたラベル/トレーニングなしで、目に見えないオブジェクトの相対的なポーズを容易に推論することができる。
そこで,本研究では,RGB-D参照から2.5D形状のRGB-D参照,オフザシェルフ微分可能なRGB-D参照,DINOv2のような事前学習モデルからのセマンティックキューを用いた3D一般化可能な相対ポーズ推定手法を提案する。
論文 参考訳(メタデータ) (2024-06-26T16:01:10Z) - NeRFDeformer: NeRF Transformation from a Single View via 3D Scene Flows [60.291277312569285]
本研究では,単一観測値に基づいてNeRF表現を自動的に修正する手法を提案する。
本手法は, 変形を3次元流れ, 特に剛性変換の重み付き線形ブレンディングとして定義する。
また,単一観測によるNeRFシーンの修正問題を探索するための新しいデータセットも導入した。
論文 参考訳(メタデータ) (2024-06-15T07:58:08Z) - TP3M: Transformer-based Pseudo 3D Image Matching with Reference Image [0.9831489366502301]
トランスフォーマーを用いた擬似3次元画像マッチング手法を提案する。
ソース画像から抽出した2D特徴を参照画像の助けを借りて3D特徴にアップグレードし、目的地画像から抽出した2D特徴にマッチする。
複数のデータセットに対する実験結果から, 提案手法は, ホモグラフィ推定, ポーズ推定, 視覚的ローカライゼーションのタスクにおいて, 最先端の課題を達成できることが示唆された。
論文 参考訳(メタデータ) (2024-05-14T08:56:09Z) - GIR: 3D Gaussian Inverse Rendering for Relightable Scene Factorization [62.13932669494098]
本稿では,3次元ガウス表現を用いた3次元ガウス逆レンダリング(GIR)手法を提案する。
最短固有ベクトルを用いて各3次元ガウスの正規性を計算する。
我々は3次元ガウシアン毎に方向対応の放射光を格納し、多重バウンス光輸送を近似するために二次照明をアンタングルするために、効率的なボクセルベースの間接照明追跡方式を採用する。
論文 参考訳(メタデータ) (2023-12-08T16:05:15Z) - Registering Image Volumes using 3D SIFT and Discrete SP-Symmetry [2.1829116024916844]
-1,+1$ のバイナリ特徴符号 $s は、ラプラシア作用素 $nabla2$ の符号として定義される。
3Dパリティ変換は$(x,y,z)rightarrow(-x,-y,-z)$ transforms $(x,y,z)rightarrow(-x,-y,-z)$、すなわちSP-不変あるいはSP-対称である。
論文 参考訳(メタデータ) (2022-05-30T22:57:55Z) - Extreme Rotation Estimation using Dense Correlation Volumes [73.35119461422153]
本稿では,RGB画像対の相対的な3次元回転を極端に推定する手法を提案する。
画像が重なり合わなくても、それらの幾何学的関係に関して豊富な隠れた手がかりがあるかもしれないと観察する。
本稿では,2つの入力画像間の全ての点を比較することで,そのような暗黙の手がかりを自動的に学習できるネットワーク設計を提案する。
論文 参考訳(メタデータ) (2021-04-28T02:00:04Z) - Geometric Correspondence Fields: Learned Differentiable Rendering for 3D
Pose Refinement in the Wild [96.09941542587865]
野生の任意のカテゴリのオブジェクトに対する微分可能レンダリングに基づく新しい3次元ポーズ精細化手法を提案する。
このようにして、3DモデルとRGB画像のオブジェクトを正確に整列し、3Dポーズ推定を大幅に改善する。
我々は、Pix3Dデータセットの挑戦に対するアプローチを評価し、複数のメトリクスにおける最先端の精錬手法と比較して、最大55%の改善を実現した。
論文 参考訳(メタデータ) (2020-07-17T12:34:38Z) - Coarse-to-Fine Gaze Redirection with Numerical and Pictorial Guidance [74.27389895574422]
本稿では,数値誘導と画像誘導の両方を利用した新しい視線リダイレクトフレームワークを提案する。
提案手法は,画像品質とリダイレクト精度の両方の観点から,最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2020-04-07T01:17:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。