論文の概要: Extracting Deformation-Aware Local Features by Learning to Deform
- arxiv url: http://arxiv.org/abs/2111.10617v1
- Date: Sat, 20 Nov 2021 15:46:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-23 15:06:28.088657
- Title: Extracting Deformation-Aware Local Features by Learning to Deform
- Title(参考訳): 変形の学習による局所的特徴の抽出
- Authors: Guilherme Potje, Renato Martins, Felipe Cadar and Erickson R.
Nascimento
- Abstract要約: 非剛性変形に対して頑健な静止画像から特徴量を計算するための新しい手法を提案する。
我々は、シミュレーション環境でオブジェクトに非剛性変形を適用することにより、モデルアーキテクチャをエンドツーエンドにトレーニングする。
実験により, この手法は, 最新の手工芸画像, 学習ベース画像, およびRGB-Dディスクリプタを異なるデータセットで比較した。
- 参考スコア(独自算出の注目度): 3.364554138758565
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Despite the advances in extracting local features achieved by handcrafted and
learning-based descriptors, they are still limited by the lack of invariance to
non-rigid transformations. In this paper, we present a new approach to compute
features from still images that are robust to non-rigid deformations to
circumvent the problem of matching deformable surfaces and objects. Our
deformation-aware local descriptor, named DEAL, leverages a polar sampling and
a spatial transformer warping to provide invariance to rotation, scale, and
image deformations. We train the model architecture end-to-end by applying
isometric non-rigid deformations to objects in a simulated environment as
guidance to provide highly discriminative local features. The experiments show
that our method outperforms state-of-the-art handcrafted, learning-based image,
and RGB-D descriptors in different datasets with both real and realistic
synthetic deformable objects in still images. The source code and trained model
of the descriptor are publicly available at
https://www.verlab.dcc.ufmg.br/descriptors/neurips2021.
- Abstract(参考訳): 手作りと学習に基づく記述子によって達成された局所的な特徴の抽出の進歩にもかかわらず、それらは依然として非リジッド変換に対する不変性の欠如によって制限されている。
本稿では,非剛体変形に対して頑健な静止画像から特徴量を計算するための新しい手法を提案する。
我々の変形対応ローカル記述子DEALは、極サンプリングと空間変換器のワープを利用して、回転、スケール、画像変形の不変性を提供する。
シミュレーション環境における物体に等尺的非剛性変形を適用してモデルアーキテクチャをエンドツーエンドにトレーニングし、高度に識別可能な局所特徴を提供する。
実験の結果,本手法は,実物と実物の両方の合成変形可能なオブジェクトを静止画像内に有する,最先端の手作り,学習ベース,RGB-D記述子よりも優れていた。
デクリプタのソースコードとトレーニングされたモデルはhttps://www.verlab.dcc.ufmg.br/descriptors/neurips2021で公開されている。
関連論文リスト
- Invariant Shape Representation Learning For Image Classification [41.610264291150706]
本稿では,不変形状表現学習(ISRL)を初めて開発した新しいフレームワークを提案する。
我々のモデルISRLは、変形可能な変換によってパラメータ化される潜在形状空間における不変特徴を共同でキャプチャするように設計されている。
異なる環境にターゲット変数に関して不変な機能を埋め込むことで、我々のモデルは一貫してより正確な予測を提供する。
論文 参考訳(メタデータ) (2024-11-19T03:39:43Z) - Learning Dual-Level Deformable Implicit Representation for Real-World Scale Arbitrary Super-Resolution [81.74583887661794]
整数と非整数のスケーリング要素を併用した,新しい実世界のスーパーレゾリューションベンチマークを構築した。
実世界の任意の超解像を解くために,Dual-level Deformable Implicit Representation (DDIR)を提案する。
実世界の任意の超解像のためのRealArbiSRおよびRealSRベンチマークの最先端性能を実現する。
論文 参考訳(メタデータ) (2024-03-16T13:44:42Z) - KP-RED: Exploiting Semantic Keypoints for Joint 3D Shape Retrieval and Deformation [87.23575166061413]
KP-RED は KeyPoint 主導の Retrieval and deformation フレームワークである。
オブジェクトスキャンを入力として、最も幾何学的に類似したCADモデルを共同で検索し、変形させる。
論文 参考訳(メタデータ) (2024-03-15T08:44:56Z) - Pixel-Inconsistency Modeling for Image Manipulation Localization [59.968362815126326]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。
本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。
実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文 参考訳(メタデータ) (2023-09-30T02:54:51Z) - Learning Transformations To Reduce the Geometric Shift in Object
Detection [60.20931827772482]
画像キャプチャプロセスの変動から生じる幾何シフトに対処する。
我々は、これらのシフトを最小限に抑えるために幾何変換の集合を学習する自己学習アプローチを導入する。
我々は,カメラの視野変化(FoV)と視点変化(視点変化)の2つの異なるシフトについて,本手法の評価を行った。
論文 参考訳(メタデータ) (2023-01-13T11:55:30Z) - RecRecNet: Rectangling Rectified Wide-Angle Images by Thin-Plate Spline
Model and DoF-based Curriculum Learning [62.86400614141706]
我々はRecRecNet(Rectangling Rectification Network)という新しい学習モデルを提案する。
我々のモデルは、ソース構造をターゲット領域に柔軟にワープし、エンドツーエンドの非教師なし変形を実現する。
実験により, 定量評価と定性評価の両面において, 比較法よりも解法の方が優れていることが示された。
論文 参考訳(メタデータ) (2023-01-04T15:12:57Z) - Pop-Out Motion: 3D-Aware Image Deformation via Learning the Shape
Laplacian [58.704089101826774]
形状分類と変形型に最小限の制約を課した3次元画像変形法を提案する。
点雲として表される3次元再構成の基底体積のラプラシアン形状を予測するために,教師付き学習に基づくアプローチを採用する。
実験では,2次元キャラクタと人間の衣料画像の変形実験を行った。
論文 参考訳(メタデータ) (2022-03-29T04:57:18Z) - Learning Geodesic-Aware Local Features from RGB-D Images [8.115075181267109]
非剛性変形に不変なRGB-D画像から記述子を計算するための新しい手法を提案する。
提案手法は,非歪な局所像パッチ上で特徴表現を学習する鍵となる考え方に基づいている。
実際に利用可能なRGB-Dデータベンチマークを使用したさまざまな実験では、最先端の手作りおよび学習ベースのイメージとRGB-D記述子を一貫して上回っている。
論文 参考訳(メタデータ) (2022-03-22T19:52:49Z) - Image-to-image Transformation with Auxiliary Condition [0.0]
本稿では,CycleGANのトレーニングにおけるポーズや対象のタイプなど,被験者のラベル情報を導入し,ラベルに配慮したトランスフォーメーションモデルを構築することを提案する。
我々は,SVHNからMNISTへのデジタル画像変換と,シミュレートされた実画像から実画像への監視カメラ画像変換実験を通じて,ラベル・シクレガンと呼ばれる手法の評価を行った。
論文 参考訳(メタデータ) (2021-06-25T15:33:11Z) - Robust Training Using Natural Transformation [19.455666609149567]
画像分類アルゴリズムのロバスト性を改善するための逆学習手法であるNaTraを提案する。
クラス識別とは無関係な入力画像の属性をターゲティングし、それらの属性を操作して実世界の自然変換を模倣します。
本手法の有効性を,よく訓練されたGANから導かれる非絡み合った潜在表現を用いて実証する。
論文 参考訳(メタデータ) (2021-05-10T01:56:03Z) - Transformation Based Deep Anomaly Detection in Astronomical Images [0.0]
天文画像の異常検出に有用な新しいフィルタベース変換を提案する。
また、変換の区別不可能なペアを見つけることができる変換選択戦略を提案する。
これらのモデルは、HiTS(High Cadence Transient Survey)とZTF(Zwicky Transient Facility)のデータセットから得られた天文学的な画像でテストされた。
論文 参考訳(メタデータ) (2020-05-15T21:02:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。