論文の概要: Learning Accurate Template Matching with Differentiable Coarse-to-Fine
Correspondence Refinement
- arxiv url: http://arxiv.org/abs/2303.08438v1
- Date: Wed, 15 Mar 2023 08:24:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-16 14:28:10.654635
- Title: Learning Accurate Template Matching with Differentiable Coarse-to-Fine
Correspondence Refinement
- Title(参考訳): 識別可能な粗-重対応リファインメントによる正確なテンプレートマッチングの学習
- Authors: Zhirui Gao, Renjiao Yi, Zheng Qin, Yunfan Ye, Chenyang Zhu, and Kai Xu
- Abstract要約: 本稿では, 精度の高いテンプレートマッチング手法を提案する。
変圧器によって提供される新規な構造認識情報に基づいて、粗い対応を用いて初期ワープを推定する。
提案手法は最先端の手法やベースラインよりも大幅に優れており,実データにおいても,優れた一般化能力と視覚的検証が可能な結果が得られる。
- 参考スコア(独自算出の注目度): 28.00275083733545
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Template matching is a fundamental task in computer vision and has been
studied for decades. It plays an essential role in manufacturing industry for
estimating the poses of different parts, facilitating downstream tasks such as
robotic grasping. Existing methods fail when the template and source images
have different modalities, cluttered backgrounds or weak textures. They also
rarely consider geometric transformations via homographies, which commonly
exist even for planar industrial parts. To tackle the challenges, we propose an
accurate template matching method based on differentiable coarse-to-fine
correspondence refinement. We use an edge-aware module to overcome the domain
gap between the mask template and the grayscale image, allowing robust
matching. An initial warp is estimated using coarse correspondences based on
novel structure-aware information provided by transformers. This initial
alignment is passed to a refinement network using references and aligned images
to obtain sub-pixel level correspondences which are used to give the final
geometric transformation. Extensive evaluation shows that our method is
significantly better than state-of-the-art methods and baselines, providing
good generalization ability and visually plausible results even on unseen real
data.
- Abstract(参考訳): テンプレートマッチングはコンピュータビジョンの基本課題であり、何十年も研究されてきた。
異なる部品のポーズを推定し、ロボットの把持などの下流作業を容易にするために、製造産業において重要な役割を担っている。
既存の方法は、テンプレートとソースイメージが異なるモダリティ、散らかった背景、弱いテクスチャを持つ場合に失敗する。
彼らはまた、平面的な工業部品でも一般的に存在するホモグラフによる幾何学的変換を考えることも滅多にない。
そこで本研究では,この課題に対処するために,微分可能な粗さから精細な対応による正確なテンプレートマッチング手法を提案する。
エッジアウェアモジュールを使用して,マスクテンプレートとグレースケールイメージ間のドメインギャップを克服し,堅牢なマッチングを実現する。
変圧器によって提供される新しい構造認識情報に基づいて、粗い対応を用いて初期ワープを推定する。
この初期アライメントは、参照とアライメント画像を用いて精細化ネットワークに渡され、最終的な幾何学的変換を与えるために使用されるサブピクセルレベルの対応を得る。
広範評価の結果,本手法は最先端の手法やベースラインよりも優れており,実データにおいても優れた一般化能力と視覚的可視性が得られることがわかった。
関連論文リスト
- ConDL: Detector-Free Dense Image Matching [2.7582789611575897]
本稿では,高密度画像の対応性を推定するためのディープラーニングフレームワークを提案する。
我々の完全畳み込みモデルは画像の高密度な特徴マップを生成し、各ピクセルは複数の画像にマッチするディスクリプタに関連付けられている。
論文 参考訳(メタデータ) (2024-08-05T18:34:15Z) - SHIC: Shape-Image Correspondences with no Keypoint Supervision [106.99157362200867]
正準曲面マッピングは、オブジェクトの各ピクセルを3Dテンプレートの対応する点に割り当てることで、キーポイント検出を一般化する。
人間の分析のためにDensePoseによって人気を得た著者は、この概念をより多くのカテゴリに適用しようと試みている。
そこで本研究では,手動による指導を伴わない標準地図学習手法ShiCを紹介し,ほとんどのカテゴリにおいて教師付き手法よりも優れた結果が得られることを示す。
論文 参考訳(メタデータ) (2024-07-26T17:58:59Z) - PMatch: Paired Masked Image Modeling for Dense Geometric Matching [18.64065915021511]
幾何マッチングのための新しいクロスフレームグローバルマッチングモジュール(CFGM)を提案する。
テクスチャレス領域に頑健であるためには,その学習をより規則化するホモグラフィー損失を提案する。
幾何マッチングにおいて、SoTA(State-of-The-Art)の性能を実現する。
論文 参考訳(メタデータ) (2023-03-30T12:53:22Z) - Masked and Adaptive Transformer for Exemplar Based Image Translation [16.93344592811513]
ドメイン間のセマンティックマッチングは難しい。
正確なクロスドメイン対応を学習するためのマスク付き適応変換器(MAT)を提案する。
品質識別型スタイル表現を得るための新しいコントラスト型スタイル学習法を考案する。
論文 参考訳(メタデータ) (2023-03-30T03:21:14Z) - RecRecNet: Rectangling Rectified Wide-Angle Images by Thin-Plate Spline
Model and DoF-based Curriculum Learning [62.86400614141706]
我々はRecRecNet(Rectangling Rectification Network)という新しい学習モデルを提案する。
我々のモデルは、ソース構造をターゲット領域に柔軟にワープし、エンドツーエンドの非教師なし変形を実現する。
実験により, 定量評価と定性評価の両面において, 比較法よりも解法の方が優れていることが示された。
論文 参考訳(メタデータ) (2023-01-04T15:12:57Z) - Modeling Image Composition for Complex Scene Generation [77.10533862854706]
本稿では,レイアウト・ツー・イメージ生成タスクにおける最先端結果を実現する手法を提案する。
本稿では,RGB画像をパッチトークンに圧縮した後,オブジェクト・トゥ・オブジェクト,オブジェクト・トゥ・パッチ,パッチ・トゥ・パッチの依存関係を探索するTransformer with Focal Attention (TwFA)を提案する。
論文 参考訳(メタデータ) (2022-06-02T08:34:25Z) - Controllable Person Image Synthesis with Spatially-Adaptive Warped
Normalization [72.65828901909708]
制御可能な人物画像生成は、望ましい属性を持つ現実的な人間の画像を作成することを目的としている。
本稿では,学習フロー場とワープ変調パラメータを統合した空間適応型ワープ正規化(SAWN)を提案する。
本稿では,テクスチャ・トランスファータスクの事前学習モデルを洗練するための,新たな自己学習部分置換戦略を提案する。
論文 参考訳(メタデータ) (2021-05-31T07:07:44Z) - FeatMatch: Feature-Based Augmentation for Semi-Supervised Learning [64.32306537419498]
本稿では,複雑な変換を多様に生成する特徴量に基づく改良・拡張手法を提案する。
これらの変換は、クラスタリングを通じて抽出したクラス内およびクラス間の両方の情報も利用します。
提案手法は,大規模データセットにスケールアップしながら,より小さなデータセットに対して,現在の最先端技術に匹敵するものであることを実証する。
論文 参考訳(メタデータ) (2020-07-16T17:55:31Z) - ProAlignNet : Unsupervised Learning for Progressively Aligning Noisy
Contours [12.791313859673187]
ProAlignNetは、輪郭形状間の大規模なミスアライメントと複雑な変換を説明できる。
近接感度および局所形状依存類似度測定値の上界から導出される新しい損失関数を用いて学習する。
実世界の2つの応用において、提案したモデルは最先端の手法よりも一貫して優れている。
論文 参考訳(メタデータ) (2020-05-23T14:56:14Z) - FDA: Fourier Domain Adaptation for Semantic Segmentation [82.4963423086097]
本稿では,教師なし領域適応の簡易な手法について述べる。一方の低周波スペクトルを他方と交換することにより,音源と対象分布の相違を低減できる。
本手法を意味的セグメンテーション(semantic segmentation, 意味的セグメンテーション, 意味的セグメンテーション)で説明する。
以上の結果から,より高度な手法が学習に苦しむデータにおいて,単純な手順であってもニュアンス変動を低減できる可能性が示唆された。
論文 参考訳(メタデータ) (2020-04-11T22:20:48Z) - A Robust Method for Image Stitching [0.0]
画像中の繰り返しパターンや特徴のない領域に対して頑健な大規模画像縫合法を提案する。
提案手法は,有効な画像登録候補を全て集めることにより,現在の手法を強化する。
論文 参考訳(メタデータ) (2020-04-08T07:53:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。