論文の概要: PairingNet: A Learning-based Pair-searching and -matching Network for
Image Fragments
- arxiv url: http://arxiv.org/abs/2312.08704v1
- Date: Thu, 14 Dec 2023 07:43:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-15 23:48:13.795360
- Title: PairingNet: A Learning-based Pair-searching and -matching Network for
Image Fragments
- Title(参考訳): PairingNet: 画像フラグメントのための学習型ペア検索とマッチングネットワーク
- Authors: Rixin Zhou, Ding Xia, Yi Zhang, Honglin Pang, Xi Yang, Chuntao Li
- Abstract要約: 本稿では,難解な修復問題を解決するために,学習に基づくイメージフラグメントのペア探索とマッチング手法を提案する。
提案するネットワークは,ペア探索の精度に優れ,マッチングエラーを低減し,計算時間を大幅に短縮する。
- 参考スコア(独自算出の注目度): 6.694162736590122
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we propose a learning-based image fragment pair-searching and
-matching approach to solve the challenging restoration problem. Existing works
use rule-based methods to match similar contour shapes or textures, which are
always difficult to tune hyperparameters for extensive data and computationally
time-consuming. Therefore, we propose a neural network that can effectively
utilize neighbor textures with contour shape information to fundamentally
improve performance. First, we employ a graph-based network to extract the
local contour and texture features of fragments. Then, for the pair-searching
task, we adopt a linear transformer-based module to integrate these local
features and use contrastive loss to encode the global features of each
fragment. For the pair-matching task, we design a weighted fusion module to
dynamically fuse extracted local contour and texture features, and formulate a
similarity matrix for each pair of fragments to calculate the matching score
and infer the adjacent segment of contours. To faithfully evaluate our proposed
network, we created a new image fragment dataset through an algorithm we
designed that tears complete images into irregular fragments. The experimental
results show that our proposed network achieves excellent pair-searching
accuracy, reduces matching errors, and significantly reduces computational
time. Details, sourcecode, and data are available in our supplementary
material.
- Abstract(参考訳): 本稿では,難解な修復問題を解決するために,学習に基づくイメージフラグメントのペア探索とマッチング手法を提案する。
既存の作業では、同様の輪郭形状やテクスチャにマッチするルールベースの手法を採用している。
そこで我々は,隣接するテクスチャを輪郭形状情報で効果的に活用し,性能を根本的に向上させるニューラルネットワークを提案する。
まず,グラフベースのネットワークを用いて断片の局所的な輪郭とテクスチャの特徴を抽出する。
そして,ペア探索タスクにおいて,各フラグメントのグローバルな特徴を符号化するために,これらの局所的特徴を統合するリニアトランスフォーマーベースモジュールを採用する。
ペアマッチングタスクでは,局所輪郭とテクスチャの特徴を動的に融合する重み付き融合モジュールを設計し,各フラグメントに対して類似度行列を定式化し,マッチングスコアを計算し,隣接する輪郭のセグメントを推定する。
提案するネットワークを忠実に評価するために,不規則な断片に画像全体を分解するアルゴリズムを用いて,新たな画像フラグメントデータセットを作成した。
実験の結果,提案ネットワークはペア探索の精度に優れ,マッチングエラーを低減し,計算時間を大幅に短縮することがわかった。
詳細、ソースコード、およびデータは、私たちの補足資料で利用可能です。
関連論文リスト
- FuseNet: Self-Supervised Dual-Path Network for Medical Image
Segmentation [3.485615723221064]
FuseNetは、自己教師型セマンティックセグメンテーションのためのデュアルストリームフレームワークである。
クロスモーダル融合技術は、テキストデータを拡張画像に置き換えることで、CLIPの原理を拡張している。
皮膚病変と肺分画データセットの実験により, 本手法の有効性が示された。
論文 参考訳(メタデータ) (2023-11-22T00:03:16Z) - Efficient Segmentation with Texture in Ore Images Based on
Box-supervised Approach [6.6773975364173]
完全な鉱石と独立した鉱石を識別するために, テクスチャを特徴とするボックス管理手法を提案する。
提案手法は,21.6MBの小型モデルサイズで毎秒50フレーム以上を実現する。
この手法は、鉱石画像データセットの最先端アプローチと比較して高い精度を維持している。
論文 参考訳(メタデータ) (2023-11-10T08:28:22Z) - High-resolution Iterative Feedback Network for Camouflaged Object
Detection [128.893782016078]
カモフラージュされたオブジェクトを背景に視覚的に同化させることは、オブジェクト検出アルゴリズムにとって難しい。
エッジやバウンダリのぼやけた視界を生じさせる細部劣化を避けるために,高分解能テクスチャの詳細を抽出することを目的としている。
我々は,高解像度特徴量による低解像度表現を反復的フィードバック方式で洗練する新しいHitNetを提案する。
論文 参考訳(メタデータ) (2022-03-22T11:20:21Z) - Compositional Sketch Search [91.84489055347585]
フリーハンドスケッチを用いて画像コレクションを検索するアルゴリズムを提案する。
シーン構成全体を特定するための簡潔で直感的な表現として描画を利用する。
論文 参考訳(メタデータ) (2021-06-15T09:38:09Z) - DFM: A Performance Baseline for Deep Feature Matching [10.014010310188821]
提案手法では,事前学習したVGGアーキテクチャを特徴抽出器として使用し,マッチングを改善するために追加の訓練を必要としない。
提案アルゴリズムは,Hpatchesデータセット上で,平均マッチング精度(MMA)で0.57と0.80のスコアをそれぞれ1ピクセル,2ピクセルの閾値で達成する。
論文 参考訳(メタデータ) (2021-06-14T22:55:06Z) - Image Retrieval for Structure-from-Motion via Graph Convolutional
Network [13.040952255039702]
本稿では,グラフ畳み込みネットワーク(GCN)に基づく新しい検索手法を提案する。
問合せ画像を取り巻くサブグラフを入力データとして構築することにより、問合せ画像と重なり合う領域を持つか否かを学習可能なGCNを採用する。
実験により,本手法は高度にあいまいで重複したシーンの挑戦的データセットにおいて,極めて優れた性能を示すことが示された。
論文 参考訳(メタデータ) (2020-09-17T04:03:51Z) - GOCor: Bringing Globally Optimized Correspondence Volumes into Your
Neural Network [176.3781969089004]
特徴相関層は、画像ペア間の密接な対応を含むコンピュータビジョン問題において、重要なニューラルネットワークモジュールとして機能する。
我々は,特徴相関層の直接置換として機能する,完全に微分可能な密マッチングモジュール GOCor を提案する。
本手法は,幾何マッチング,光学フロー,密接なセマンティックマッチングのタスクにおいて,特徴相関層を著しく上回っている。
論文 参考訳(メタデータ) (2020-09-16T17:33:01Z) - Neural Subdivision [58.97214948753937]
本稿では,データ駆動型粗粒度モデリングの新しいフレームワークであるNeural Subdivisionを紹介する。
すべてのローカルメッシュパッチで同じネットワーク重みのセットを最適化するため、特定の入力メッシュや固定属、カテゴリに制約されないアーキテクチャを提供します。
単一の高分解能メッシュでトレーニングしても,本手法は新規な形状に対して合理的な区分を生成する。
論文 参考訳(メタデータ) (2020-05-04T20:03:21Z) - Adaptive Fractional Dilated Convolution Network for Image Aesthetics
Assessment [33.945579916184364]
適応型分数拡張畳み込み(AFDC)は、畳み込みカーネルレベルでこの問題に取り組むために開発された。
ミニバッチ学習のための簡潔な定式化を行い,グループ化戦略を用いて計算オーバーヘッドを削減する。
提案手法は,AVAデータセットを用いた画像美学評価において,最先端の性能を実現することを実証した。
論文 参考訳(メタデータ) (2020-04-06T21:56:29Z) - Weakly-Supervised Semantic Segmentation by Iterative Affinity Learning [86.45526827323954]
弱教師付きセマンティックセグメンテーションは、トレーニングのためにピクセル単位のラベル情報が提供されないため、難しい課題である。
このようなペア関係を学習するための反復アルゴリズムを提案する。
本稿では,提案アルゴリズムが最先端手法に対して好適に動作することを示す。
論文 参考訳(メタデータ) (2020-02-19T10:32:03Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。