論文の概要: See More, Match Better: Multi-Source Feature Fusion for Two-View Correspondence Learning
- arxiv url: http://arxiv.org/abs/2606.09262v1
- Date: Mon, 08 Jun 2026 09:33:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.901191
- Title: See More, Match Better: Multi-Source Feature Fusion for Two-View Correspondence Learning
- Title(参考訳): マルチソース機能融合による双方向対応学習
- Authors: Xiaojie Li, Xin Jiang, Luanyuan Dai, Jinnan Yang, Yongdong Zhang, Zechao Li,
- Abstract要約: 2視点対応学習は、画像対における真対応(インレーシ)と偽対応(インレーシ)とを区別することを目的としている。
既存の手法は主に座標に基づく幾何の整合性に依存する。
本稿では,2視点対応学習のためのマルチソース機能融合フレームワークTriMatchを提案する。
- 参考スコア(独自算出の注目度): 52.52121389921707
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Two-view correspondence learning aims to distinguish true correspondences (inliers) from false ones (outliers) in image pairs by leveraging their underlying differences. Existing methods mainly rely on coordinate-based geometric consistency. However, they often struggle with pseudo-consistent outliers in scenes containing repetitive structures, textureless regions, or locally similar geometric patterns. To address this limitation, we propose TriMatch, a multi-source feature fusion framework for two-view correspondence learning, which consists of two parts: feature extraction and feature refinement. In feature extraction, TriMatch jointly extracts geometric, texture semantic, and structural semantic features to provide complementary evidence for correspondence discrimination. To bridge the gap between semantic and geometric features, texture and structural semantic features are aligned with geometric features through dedicated Texture-Geometric Alignment and Structural-Geometric Alignment modules, respectively. We further introduce a Semantic-Guided Correspondence Modulation module, which modulates geometric features using semantic information to suppress geometrically plausible but semantically inconsistent correspondences. In feature refinement, a Hierarchical Semantic-Enhanced Correspondence Refinement strategy progressively models correspondence dependencies and recalibrates multi-context feature responses, enabling more reliable inlier-outlier discrimination. Extensive experiments demonstrate the effectiveness, robustness, and generalization capability of TriMatch.
- Abstract(参考訳): 二視点対応学習は、その基礎となる差を利用して、画像対における真対応(不整形)と偽対応(外接形)とを区別することを目的としている。
既存の手法は主に座標に基づく幾何の整合性に依存する。
しかし、しばしば、繰り返し構造、テクスチャのない地域、または局所的に類似した幾何学的パターンを含むシーンにおいて、擬似一貫性のあるアウトリーと戦っている。
この制限に対処するために,2視点対応学習のためのマルチソース機能融合フレームワークTriMatchを提案する。
特徴抽出において、TriMatchは幾何学的、テクスチャ的、構造的意味的特徴を共同で抽出し、対応の識別を補完する証拠を提供する。
意味的特徴と幾何学的特徴のギャップを埋めるために、テクスチャと構造的意味的特徴はそれぞれ専用のテクスチャ・幾何学的アライメントと構造的幾何学的アライメントモジュールを通して幾何学的特徴と整合する。
さらにセマンティックガイド対応モジュールを導入し,意味情報を用いて幾何学的特徴を変調し,幾何学的に妥当だが意味的に一貫性のない対応を抑える。
特徴改善において、階層的セマンティック強化対応リファインメント戦略は、対応依存関係を段階的にモデル化し、複数コンテキストの特徴応答を再検討し、より信頼性の高い不整合・不整合判別を可能にする。
大規模な実験は、TriMatchの有効性、堅牢性、一般化能力を示す。
関連論文リスト
- UniStitch: Unifying Semantic and Geometric Features for Image Stitching [47.900985740008174]
We present UniStitch, a unified image stitching framework from multimodal features。
離散幾何学的特徴を連続的な意味的特徴写像と整合させるため,ニューラルポイント変換器(NPT)モジュールを提案する。
Adaptive Mixture of Experts (AMoE)モジュールは幾何学的および意味的表現を融合するために設計されている。
実験の結果、UniStitchは既存の最先端の手法よりも大きなマージンを持つことがわかった。
論文 参考訳(メタデータ) (2026-03-11T09:19:34Z) - Universal 3D Shape Matching via Coarse-to-Fine Language Guidance [8.772996147679729]
UniMatchは、強い非等尺形状間の密接なセマンティック対応を構築するためのセマンティックアウェアで粗いフレームワークである。
本手法は普遍的対象カテゴリに対して汎用的であり,事前定義された部分提案を必要としない。
論文 参考訳(メタデータ) (2026-02-22T10:07:03Z) - Bridging Structure and Appearance: Topological Features for Robust Self-Supervised Segmentation [8.584363058858935]
自己教師付きセマンティックセグメンテーション法は、外観の曖昧さに直面して失敗することが多い。
これは、影、光沢、局所的なテクスチャといった不安定で外観に基づく特徴に過度に依存しているためである、と我々は主張する。
安定な位相情報を活用することで外観と幾何学を橋渡しする新しいフレームワークである textbfGASeg を提案する。
論文 参考訳(メタデータ) (2025-12-30T05:34:28Z) - Modality Alignment across Trees on Heterogeneous Hyperbolic Manifolds [49.95082206008502]
ツリーを横断するアライメントは、画像とテキストのモダリティの両方に対してツリーのような階層的な特徴を構築し、調整する手法である。
本稿では,中間トランスフォーマー層からの視覚的クラストークンにクロスアテンション機構を適用した意味認識型視覚特徴抽出フレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-31T11:32:15Z) - Hierarchical Neural Semantic Representation for 3D Semantic Correspondence [72.8101601086805]
階層型ニューラルセマンティック表現(HNSR)を設計し,高次構造と多分解能局所幾何学的特徴を捉える。
第2に,グローバルなセマンティック特徴を用いた粗いセマンティック対応を確立する,プログレッシブなグローバル-ローカルマッチング戦略を設計する。
第3に,本フレームワークはトレーニングフリーで,様々なトレーニング済みの3D生成バックボーンと広範囲に互換性があり,多様な形状カテゴリにまたがる強力な一般化が示されている。
論文 参考訳(メタデータ) (2025-09-22T07:23:07Z) - GSSF: Generalized Structural Sparse Function for Deep Cross-modal Metric Learning [51.677086019209554]
ペアワイド類似性学習のためのモダリティ間の強力な関係を捕捉する汎用構造スパースを提案する。
距離メートル法は、対角線とブロック対角線の2つの形式を微妙にカプセル化する。
クロスモーダルと2つの余分なユニモーダル検索タスクの実験は、その優位性と柔軟性を検証した。
論文 参考訳(メタデータ) (2024-10-20T03:45:50Z) - Isometric Multi-Shape Matching [50.86135294068138]
形状間の対応を見つけることは、コンピュータビジョンとグラフィックスの基本的な問題である。
アイソメトリーは形状対応問題においてしばしば研究されるが、マルチマッチング環境では明確には考慮されていない。
定式化を解くのに適した最適化アルゴリズムを提案し,コンバージェンスと複雑性解析を提供する。
論文 参考訳(メタデータ) (2020-12-04T15:58:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。