論文の概要: UniStitch: Unifying Semantic and Geometric Features for Image Stitching
- arxiv url: http://arxiv.org/abs/2603.10568v1
- Date: Wed, 11 Mar 2026 09:19:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-12 16:22:32.87039
- Title: UniStitch: Unifying Semantic and Geometric Features for Image Stitching
- Title(参考訳): UniStitch:画像スティッチのための意味的特徴と幾何学的特徴を統合する
- Authors: Yuan Mei, Lang Nie, Kang Liao, Yunqiu Xu, Chunyu Lin, Bin Xiao,
- Abstract要約: We present UniStitch, a unified image stitching framework from multimodal features。
離散幾何学的特徴を連続的な意味的特徴写像と整合させるため,ニューラルポイント変換器(NPT)モジュールを提案する。
Adaptive Mixture of Experts (AMoE)モジュールは幾何学的および意味的表現を融合するために設計されている。
実験の結果、UniStitchは既存の最先端の手法よりも大きなマージンを持つことがわかった。
- 参考スコア(独自算出の注目度): 47.900985740008174
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Traditional image stitching methods estimate warps from hand-crafted geometric features, whereas recent learning-based solutions leverage semantic features from neural networks instead. These two lines of research have largely diverged along separate evolution, with virtually no meaningful convergence to date. In this paper, we take a pioneering step to bridge this gap by unifying semantic and geometric features with UniStitch, a unified image stitching framework from multimodal features. To align discrete geometric features (i.e., keypoint) with continuous semantic feature maps, we present a Neural Point Transformer (NPT) module, which transforms unordered, sparse 1D geometric keypoints into ordered, dense 2D semantic maps. Then, to integrate the advantages of both representations, an Adaptive Mixture of Experts (AMoE) module is designed to fuse geometric and semantic representations. It dynamically shifts focus toward more reliable features during the fusion process, allowing the model to handle complex scenes, especially when either modality might be compromised. The fused representation can be adopted into common deep stitching pipelines, delivering significant performance gains over any single feature. Experiments show that UniStitch outperforms existing state-of-the-art methods with a large margin, paving the way for a unified paradigm between traditional and learning-based image stitching.
- Abstract(参考訳): 従来の画像縫合法では、手作りの幾何学的特徴からワープを推定するが、最近の学習ベースのソリューションでは、代わりにニューラルネットワークのセマンティックな特徴を利用する。
これら2つの研究の行は、これまで意味のある収束がほとんどなく、別々の進化に沿って大きく分岐してきた。
本稿では,このギャップを補うための先駆的なステップを,マルチモーダルな特徴から統合された画像縫合フレームワークであるUniStitchで意味的特徴と幾何学的特徴を統一する。
離散的な幾何学的特徴(キーポイント)を連続的な意味的特徴写像と整合させるため、無秩序でスパースな1次元幾何学的キーポイントを順序付き2次元意味写像に変換するニューラルポイント変換器(NPT)モジュールを提案する。
次に、両方の表現の利点を統合するために、アダプティブ・ミックス・オブ・エキスパートズ(AMoE)モジュールは幾何学的および意味的表現を融合するように設計されている。
融合プロセス中に、より信頼性の高い機能にフォーカスを動的にシフトし、モデルが複雑なシーンを扱えるようにします。
融合表現は、一般的なディープステッチパイプラインに採用することができ、単一の機能に対して大きなパフォーマンス向上をもたらす。
実験により、UniStitchは既存の最先端の手法を大きなマージンで上回り、従来の画像縫合と学習ベースの画像縫合の統一パラダイムの道を開いた。
関連論文リスト
- Geodesic Prototype Matching via Diffusion Maps for Interpretable Fine-Grained Recognition [8.300049635963141]
本稿では,深部特徴の内在的幾何学において類似性を固定するプロトタイプベース認識のための新しいパラダイムを提案する。
具体的には、各クラスの潜在多様体構造を拡散空間に蒸留し、微分可能なナイストローム距離を導入する。
効率性を確保するために、周期的な更新を伴うクラスごとのランドマークセットをコンパクトに採用する。
論文 参考訳(メタデータ) (2025-09-21T12:15:04Z) - Aligned Novel View Image and Geometry Synthesis via Cross-modal Attention Instillation [62.87088388345378]
ワーピング・アンド・インペインティング手法を用いて,新しいビューイメージと幾何学生成の整合性を実現する拡散型フレームワークを提案する。
手法は、既製の幾何学予測器を利用して、参照画像から見る部分的な幾何学を予測する。
生成した画像と幾何の正確なアライメントを確保するために, クロスモーダルアテンション蒸留法を提案する。
論文 参考訳(メタデータ) (2025-06-13T16:19:00Z) - SMLNet: A SPD Manifold Learning Network for Infrared and Visible Image Fusion [60.18614468818683]
マルチモーダル画像融合のための新しいSPD(対称正定値)多様体学習を提案する。
我々のフレームワークは現在の最先端手法と比較して優れた性能を示す。
論文 参考訳(メタデータ) (2024-11-16T03:09:49Z) - Self-Supervised Learning from Non-Object Centric Images with a Geometric
Transformation Sensitive Architecture [7.825153552141346]
本稿では幾何学的変換に敏感な幾何学的変換感性アーキテクチャを提案する。
本手法は, 回転予測や変換の異なる目標の利用により, 学生に敏感になるよう促す。
提案手法は,非対象中心画像を事前学習データとして用いる際の性能向上を示す。
論文 参考訳(メタデータ) (2023-04-17T06:32:37Z) - Parallax-Tolerant Unsupervised Deep Image Stitching [57.76737888499145]
本稿では,パララックス耐性の非教師あり深層画像縫合技術であるUDIS++を提案する。
まず,グローバルなホモグラフィから局所的な薄板スプライン運動への画像登録をモデル化するための,頑健で柔軟なワープを提案する。
本研究では, 縫合された画像をシームレスに合成し, シーム駆動合成マスクの教師なし学習を行うことを提案する。
論文 参考訳(メタデータ) (2023-02-16T10:40:55Z) - Geo-SIC: Learning Deformable Geometric Shapes in Deep Image Classifiers [8.781861951759948]
本稿では,画像分類の性能向上のために,変形空間における変形可能な形状を学習する最初のディープラーニングモデルGeo-SICを提案する。
画像空間と潜時形状空間の両方から特徴を同時に導出する,クラス内変動の大きい新設計のフレームワークを提案する。
幾何学的形状表現の教師なし学習を取り入れた強化型分類網を開発した。
論文 参考訳(メタデータ) (2022-10-25T01:55:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。