論文の概要: Streamlining the Image Stitching Pipeline: Integrating Fusion and Rectangling into a Unified Model
- arxiv url: http://arxiv.org/abs/2404.14951v1
- Date: Tue, 23 Apr 2024 11:53:51 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-24 14:21:26.300687
- Title: Streamlining the Image Stitching Pipeline: Integrating Fusion and Rectangling into a Unified Model
- Title(参考訳): 画像スティッチパイプラインの合理化:融合と整形を統一モデルに統合する
- Authors: Ziqi Xie,
- Abstract要約: 学習ベースの画像縫合技術は通常、登録、融合、整形という3つの異なる段階を含む。
本稿では, 融合および整流段階を統一モデルにマージする, 効率的なトレーニング不要画像縫合法である Simple and Robust Stitcher (SRStitcher) を提案する。
本手法は縫合パイプラインの簡易化だけでなく,誤登録エラーに対する耐故障性の向上にも寄与する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning-based image stitching techniques typically involve three distinct stages: registration, fusion, and rectangling. These stages are often performed sequentially, each trained independently, leading to potential cascading error propagation and complex parameter tuning challenges. In rethinking the mathematical modeling of the fusion and rectangling stages, we discovered that these processes can be effectively combined into a single, variety-intensity inpainting problem. Therefore, we propose the Simple and Robust Stitcher (SRStitcher), an efficient training-free image stitching method that merges the fusion and rectangling stages into a unified model. By employing the weighted mask and large-scale generative model, SRStitcher can solve the fusion and rectangling problems in a single inference, without additional training or fine-tuning of other models. Our method not only simplifies the stitching pipeline but also enhances fault tolerance towards misregistration errors. Extensive experiments demonstrate that SRStitcher outperforms state-of-the-art (SOTA) methods in both quantitative assessments and qualitative evaluations. The code is released at https://github.com/yayoyo66/SRStitcher
- Abstract(参考訳): 学習ベースの画像縫合技術は通常、登録、融合、整形という3つの異なる段階を含む。
これらの段階は、それぞれ独立に訓練され、カスケードエラーの伝播や複雑なパラメータチューニングの課題につながる。
融合および矩形化段階の数学的モデリングを再考すると、これらのプロセスは、効果的に1つの多角性塗装問題に結合できることが判明した。
そこで本稿では, 融合および整流段階を統一モデルにマージする, 効率的なトレーニング不要画像縫合法である, Simple and Robust Stitcher (SRStitcher)を提案する。
重み付きマスクと大規模生成モデルを用いることで、SRStitcherは他のモデルの追加トレーニングや微調整をすることなく、単一の推論で融合と整形を解くことができる。
本手法は縫合パイプラインの簡易化だけでなく,誤登録エラーに対する耐故障性の向上にも寄与する。
SRStitcherは、定量評価と定性評価の両方において、最先端(SOTA)手法より優れていることを示した。
コードはhttps://github.com/yayoyo66/SRStitcherで公開されている。
関連論文リスト
- One-Step Diffusion Distillation via Deep Equilibrium Models [64.11782639697883]
本稿では,拡散モデルを初期雑音から得られた画像に直接蒸留する簡易かつ効果的な方法を提案する。
本手法は,拡散モデルからノイズ/イメージペアのみによる完全オフライントレーニングを可能にする。
GET は FID スコアの点で 5 倍の ViT と一致するので,DEC アーキテクチャがこの能力に不可欠であることを示す。
論文 参考訳(メタデータ) (2023-12-12T07:28:40Z) - Iterative Token Evaluation and Refinement for Real-World
Super-Resolution [77.74289677520508]
実世界の画像超解像(RWSR)は、低品質(LQ)画像が複雑で未同定の劣化を起こすため、長年にわたる問題である。
本稿では,RWSRのための反復的トークン評価・リファインメントフレームワークを提案する。
ITERはGAN(Generative Adversarial Networks)よりも訓練が容易であり,連続拡散モデルよりも効率的であることを示す。
論文 参考訳(メタデータ) (2023-12-09T17:07:32Z) - One More Step: A Versatile Plug-and-Play Module for Rectifying Diffusion
Schedule Flaws and Enhancing Low-Frequency Controls [77.42510898755037]
One More Step (OMS) は、推論中に単純だが効果的なステップを付加したコンパクトネットワークである。
OMSは画像の忠実度を高め、トレーニングと推論の二分法を調和させ、元のモデルパラメータを保存する。
トレーニングが完了すると、同じ潜在ドメインを持つ様々な事前訓練された拡散モデルが同じOMSモジュールを共有することができる。
論文 参考訳(メタデータ) (2023-11-27T12:02:42Z) - SinSR: Diffusion-Based Image Super-Resolution in a Single Step [119.18813219518042]
拡散モデルに基づく超解像(SR)法は有望な結果を示す。
しかし、それらの実践的応用は、必要な推論ステップのかなりの数によって妨げられている。
本稿では,SinSRという単一ステップのSR生成を実現するための,シンプルで効果的な手法を提案する。
論文 参考訳(メタデータ) (2023-11-23T16:21:29Z) - FreeReg: Image-to-Point Cloud Registration Leveraging Pretrained Diffusion Models and Monocular Depth Estimators [37.39693977657165]
イメージとポイントクラウド間のクロスモダリティ機能をマッチングすることは、イメージツーポイントクラウド登録の根本的な問題である。
まず,事前学習した大規模モデルを用いて,画像と点雲のモダリティを統一することを提案する。
画像から画像への拡散モデルから抽出した拡散特徴と呼ばれる中間的特徴が,画像と点雲の間で意味的に一致していることを示す。
論文 参考訳(メタデータ) (2023-10-05T09:57:23Z) - BOOT: Data-free Distillation of Denoising Diffusion Models with
Bootstrapping [64.54271680071373]
拡散モデルは多様な画像を生成する優れた可能性を示している。
知識蒸留は、推論ステップの数を1つか数に減らすための治療法として最近提案されている。
本稿では,効率的なデータフリー蒸留アルゴリズムにより限界を克服するBOOTと呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2023-06-08T20:30:55Z) - Learning non-stationary and discontinuous functions using clustering,
classification and Gaussian process modelling [0.0]
非滑らかな関数の近似に対する3段階のアプローチを提案する。
この考え方は、システムの局所的な振る舞いや体制に従って空間を分割し、局所的なサロゲートを構築することである。
本手法は, 引張膜構造の2つの解析関数と有限要素モデルを用いて検証し, 検証した。
論文 参考訳(メタデータ) (2022-11-30T11:11:56Z) - Git Re-Basin: Merging Models modulo Permutation Symmetries [3.5450828190071655]
提案手法は,大規模ネットワークに適合する簡単なアルゴリズムを実例で示す。
我々は、独立に訓練されたモデル間のゼロモード接続の最初のデモ(私たちの知る限り)を実演する。
また、線形モード接続仮説の欠点についても論じる。
論文 参考訳(メタデータ) (2022-09-11T10:44:27Z) - Recurrent Multi-view Alignment Network for Unsupervised Surface
Registration [79.72086524370819]
非厳格な登録をエンドツーエンドで学習することは、本質的に高い自由度とラベル付きトレーニングデータの欠如により困難である。
我々は、いくつかの剛性変換のポイントワイドな組み合わせで、非剛性変換を表現することを提案する。
また,投影された多視点2次元深度画像上での3次元形状の類似度を計測する可微分損失関数も導入する。
論文 参考訳(メタデータ) (2020-11-24T14:22:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。