Fugu-MT 論文翻訳(概要): MambaGlue: Fast and Robust Local Feature Matching With Mamba

論文の概要: MambaGlue: Fast and Robust Local Feature Matching With Mamba

arxiv url: http://arxiv.org/abs/2502.00462v1
Date: Sat, 01 Feb 2025 15:43:03 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-05 15:21:53.859401
Title: MambaGlue: Fast and Robust Local Feature Matching With Mamba
Title（参考訳）: MambaGlue: 高速でロバストなローカル機能とMamba
Authors: Kihwan Ryoo, Hyungtae Lim, Hyun Myung,
Abstract要約: そこで我々は,MambaGlueと呼ばれる,新しいMambaベースの局所特徴マッチング手法を提案する。 Mambaは最先端のアーキテクチャであり、トレーニングと推論の両方において、優れたスピードで急速に認識されるようになった。私たちのMambaGlueは、実世界のアプリケーションにおける堅牢性と効率のバランスを達成します。
参考スコア（独自算出の注目度）: 9.397265252815115
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: In recent years, robust matching methods using deep learning-based approaches have been actively studied and improved in computer vision tasks. However, there remains a persistent demand for both robust and fast matching techniques. To address this, we propose a novel Mamba-based local feature matching approach, called MambaGlue, where Mamba is an emerging state-of-the-art architecture rapidly gaining recognition for its superior speed in both training and inference, and promising performance compared with Transformer architectures. In particular, we propose two modules: a) MambaAttention mixer to simultaneously and selectively understand the local and global context through the Mamba-based self-attention structure and b) deep confidence score regressor, which is a multi-layer perceptron (MLP)-based architecture that evaluates a score indicating how confidently matching predictions correspond to the ground-truth correspondences. Consequently, our MambaGlue achieves a balance between robustness and efficiency in real-world applications. As verified on various public datasets, we demonstrate that our MambaGlue yields a substantial performance improvement over baseline approaches while maintaining fast inference speed. Our code will be available on https://github.com/url-kaist/MambaGlue
Abstract（参考訳）: 近年,コンピュータビジョンタスクにおいて,ディープラーニングに基づく手法を用いたロバストマッチング手法が積極的に研究され,改良されている。しかし、ロバストな手法と高速なマッチング技術の両方に対する継続的な需要がある。そこでは,新しいMambaベースの局所特徴マッチング手法であるMambaGlueを提案する。Mambaは,トレーニングと推論の両面での高速化と,Transformerアーキテクチャと比較して有望な性能を急速に実現し,最先端のアーキテクチャである。特に,2つのモジュールを提案する。イマンバに基づく自己意識構造を通じて局所的及びグローバル的文脈を同時に選択的に理解するマンバ意識混合機及び b)多層パーセプトロン(MLP)ベースのアーキテクチャである深層信頼スコア回帰器は、確実に一致した予測が基幹-基幹対応にどのように対応するかを示すスコアを評価する。その結果,我々のMambaGlueは実世界のアプリケーションにおけるロバストネスと効率のバランスを実現している。様々な公開データセットで検証されているように、我々のMambaGlueは、高速な推論速度を維持しながらベースラインアプローチよりも大幅にパフォーマンスが向上することを示した。私たちのコードはhttps://github.com/url-kaist/MambaGlueで公開されます。

関連論文リスト

LaTIM: Measuring Latent Token-to-Token Interactions in Mamba Models [1.249658136570244]
状態空間モデル(SSM)は、長文シーケンスモデリングのための変換器の効率的な代替品として登場した。 SSMには、注意に基づくアーキテクチャの理解と改善に不可欠であった解釈可能性ツールが欠けている。我々は, 精密な解釈を可能にする, Mamba-1 と Mamba-2 のトークンレベル分解法である LaTIM を紹介する。
論文参考訳（メタデータ） (2025-02-21T17:33:59Z)
TransMamba: Fast Universal Architecture Adaption from Transformers to Mamba [88.31117598044725]
本稿では,既存のTransformerモデルの知識を,TransMambaと呼ばれる代替アーキテクチャのMambaに伝達するクロスアーキテクチャトレーニングについて検討する。提案手法では,新しいマンバモデルの訓練を高速化し,ユニモーダルタスクおよびクロスモーダルタスクにおける有効性を確保するための2段階戦略を採用している。クロスモーダル学習のために,言語認識をMambaの視覚的特徴に統合し,Mambaアーキテクチャのクロスモーダルインタラクション能力を向上するクロスマンバモジュールを提案する。
論文参考訳（メタデータ） (2025-02-21T01:22:01Z)
From Markov to Laplace: How Mamba In-Context Learns Markov Chains [36.22373318908893]
我々はマルコフ連鎖の文脈内学習について研究し、驚くべき現象を明らかにする。トランスとは異なり、単層マンバでさえ、文脈内ラプラシアスムージング推定器を効率的に学習する。これらの理論的な洞察は経験的な結果と強く一致し、マンバと最適統計推定器の間の最初の公式な関係を表す。
論文参考訳（メタデータ） (2025-02-14T14:13:55Z)
Mamba-SEUNet: Mamba UNet for Monaural Speech Enhancement [54.427965535613886]
Mambaは、新しいステートスペースモデル(SSM)として、自然言語処理やコンピュータビジョンに広く応用されている。本稿では,MambaとU-Net for SEタスクを統合する革新的なアーキテクチャであるMamba-SEUNetを紹介する。
論文参考訳（メタデータ） (2024-12-21T13:43:51Z)
MobileMamba: Lightweight Multi-Receptive Visual Mamba Network [51.33486891724516]
従来の軽量モデルの研究は、主にCNNとTransformerベースの設計に重点を置いてきた。効率と性能のバランスをとるMobileMambaフレームワークを提案する。 MobileMambaはTop-1で83.6%を達成し、既存の最先端の手法を上回っている。
論文参考訳（メタデータ） (2024-11-24T18:01:05Z)
ReMamba: Equip Mamba with Effective Long-Sequence Modeling [50.530839868893786]
本研究では,長い文脈の理解能力を高めるReMambaを提案する。 ReMambaは2段階のプロセスで選択的圧縮と適応のテクニックを取り入れている。
論文参考訳（メタデータ） (2024-08-28T02:47:27Z)
Neural Architecture Search based Global-local Vision Mamba for Palm-Vein Recognition [42.4241558556591]
本稿では,画像の局所的相関と静脈特徴表現のためのトークン間のグローバル依存性を明示的に学習するための,GLVM(Global-local Vision Mamba)というハイブリッドネットワーク構造を提案する。第3に,MHMambaブランチ(MHMamba),FIU(Feature Iteration Unit),CNN(Convolutional Neural Network)という3つのブランチからなるConvMambaブロックを提案する。最後に,Global Local Alternate Neural Architecture Search (GLNAS)法を提案し,GLVMの最適アーキテクチャを進化的アルゴリズムと交互に探索する。
論文参考訳（メタデータ） (2024-08-11T10:42:22Z)
MambaVision: A Hybrid Mamba-Transformer Vision Backbone [54.965143338206644]
視覚応用に適した新しいハイブリッド型Mamba-TransformerバックボーンMambaVisionを提案する。最終層に自己アテンションブロックを付加したMambaアーキテクチャは,長距離空間依存性を捕捉する能力を大幅に向上することを示す。 ImageNet-1Kデータセットの分類において、MambaVisionの変種は、Top-1の精度とスループットの両方の観点から、最先端(SOTA)のパフォーマンスを達成する。
論文参考訳（メタデータ） (2024-07-10T23:02:45Z)
MiM-ISTD: Mamba-in-Mamba for Efficient Infrared Small Target Detection [72.46396769642787]
ネスト構造であるMamba-in-Mamba(MiM-ISTD)を開発した。 MiM-ISTDはSOTA法より8倍高速で、2048×2048$のイメージでテストすると、GPUメモリ使用率を62.2$%削減する。
論文参考訳（メタデータ） (2024-03-04T15:57:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。