論文の概要: REDI-Match: Rotation-Equivariant Distillation for Efficient and Robust Dense Matching
- arxiv url: http://arxiv.org/abs/2606.24330v1
- Date: Tue, 23 Jun 2026 09:05:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 22:16:48.85607
- Title: REDI-Match: Rotation-Equivariant Distillation for Efficient and Robust Dense Matching
- Title(参考訳): REDI-Match: 効率的なロバストドセンスマッチングのための回転同変蒸留法
- Authors: Yinji Ge, Guixu Zheng, Wulong Guo, Qian Feng, Xu Wu, Kai Zhou, Xinyuan Liu, Fei Xing,
- Abstract要約: ヴィジョン・ファンデーション・モデル(VFM)は、非常に高度な特徴マッチングを持つが、飛行機内での激しい回転は重要な課題である。
Redi-Matchは、新しいRotation-Equivariant Distillation(REDI)パラダイムによって駆動される効率的なフレームワークである。
現在のSOTAよりも1.9倍高速に動作しながら、SatAstデータセットの13.89%の絶対的なポーズ精度の向上を実現している。
- 参考スコア(独自算出の注目度): 9.492474203638965
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Vision Foundation Models (VFMs) have significantly advanced dense feature matching, yet severe in-plane rotation remains a critical challenge. Existing solutions face a fundamental dilemma: data-driven methods require inefficient parameter scaling to implicitly learn rotations, whereas strictly equivariant networks lack the semantic capacity of modern VFMs. Consequently, current frameworks typically freeze VFMs and shift the entire burden of rotation generalization to the downstream decoder. To break this architectural bottleneck, we propose REDI-Match, an efficient framework driven by a novel Rotation-Equivariant Distillation (REDI) paradigm. Instead of relying on rotation data augmentation to establish rotational correspondences, REDI distills the non-equivariant semantic representations of a VFM into a lightweight, strictly rotation-equivariant encoder, leveraging an equivariant geometric architecture to constrain robust high-dimensional semantics. To fully exploit these features, we equip the decoder with an entropy-driven spatial alignment module. By evaluating discrete rotation hypotheses, this mechanism explicitly locks onto the canonical coordinate system, eliminating global ambiguity before continuous refinement. Extensive experiments demonstrate that REDI-Match establishes a new state-of-the-art (SOTA) across multiple benchmarks. Notably, it achieves a 13.89% absolute pose accuracy improvement on the highly challenging SatAst dataset while operating 1.9x faster than the current SOTA (RoMa v2), enabling real-time inference (~41 FPS) on a single RTX 4090 GPU. Code: https://github.com/YinjiGe/REDI-Match.
- Abstract(参考訳): ヴィジョン・ファンデーション・モデル(VFM)は、非常に高度な特徴マッチングを持つが、飛行機内での激しい回転は重要な課題である。
データ駆動方式は、暗黙的に回転を学習するために非効率なパラメータスケーリングを必要とするが、厳密な同変ネットワークは現代のVFMの意味能力に欠ける。
結果として、現在のフレームワークは一般的にVFMを凍結し、ローテーション一般化のすべての負担を下流デコーダにシフトする。
このアーキテクチャのボトルネックを克服するために、新しいローテーション・平等蒸留(REDI)パラダイムによって駆動される効率的なフレームワークであるREDI-Matchを提案する。
REDIは回転データ拡張を頼りに回転対応を確立する代わりに、VFMの非同変意味表現を軽量で厳密な回転同変エンコーダに蒸留し、同変幾何構造を利用して堅牢な高次元意味論を制約する。
これらの特徴をフル活用するために,エントロピー駆動型空間アライメントモジュールをデコーダに装備する。
離散的な回転仮説を評価することにより、このメカニズムは正準座標系に明示的にロックされ、連続的な洗練の前に大域的な曖昧さを排除できる。
大規模な実験では、REDI-Matchが複数のベンチマークで新しい最先端(SOTA)を確立している。
特に、現在のSOTA(RoMa v2)よりも1.9倍高速に動作しながら、非常に困難なSatAstデータセットで13.89%の絶対的なポーズ精度の向上を実現し、1つのRTX 4090 GPU上でリアルタイム推論(約41 FPS)を可能にする。
コード:https://github.com/YinjiGe/REDI-Match.com
関連論文リスト
- Computing a Characteristic Orientation for Rotation-Independent Image Analysis [0.0]
General Intensity Direction (GID) はネットワークアーキテクチャを変更することなく回転ロバスト性を改善する前処理方式である。
空間構造を維持しながら画像を変換し、畳み込みネットワークと互換性を持つ。
回転MNISTデータセットの実験的評価により,提案手法は最先端の回転不変アーキテクチャよりも高い精度を達成できることが示された。
論文 参考訳(メタデータ) (2026-02-24T14:08:12Z) - REVNET: Rotation-Equivariant Point Cloud Completion via Vector Neuron Anchor Transformer [0.0]
REVNETは任意の回転の下でロバストポイントクラウドを補完するための新しいフレームワークである。
本手法は,同変条件下での合成MVPデータセットの最先端手法より優れる。
ソースコードはGitHubでURLで公開される。
論文 参考訳(メタデータ) (2026-01-13T13:42:11Z) - Rotation Equivariant Arbitrary-scale Image Super-Resolution [62.41329042683779]
任意のスケールの超解像(ASISR)は、低解像度の入力画像から任意のスケールの高分解能回復を実現することを目的としている。
本研究では, 回転同変ASISR法の構築に尽力する。
論文 参考訳(メタデータ) (2025-08-07T08:51:03Z) - PARE-Net: Position-Aware Rotation-Equivariant Networks for Robust Point Cloud Registration [8.668461141536383]
回転不変の特徴を学習することは、ポイントクラウド登録の基本的な要件である。
既存の手法では、回転に敏感なネットワークを用いて特徴を抽出し、回転拡大を用いて近似不変写像を無作為に学習する。
高速で軽量でロバストな登録のための位置認識型回転同変ネットワークを提案する。
論文 参考訳(メタデータ) (2024-07-14T10:26:38Z) - Rotation-Invariant Transformer for Point Cloud Matching [42.5714375149213]
我々は,回転不変変換器であるRoITrを導入し,点クラウドマッチングタスクにおけるポーズ変動に対処する。
本稿では,自己認識機構によって学習した,回転不変なクロスフレーム空間認識を備えたグローバルトランスフォーマーを提案する。
RoITrは、Inlier RatioとRegistration Recallの点で、既存のメソッドを少なくとも13と5のパーセンテージで上回っている。
論文 参考訳(メタデータ) (2023-03-14T20:55:27Z) - Improving the Sample-Complexity of Deep Classification Networks with
Invariant Integration [77.99182201815763]
変換によるクラス内分散に関する事前知識を活用することは、ディープニューラルネットワークのサンプル複雑性を改善するための強力な方法である。
そこで本研究では,アプリケーションの複雑な問題に対処するために,プルーニング法に基づく新しい単項選択アルゴリズムを提案する。
本稿では,Rotated-MNIST,SVHN,CIFAR-10データセットにおけるサンプルの複雑さの改善について述べる。
論文 参考訳(メタデータ) (2022-02-08T16:16:11Z) - Frame Averaging for Invariant and Equivariant Network Design [50.87023773850824]
フレーム平均化(FA)は、既知の(バックボーン)アーキテクチャを新しい対称性タイプに不変あるいは同変に適応するためのフレームワークである。
FAモデルが最大表現力を持つことを示す。
我々は,新しいユニバーサルグラフニューラルネット(GNN),ユニバーサルユークリッド運動不変点クラウドネットワーク,およびユークリッド運動不変メッセージパッシング(MP)GNNを提案する。
論文 参考訳(メタデータ) (2021-10-07T11:05:23Z) - Adjoint Rigid Transform Network: Task-conditioned Alignment of 3D Shapes [86.2129580231191]
Adjoint Rigid Transform (ART) Networkは、さまざまな3Dネットワークと統合可能なニューラルネットワークモジュールである。
ARTは入力の形状を学習した標準方向に回転させることを学び、多くのタスクに欠かせない。
さらなる研究のために、コードと事前訓練されたモデルをリリースします。
論文 参考訳(メタデータ) (2021-02-01T20:58:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。