論文の概要: SSHNet: Unsupervised Cross-modal Homography Estimation via Problem Redefinition and Split Optimization
- arxiv url: http://arxiv.org/abs/2409.17993v3
- Date: Thu, 27 Feb 2025 13:46:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-28 14:53:12.155458
- Title: SSHNet: Unsupervised Cross-modal Homography Estimation via Problem Redefinition and Split Optimization
- Title(参考訳): SSHNet:問題再定義と分割最適化による教師なしクロスモーダルホログラフィー推定
- Authors: Junchen Yu, Si-Yuan Cao, Runmin Zhang, Chenghao Zhang, Zhu Yu, Shujie Chen, Bailin Yang, Hui-liang Shen,
- Abstract要約: SSHNetは、教師なしのクロスモーダルホモグラフィー推定を2つの教師付きサブプロブレムに再定義する。
本稿では,各サブプロブレム内で各ネットワークを個別に訓練するための効果的な分割最適化手法を提案する。
モデルパラメータの削減とクロスドメイン一般化能力の向上を目的として, 簡易かつ効果的な蒸留訓練手法を用いた。
- 参考スコア(独自算出の注目度): 11.223861912859364
- License:
- Abstract: We propose a novel unsupervised cross-modal homography estimation learning framework, named Split Supervised Homography estimation Network (SSHNet). SSHNet redefines the unsupervised cross-modal homography estimation into two supervised sub-problems, each addressed by its specialized network: a homography estimation network and a modality transfer network. To realize stable training, we introduce an effective split optimization strategy to train each network separately within its respective sub-problem. We also formulate an extra homography feature space supervision to enhance feature consistency, further boosting the estimation accuracy. Moreover, we employ a simple yet effective distillation training technique to reduce model parameters and improve cross-domain generalization ability while maintaining comparable performance. The training stability of SSHNet enables its cooperation with various homography estimation architectures. Experiments reveal that the SSHNet using IHN as homography estimation network, namely SSHNet-IHN, outperforms previous unsupervised approaches by a significant margin. Even compared to supervised approaches MHN and LocalTrans, SSHNet-IHN achieves 47.4% and 85.8% mean average corner errors (MACEs) reduction on the challenging OPT-SAR dataset.
- Abstract(参考訳): 本研究では,SSHNet(Split Supervised Homography Estimation Network)という,教師なしのクロスモーダルなホモグラフィ推定学習フレームワークを提案する。
SSHNetは、教師なしクロスモーダルホモグラフィー推定を2つの教師付きサブプロブレムに再定義する。
安定したトレーニングを実現するために,各ネットワークを各サブプロブレム内で個別にトレーニングするための効果的な分割最適化手法を提案する。
また、特徴整合性を高め、推定精度を高めるために、余分なホモグラフィ特徴空間の監督を定式化する。
さらに, モデルパラメータの削減とドメイン間一般化能力の向上を両立させるため, 比較性能を維持しつつ, 簡易かつ効果的な蒸留訓練手法を用いる。
SSHNetのトレーニング安定性は、様々なホモグラフィー推定アーキテクチャとの協調を可能にする。
実験の結果、IHNをホモグラフィー推定ネットワーク、すなわちSSHNet-IHNとして使用するSSHNetは、従来の教師なしアプローチよりも大きなマージンで優れていることがわかった。
MHNやLocalTransと比較しても、SSHNet-IHNは47.4%と85.8%の平均コーナーエラー(MACE)の削減を実現している。
関連論文リスト
- An Intra- and Cross-frame Topological Consistency Scheme for Semi-supervised Atherosclerotic Coronary Plaque Segmentation [9.902034502749501]
冠状動脈硬化解析 (CAA) は, 湾曲平面再構成法を用いて再建した血管断面画像の解析に頼っている。
この課題は、プラークと血管の境界や構造がはっきりしないため、重大な課題を提起する。
フレーム内トポロジ的整合性(ITC)とクロスフレームトポロジ的整合性(CTC)を統合した,新しい二重整合性半教師型フレームワークを提案する。
提案手法は,既存の半教師付き手法を超越し,CAAにおける教師付き手法の性能にアプローチする。
論文 参考訳(メタデータ) (2025-01-14T05:23:42Z) - Efficient Text-driven Motion Generation via Latent Consistency Training [21.348658259929053]
非線形逆拡散軌道を解くための動き潜時整合トレーニングフレームワーク(MLCT)を提案する。
これらの拡張を組み合わせることで、非画素モダリティおよび潜在表現空間における安定かつ一貫性のあるトレーニングを実現する。
論文 参考訳(メタデータ) (2024-05-05T02:11:57Z) - Motion-Scenario Decoupling for Rat-Aware Video Position Prediction:
Strategy and Benchmark [49.58762201363483]
本研究では,個人や環境の影響要因を考慮し,生物ロボットの動き予測データセットであるRatPoseを紹介する。
本稿では,シナリオ指向とモーション指向を効果的に分離するDual-stream Motion-Scenario Decouplingフレームワークを提案する。
難易度が異なるタスクに対して,提案したtextitDMSD フレームワークの大幅な性能向上を示す。
論文 参考訳(メタデータ) (2023-05-17T14:14:31Z) - Interpolation-based Correlation Reduction Network for Semi-Supervised
Graph Learning [49.94816548023729]
補間型相関低減ネットワーク(ICRN)と呼ばれる新しいグラフコントラスト学習手法を提案する。
提案手法では,決定境界のマージンを大きくすることで,潜在特徴の識別能力を向上させる。
この2つの設定を組み合わせることで、豊富なラベル付きノードと稀に価値あるラベル付きノードから豊富な監視情報を抽出し、離散表現学習を行う。
論文 参考訳(メタデータ) (2022-06-06T14:26:34Z) - Learning Relation Alignment for Calibrated Cross-modal Retrieval [52.760541762871505]
言語的・視覚的関係のセマンティックな距離を計測し,関係の一貫性を定量化するための新しい指標ISD(Intra-modal Self-attention Distance)を提案する。
ISDを最適化し、モダル間アライメントを介してモダル内アライメントを相互に調整するための正規化訓練法である、モダル内アライメント(IAIS)について述べる。
論文 参考訳(メタデータ) (2021-05-28T14:25:49Z) - Self-Supervised Multi-Frame Monocular Scene Flow [61.588808225321735]
自己監督学習に基づくマルチフレーム一眼的シーンフローネットワークを導入。
自己監督学習に基づく単眼的シーンフロー法における最新の精度を観察する。
論文 参考訳(メタデータ) (2021-05-05T17:49:55Z) - Self-supervised Multi-view Stereo via Effective Co-Segmentation and
Data-Augmentation [39.95831985522991]
セマンティック・コセグメンテーションとデータ強化によってガイドされるより信頼性の高い監視と統合されたフレームワークを提案する。
提案手法は教師なし手法の最先端性能を実現し,教師付き手法と同等に競合する。
論文 参考訳(メタデータ) (2021-04-12T11:48:54Z) - Domain Adaptive Robotic Gesture Recognition with Unsupervised
Kinematic-Visual Data Alignment [60.31418655784291]
本稿では,マルチモダリティ知識,すなわちキネマティックデータとビジュアルデータを同時にシミュレータから実ロボットに伝達できる,教師なしドメイン適応フレームワークを提案する。
ビデオの時間的手がかりと、ジェスチャー認識に対するマルチモーダル固有の相関を用いて、トランスファー可能な機能を強化したドメインギャップを修復する。
その結果, 本手法は, ACCでは最大12.91%, F1scoreでは20.16%と, 実際のロボットではアノテーションを使わずに性能を回復する。
論文 参考訳(メタデータ) (2021-03-06T09:10:03Z) - Dual-Teacher++: Exploiting Intra-domain and Inter-domain Knowledge with
Reliable Transfer for Cardiac Segmentation [69.09432302497116]
最先端の半教師付きドメイン適応フレームワークである Dual-Teacher++ を提案する。
ソースドメイン(MRなど)からのクロスモダリティ優先度を探索するドメイン間教師モデルと、ラベルのないターゲットドメインの知識を調査するドメイン内教師モデルを含む、新しいデュアル教師モデルを設計する。
このようにして、学生モデルは信頼できる二重ドメイン知識を得て、ターゲットドメインデータのパフォーマンスを向上させることができる。
論文 参考訳(メタデータ) (2021-01-07T05:17:38Z) - Intervention Generative Adversarial Networks [21.682592654097352]
本稿では,ジェネレーティブ・アドバイサル・ネットワークの学習過程を安定化するための新しいアプローチを提案する。
得られた生成モデルを、IVGAN(Intervention Generative Adversarial Networks)と呼ぶ。
論文 参考訳(メタデータ) (2020-08-09T11:51:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。