論文の概要: ERVD: An Efficient and Robust ViT-Based Distillation Framework for Remote Sensing Image Retrieval
- arxiv url: http://arxiv.org/abs/2412.18136v1
- Date: Tue, 24 Dec 2024 03:44:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-25 19:23:17.649244
- Title: ERVD: An Efficient and Robust ViT-Based Distillation Framework for Remote Sensing Image Retrieval
- Title(参考訳): ERVD: リモートセンシング画像検索のための高効率でロバストなViTベースの蒸留フレームワーク
- Authors: Le Dong, Qixuan Cao, Lei Pu, Fangfang Wu, Weisheng Dong, Xin Li, Guangming Shi,
- Abstract要約: リモートセンシング画像検索のためのViTベースの蒸留フレームワーク
ERVD: リモートセンシング画像検索のための効率的でロバストなViTベースの蒸留フレームワーク。
- 参考スコア(独自算出の注目度): 43.282237389534934
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: ERVD: An Efficient and Robust ViT-Based Distillation Framework for Remote Sensing Image Retrieval
- Abstract(参考訳): ERVD: リモートセンシング画像検索のための高効率でロバストなViTベースの蒸留フレームワーク
関連論文リスト
- Embedding Radiomics into Vision Transformers for Multimodal Medical Image Classification [10.627136212959396]
ビジョントランスフォーマー(ViT)は、自己注意を通じて長距離依存をモデル化することで、畳み込みモデルの強力な代替手段を提供する。
本稿では、放射能特徴とデータ駆動型視覚埋め込みをViTバックボーン内に組み込んだRE-ViT(Radiomics-Embedded Vision Transformer)を提案する。
論文 参考訳(メタデータ) (2025-04-15T06:55:58Z) - One-Step Residual Shifting Diffusion for Image Super-Resolution via Distillation [90.84654430620971]
超解像(SR)の拡散モデルは高品質な視覚結果を生成するが、高価な計算コストを必要とする。
本稿では,拡散型SRモデルの1つであるResShiftの新しい蒸留法であるRSDを提案する。
本手法は,学生ネットワークを訓練し,その上で訓練した新しい偽ResShiftモデルが教師モデルと一致するような画像を生成することに基づいている。
論文 参考訳(メタデータ) (2025-03-17T16:44:08Z) - ITVTON: Virtual Try-On Diffusion Transformer Based on Integrated Image and Text [11.85544970521423]
画像品質を向上させるためにDiffusion Transformer (DiT) をジェネレータとして利用する ITVTON を導入する。
ITVTONは、空間チャネルに沿って衣服や人物画像を縫い合わせることにより、衣服と人物の相互作用を改善する。
単一拡散変圧器(Single-DiT)ブロック内の注意パラメータに対する訓練を制約する。
論文 参考訳(メタデータ) (2025-01-28T07:24:15Z) - RaCFormer: Towards High-Quality 3D Object Detection via Query-based Radar-Camera Fusion [58.77329237533034]
本稿では3次元物体検出の精度を高めるために,Raar-Camera fusion transformer (RaCFormer)を提案する。
RaCFormerは64.9%のmAPと70.2%のNDSをnuScene上で達成し、LiDARベースの検出器よりも優れている。
論文 参考訳(メタデータ) (2024-12-17T09:47:48Z) - TSD-SR: One-Step Diffusion with Target Score Distillation for Real-World Image Super-Resolution [25.994093587158808]
事前訓練されたテキスト-画像拡散モデルが、現実の画像超解像(Real-ISR)タスクにますます応用されている。
拡散モデルの反復的洗練された性質を考えると、既存のアプローチのほとんどは計算的に高価である。
実世界の超高解像度画像に特化して設計された新しい蒸留フレームワークであるTLD-SRを提案する。
論文 参考訳(メタデータ) (2024-11-27T12:01:08Z) - AFIDAF: Alternating Fourier and Image Domain Adaptive Filters as an Efficient Alternative to Attention in ViTs [7.373360108988774]
本稿では,特徴抽出のためのFourierと画像領域フィルタリングを交互に行う手法を提案する。
軽量モデル間の性能はImageNet-1K分類の最先端レベルに達する。
我々のアプローチは、視覚変換器(ViT)を圧縮するための新しいツールとしても機能する。
論文 参考訳(メタデータ) (2024-07-16T23:53:11Z) - Haar Nuclear Norms with Applications to Remote Sensing Imagery Restoration [53.68392692185276]
本稿では,Har Nuclear norm (HNN) という,高効率かつ効率的なリモートセンシング画像復元のための新しい低ランク正規化用語を提案する。
2次元前方スライス-ワイド・ハール離散ウェーブレット変換から導出されるウェーブレット係数の低ランク特性を利用する。
ハイパースペクトル像の着色, マルチテンポラル画像雲の除去, ハイパースペクトル像の脱色実験により, HNNの可能性が明らかとなった。
論文 参考訳(メタデータ) (2024-07-11T13:46:47Z) - Deep-Learning-based Vasculature Extraction for Single-Scan Optical
Coherence Tomography Angiography [9.77526300425824]
我々は,OCTA画像を生成するために1回のOCTスキャンのみを用いる血管抽出パイプラインを提案する。
このパイプラインは、畳み込みプロジェクションを利用して画像パッチ間の空間的関係をよりよく学習する、提案されたVasculature extract Transformer (VET)に基づいている。
論文 参考訳(メタデータ) (2023-04-17T13:55:26Z) - Adversarially-Aware Robust Object Detector [85.10894272034135]
本稿では,ロバスト検出器 (RobustDet) を提案する。
本モデルは, クリーン画像の検出能力を維持しながら, 傾きを効果的に解き, 検出堅牢性を著しく向上させる。
論文 参考訳(メタデータ) (2022-07-13T13:59:59Z) - Improving Vision Transformers by Revisiting High-frequency Components [106.7140968644414]
視覚変換器(ViT)モデルは,CNNモデルよりも画像の高周波成分の捕捉に効果が低いことを示す。
本稿では,画像の高周波成分を直接補うHATを提案する。
HAT は様々な ViT モデルの性能を継続的に向上させることができることを示す。
論文 参考訳(メタデータ) (2022-04-03T05:16:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。