論文の概要: ERVD: An Efficient and Robust ViT-Based Distillation Framework for Remote Sensing Image Retrieval
- arxiv url: http://arxiv.org/abs/2412.18136v1
- Date: Tue, 24 Dec 2024 03:44:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-25 15:55:05.354792
- Title: ERVD: An Efficient and Robust ViT-Based Distillation Framework for Remote Sensing Image Retrieval
- Title(参考訳): ERVD: リモートセンシング画像検索のための高効率でロバストなViTベースの蒸留フレームワーク
- Authors: Le Dong, Qixuan Cao, Lei Pu, Fangfang Wu, Weisheng Dong, Xin Li, Guangming Shi,
- Abstract要約: リモートセンシング画像検索のためのViTベースの蒸留フレームワーク
ERVD: リモートセンシング画像検索のための効率的でロバストなViTベースの蒸留フレームワーク。
- 参考スコア(独自算出の注目度): 43.282237389534934
- License:
- Abstract: ERVD: An Efficient and Robust ViT-Based Distillation Framework for Remote Sensing Image Retrieval
- Abstract(参考訳): ERVD: リモートセンシング画像検索のための高効率でロバストなViTベースの蒸留フレームワーク
関連論文リスト
- RaCFormer: Towards High-Quality 3D Object Detection via Query-based Radar-Camera Fusion [58.77329237533034]
本稿では3次元物体検出の精度を高めるために,Raar-Camera fusion transformer (RaCFormer)を提案する。
RaCFormerは64.9%のmAPと70.2%のNDSをnuScene上で達成し、LiDARベースの検出器よりも優れている。
論文 参考訳(メタデータ) (2024-12-17T09:47:48Z) - TSD-SR: One-Step Diffusion with Target Score Distillation for Real-World Image Super-Resolution [25.994093587158808]
事前訓練されたテキスト-画像拡散モデルが、現実の画像超解像(Real-ISR)タスクにますます応用されている。
拡散モデルの反復的洗練された性質を考えると、既存のアプローチのほとんどは計算的に高価である。
実世界の超高解像度画像に特化して設計された新しい蒸留フレームワークであるTLD-SRを提案する。
論文 参考訳(メタデータ) (2024-11-27T12:01:08Z) - An Explainable Vision Transformer with Transfer Learning Combined with Support Vector Machine Based Efficient Drought Stress Identification [0.0]
視覚変換器(ViT)は、長距離依存を捉え、複雑な空間関係を捉えるための有望な代替手段を提供する。
航空画像を用いたジャガイモの干ばつストレス検出にViTの力を利用する,説明可能なディープラーニングパイプラインを提案する。
以上の結果から, 提案手法は干ばつストレス同定の精度を高めるだけでなく, 干ばつストレスにかかわる多彩な植物の特徴にも光を当てることが示唆された。
論文 参考訳(メタデータ) (2024-07-31T15:08:26Z) - AFIDAF: Alternating Fourier and Image Domain Adaptive Filters as an Efficient Alternative to Attention in ViTs [7.373360108988774]
本稿では,特徴抽出のためのFourierと画像領域フィルタリングを交互に行う手法を提案する。
軽量モデル間の性能はImageNet-1K分類の最先端レベルに達する。
我々のアプローチは、視覚変換器(ViT)を圧縮するための新しいツールとしても機能する。
論文 参考訳(メタデータ) (2024-07-16T23:53:11Z) - Haar Nuclear Norms with Applications to Remote Sensing Imagery Restoration [53.68392692185276]
本稿では,Har Nuclear norm (HNN) という,高効率かつ効率的なリモートセンシング画像復元のための新しい低ランク正規化用語を提案する。
2次元前方スライス-ワイド・ハール離散ウェーブレット変換から導出されるウェーブレット係数の低ランク特性を利用する。
ハイパースペクトル像の着色, マルチテンポラル画像雲の除去, ハイパースペクトル像の脱色実験により, HNNの可能性が明らかとなった。
論文 参考訳(メタデータ) (2024-07-11T13:46:47Z) - 3D Vessel Reconstruction from Sparse-View Dynamic DSA Images via Vessel Probability Guided Attenuation Learning [79.60829508459753]
現在の商用デジタルサブトラクション・アンジオグラフィー(DSA)システムは通常、再構築を行うために数百のスキャンビューを要求する。
スパース・ビューDSA画像のダイナミックな血流と不十分な入力は,3次元血管再建作業において重要な課題である。
本稿では,時間に依存しない容器確率場を用いてこの問題を効果的に解くことを提案する。
論文 参考訳(メタデータ) (2024-05-17T11:23:33Z) - Deep-Learning-based Vasculature Extraction for Single-Scan Optical
Coherence Tomography Angiography [9.77526300425824]
我々は,OCTA画像を生成するために1回のOCTスキャンのみを用いる血管抽出パイプラインを提案する。
このパイプラインは、畳み込みプロジェクションを利用して画像パッチ間の空間的関係をよりよく学習する、提案されたVasculature extract Transformer (VET)に基づいている。
論文 参考訳(メタデータ) (2023-04-17T13:55:26Z) - Adversarially-Aware Robust Object Detector [85.10894272034135]
本稿では,ロバスト検出器 (RobustDet) を提案する。
本モデルは, クリーン画像の検出能力を維持しながら, 傾きを効果的に解き, 検出堅牢性を著しく向上させる。
論文 参考訳(メタデータ) (2022-07-13T13:59:59Z) - Improving Vision Transformers by Revisiting High-frequency Components [106.7140968644414]
視覚変換器(ViT)モデルは,CNNモデルよりも画像の高周波成分の捕捉に効果が低いことを示す。
本稿では,画像の高周波成分を直接補うHATを提案する。
HAT は様々な ViT モデルの性能を継続的に向上させることができることを示す。
論文 参考訳(メタデータ) (2022-04-03T05:16:51Z) - ViT-V-Net: Vision Transformer for Unsupervised Volumetric Medical Image
Registration [6.341962115322295]
画像分類のための視覚変換器(ViT)は、画像の関連部分に焦点を合わせるために長距離空間関係を学習する純粋に自己注意に基づくモデルを使用する。
ViTとConvNetを橋渡しして医療画像登録を行うViT-V-Netを紹介します。
論文 参考訳(メタデータ) (2021-04-13T19:18:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。