Fugu-MT 論文翻訳(概要): ERVD: An Efficient and Robust ViT-Based Distillation Framework for Remote Sensing Image Retrieval

関連論文リスト

RefSR-Adv: Adversarial Attack on Reference-based Image Super-Resolution Models [0.0]
RefSR-Advは、参照画像のみを摂動することでSR出力を劣化させる敵攻撃である。実験では、低解像度入力と参照画像の類似性と攻撃効果との間に正の相関が認められた。この研究は、RefSRシステムのセキュリティ脆弱性を明らかにし、研究者にRefSRの堅牢性への注意を促すことを目的としている。
論文参考訳（メタデータ） (2026-01-03T14:59:15Z)
One-Step Diffusion-based Real-World Image Super-Resolution with Visual Perception Distillation [53.24542646616045]
画像超解像(SR)生成に特化して設計された新しい視覚知覚拡散蒸留フレームワークであるVPD-SRを提案する。 VPD-SRは2つのコンポーネントから構成される: 明示的セマンティック・アウェア・スーパービジョン(ESS)と高周波知覚(HFP)損失。提案したVPD-SRは,従来の最先端手法と教師モデルの両方と比較して,たった1ステップのサンプリングで優れた性能が得られる。
論文参考訳（メタデータ） (2025-06-03T08:28:13Z)
Embedding Radiomics into Vision Transformers for Multimodal Medical Image Classification [10.627136212959396]
ビジョントランスフォーマー(ViT)は、自己注意を通じて長距離依存をモデル化することで、畳み込みモデルの強力な代替手段を提供する。本稿では、放射能特徴とデータ駆動型視覚埋め込みをViTバックボーン内に組み込んだRE-ViT(Radiomics-Embedded Vision Transformer)を提案する。
論文参考訳（メタデータ） (2025-04-15T06:55:58Z)
One-Step Residual Shifting Diffusion for Image Super-Resolution via Distillation [90.84654430620971]
超解像(SR)の拡散モデルは高品質な視覚結果を生成するが、高価な計算コストを必要とする。本稿では,拡散型SRモデルの1つであるResShiftの新しい蒸留法であるRSDを提案する。本手法は,学生ネットワークを訓練し,その上で訓練した新しい偽ResShiftモデルが教師モデルと一致するような画像を生成することに基づいている。
論文参考訳（メタデータ） (2025-03-17T16:44:08Z)
ITVTON: Virtual Try-On Diffusion Transformer Based on Integrated Image and Text [11.85544970521423]
画像品質を向上させるためにDiffusion Transformer (DiT) をジェネレータとして利用する ITVTON を導入する。 ITVTONは、空間チャネルに沿って衣服や人物画像を縫い合わせることにより、衣服と人物の相互作用を改善する。単一拡散変圧器(Single-DiT)ブロック内の注意パラメータに対する訓練を制約する。
論文参考訳（メタデータ） (2025-01-28T07:24:15Z)
RaCFormer: Towards High-Quality 3D Object Detection via Query-based Radar-Camera Fusion [58.77329237533034]
本稿では3次元物体検出の精度を高めるために,Raar-Camera fusion transformer (RaCFormer)を提案する。 RaCFormerは64.9%のmAPと70.2%のNDSをnuScene上で達成し、LiDARベースの検出器よりも優れている。
論文参考訳（メタデータ） (2024-12-17T09:47:48Z)
TSD-SR: One-Step Diffusion with Target Score Distillation for Real-World Image Super-Resolution [25.994093587158808]
事前訓練されたテキスト-画像拡散モデルが、現実の画像超解像(Real-ISR)タスクにますます応用されている。拡散モデルの反復的洗練された性質を考えると、既存のアプローチのほとんどは計算的に高価である。実世界の超高解像度画像に特化して設計された新しい蒸留フレームワークであるTLD-SRを提案する。
論文参考訳（メタデータ） (2024-11-27T12:01:08Z)
AFIDAF: Alternating Fourier and Image Domain Adaptive Filters as an Efficient Alternative to Attention in ViTs [7.373360108988774]
本稿では,特徴抽出のためのFourierと画像領域フィルタリングを交互に行う手法を提案する。軽量モデル間の性能はImageNet-1K分類の最先端レベルに達する。我々のアプローチは、視覚変換器(ViT)を圧縮するための新しいツールとしても機能する。
論文参考訳（メタデータ） (2024-07-16T23:53:11Z)
Haar Nuclear Norms with Applications to Remote Sensing Imagery Restoration [53.68392692185276]
本稿では,Har Nuclear norm (HNN) という,高効率かつ効率的なリモートセンシング画像復元のための新しい低ランク正規化用語を提案する。 2次元前方スライス-ワイド・ハール離散ウェーブレット変換から導出されるウェーブレット係数の低ランク特性を利用する。ハイパースペクトル像の着色, マルチテンポラル画像雲の除去, ハイパースペクトル像の脱色実験により, HNNの可能性が明らかとなった。
論文参考訳（メタデータ） (2024-07-11T13:46:47Z)
Deep-Learning-based Vasculature Extraction for Single-Scan Optical Coherence Tomography Angiography [9.77526300425824]
我々は,OCTA画像を生成するために1回のOCTスキャンのみを用いる血管抽出パイプラインを提案する。このパイプラインは、畳み込みプロジェクションを利用して画像パッチ間の空間的関係をよりよく学習する、提案されたVasculature extract Transformer (VET)に基づいている。
論文参考訳（メタデータ） (2023-04-17T13:55:26Z)
KD-DETR: Knowledge Distillation for Detection Transformer with Consistent Distillation Points Sampling [52.11242317111469]
我々は、知識蒸留によるDETRの圧縮に焦点を当てる。 DETR蒸留の主な課題は、一貫した蒸留点の欠如である。本稿では,一貫した蒸留点サンプリングによるDETRのための最初の一般知識蒸留パラダイムを提案する。
論文参考訳（メタデータ） (2022-11-15T11:52:30Z)
Adversarially-Aware Robust Object Detector [85.10894272034135]
本稿では,ロバスト検出器 (RobustDet) を提案する。本モデルは, クリーン画像の検出能力を維持しながら, 傾きを効果的に解き, 検出堅牢性を著しく向上させる。
論文参考訳（メタデータ） (2022-07-13T13:59:59Z)
Improving Vision Transformers by Revisiting High-frequency Components [106.7140968644414]
視覚変換器(ViT)モデルは,CNNモデルよりも画像の高周波成分の捕捉に効果が低いことを示す。本稿では,画像の高周波成分を直接補うHATを提案する。 HAT は様々な ViT モデルの性能を継続的に向上させることができることを示す。
論文参考訳（メタデータ） (2022-04-03T05:16:51Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

論文の概要: ERVD: An Efficient and Robust ViT-Based Distillation Framework for Remote Sensing Image Retrieval

関連論文リスト