論文の概要: DroneSR: Rethinking Few-shot Thermal Image Super-Resolution from Drone-based Perspective
- arxiv url: http://arxiv.org/abs/2509.01898v1
- Date: Tue, 02 Sep 2025 02:37:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.886144
- Title: DroneSR: Rethinking Few-shot Thermal Image Super-Resolution from Drone-based Perspective
- Title(参考訳): DroneSR:ドローンをベースとした超高解像度熱画像の再検討
- Authors: Zhipeng Weng, Xiaopeng Liu, Ce Liu, Xingyuan Guo, Yukai Shi, Liang Lin,
- Abstract要約: 画像上の超分解能タスクでは、生成モデルの代表としての拡散モデルは通常、大規模なアーキテクチャを採用する。
ドローンが捕獲した赤外線のトレーニングデータはほとんどないが、大規模なアーキテクチャでは過度なオーバーフィッティングをしばしば引き起こす。
本稿では,過度な適合を緩和し,ロバスト性を高める拡散モデルに指向した新しいガウス量子化表現学習法を提案する。
- 参考スコア(独自算出の注目度): 50.887173519116196
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Although large scale models achieve significant improvements in performance, the overfitting challenge still frequently undermines their generalization ability. In super resolution tasks on images, diffusion models as representatives of generative models typically adopt large scale architectures. However, few-shot drone-captured infrared training data frequently induces severe overfitting in large-scale architectures. To address this key challenge, our method proposes a new Gaussian quantization representation learning method oriented to diffusion models that alleviates overfitting and enhances robustness. At the same time, an effective monitoring mechanism tracks large scale architectures during training to detect signs of overfitting. By introducing Gaussian quantization representation learning, our method effectively reduces overfitting while maintaining architecture complexity. On this basis, we construct a multi source drone-based infrared image benchmark dataset for detection and use it to emphasize overfitting issues of large scale architectures in few sample, drone-based diverse drone-based image reconstruction scenarios. To verify the efficacy of the method in mitigating overfitting, experiments are conducted on the constructed benchmark. Experimental results demonstrate that our method outperforms existing super resolution approaches and significantly mitigates overfitting of large scale architectures under complex conditions. The code and DroneSR dataset will be available at: https://github.com/wengzp1/GARLSR.
- Abstract(参考訳): 大規模なモデルでは性能が大幅に向上するが、オーバーフィッティングの課題は依然としてその一般化能力を損なうことが多い。
画像上の超分解能タスクでは、生成モデルの代表としての拡散モデルは通常、大規模なアーキテクチャを採用する。
しかし、ドローンが捕獲した赤外線のトレーニングデータはほとんどないため、大規模なアーキテクチャでは過度なオーバーフィッティングが頻繁に発生する。
この課題に対処するため,本手法では,過度な適合を緩和し,ロバスト性を高める拡散モデルに指向した新しいガウス量子化表現学習法を提案する。
同時に、効果的な監視メカニズムは、トレーニング中に大規模なアーキテクチャを追跡し、オーバーフィッティングの兆候を検出する。
ガウス量子化表現学習を導入することで、アーキテクチャの複雑さを維持しながら、オーバーフィッティングを効果的に削減できる。
そこで本研究では,マルチソースのドローンベース赤外線画像ベンチマークデータセットを構築し,大規模アーキテクチャの過度に適合する問題を,少数のドローンベース多様なドローンベース画像再構成シナリオで強調する。
オーバーフィッティングを緩和する手法の有効性を検証するため, 構築したベンチマークを用いて実験を行った。
実験の結果,提案手法は既存の超解像法よりも優れており,複雑な条件下での大規模アーキテクチャの過度な適合を著しく軽減していることがわかった。
コードとDroneSRデータセットは、https://github.com/wengzp1/GARLSRで利用可能になる。
関連論文リスト
- Hierarchical Information Flow for Generalized Efficient Image Restoration [108.83750852785582]
画像復元のための階層型情報フロー機構であるHi-IRを提案する。
Hi-IRは、劣化した画像を表す階層的な情報ツリーを3段階にわたって構築する。
7つの共通画像復元タスクにおいて、Hi-IRはその有効性と一般化性を達成する。
論文 参考訳(メタデータ) (2024-11-27T18:30:08Z) - DiffuseHigh: Training-free Progressive High-Resolution Image Synthesis through Structure Guidance [11.44012694656102]
テキストから画像への拡散モデルのような大規模生成モデルは、様々な領域で広く注目を集めている。
既存の大規模拡散モデルでは、最大1K解像度の画像を生成できる。
本稿では,高分解能画像の生成を導くために,生成した低分解能画像を完全に活用する新しいプログレッシブアプローチを提案する。
論文 参考訳(メタデータ) (2024-06-26T16:10:31Z) - Object Detection in Aerial Images in Scarce Data Regimes [0.0]
小さな物体は、より多数の空中画像において、自然画像と空中画像の間の明らかなパフォーマンスギャップの原因となっている。
FSOD法の訓練と評価を改善するスケール適応型ボックス類似度基準を提案する。
また、計量学習と微調整に基づく2つの異なるアプローチによる汎用FSODにも貢献する。
論文 参考訳(メタデータ) (2023-10-16T14:16:47Z) - Hierarchical Integration Diffusion Model for Realistic Image Deblurring [71.76410266003917]
拡散モデル (DM) は画像劣化に導入され, 有望な性能を示した。
本稿では,階層型統合拡散モデル(HI-Diff)を提案する。
人工的および実世界のぼかしデータセットの実験は、HI-Diffが最先端の手法より優れていることを示した。
論文 参考訳(メタデータ) (2023-05-22T12:18:20Z) - Near-filed SAR Image Restoration with Deep Learning Inverse Technique: A
Preliminary Study [5.489791364472879]
近接場合成開口レーダ(SAR)は、ターゲットの散乱分布ホットスポットの高解像度画像を提供する。
一方、撮像の結果は、サイドローブ、クラッタ、ノイズから必然的に劣化する。
イメージを復元するために、現在の手法では、例えば、点拡散関数(PSF)は空間的に一貫したものであり、ターゲットはスパース点散乱器などで構成されている。
我々は、分解モデルを空間的に可変な複素畳み込みモデルに再構成し、近接場SARのシステム応答を考慮した。
モデルに基づくディープラーニングネットワークは、復元するために設計されている
論文 参考訳(メタデータ) (2022-11-28T01:28:33Z) - Sci-Net: a Scale Invariant Model for Building Detection from Aerial
Images [0.0]
本研究では,空間分解能の異なる空間画像に存在している建物を分割できるスケール不変ニューラルネットワーク(Sci-Net)を提案する。
具体的には,U-Netアーキテクチャを改良し,それを高密度なASPP(Atrous Space Pyramid Pooling)で融合し,微細なマルチスケール表現を抽出した。
論文 参考訳(メタデータ) (2021-11-12T16:45:20Z) - Efficient texture-aware multi-GAN for image inpainting [5.33024001730262]
近年のGAN (Generative Adversarial Network) のインペイント手法は顕著に改善されている。
本稿では,性能とレンダリング効率の両方を改善するマルチGANアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-09-30T14:58:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。