論文の概要: Enhanced Pix2Pix GAN for Visual Defect Removal in UAV-Captured Images
- arxiv url: http://arxiv.org/abs/2409.06889v1
- Date: Tue, 10 Sep 2024 22:16:41 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-12 16:16:15.048296
- Title: Enhanced Pix2Pix GAN for Visual Defect Removal in UAV-Captured Images
- Title(参考訳): UAV撮像画像の視覚的欠陥除去のためのPix2Pix GANの改良
- Authors: Volodymyr Rizun,
- Abstract要約: 本稿では,UAV撮像画像から視覚的欠陥を効果的に除去するニューラルネットワークを提案する。
Pix2Pix GANは、UAV画像の視覚的欠陥に対処するために特別に設計された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a neural network that effectively removes visual defects from UAV-captured images. It features an enhanced Pix2Pix GAN, specifically engineered to address visual defects in UAV imagery. The method incorporates advanced modifications to the Pix2Pix architecture, targeting prevalent issues such as mode collapse. The suggested method facilitates significant improvements in the quality of defected UAV images, yielding cleaner and more precise visual results. The effectiveness of the proposed approach is demonstrated through evaluation on a custom dataset of aerial photographs, highlighting its capability to refine and restore UAV imagery effectively.
- Abstract(参考訳): 本稿では,UAV撮像画像から視覚的欠陥を効果的に除去するニューラルネットワークを提案する。
Pix2Pix GANは、UAV画像の視覚的欠陥に対処するために特別に設計された。
この手法にはPix2Pixアーキテクチャの高度な修正が含まれており、モード崩壊のような一般的な問題をターゲットにしている。
提案手法は、欠陥のあるUAV画像の品質を大幅に向上させ、よりクリーンでより正確な視覚的結果をもたらす。
提案手法の有効性は、航空写真のカスタムデータセットの評価を通じて実証され、UAV画像の精細化と復元を効果的に行う能力を強調している。
関連論文リスト
- Learning Efficient and Effective Trajectories for Differential Equation-based Image Restoration [59.744840744491945]
我々は, この手法の軌道最適化を再構築し, 復元品質と効率の両立に焦点をあてる。
本稿では,複雑な経路を適応可能なサイズで複数の管理可能なステップに合理化するためのコスト対応トラジェクトリー蒸留法を提案する。
実験では提案手法の有意な優位性を示し, 最先端手法よりも最大2.1dBのPSNR改善を実現した。
論文 参考訳(メタデータ) (2024-10-07T07:46:08Z) - Diffusion Model Based Visual Compensation Guidance and Visual Difference
Analysis for No-Reference Image Quality Assessment [82.13830107682232]
本稿では, 複雑な関係をモデル化する能力を示す, 最先端(SOTA)生成モデルを提案する。
生成した拡張画像とノイズを含む画像を利用する新しい拡散復元ネットワークを考案する。
2つの視覚評価枝は、得られた高レベル特徴情報を包括的に解析するように設計されている。
論文 参考訳(メタデータ) (2024-02-22T09:39:46Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - Image Reconstruction using Enhanced Vision Transformer [0.08594140167290097]
画像のデノイング,デブロアリング,インペイントといったタスクに使用できる新しい画像再構成フレームワークを提案する。
このプロジェクトで提案されるモデルは、2次元画像を入力として取り込んで埋め込みを出力するビジョントランスフォーマー(ViT)に基づいている。
モデル再構築機能を改善するために,フレームワークに4つの最適化手法を組み込んだ。
論文 参考訳(メタデータ) (2023-07-11T02:14:18Z) - Uncertainty Aware Multitask Pyramid Vision Transformer For UAV-Based
Object Re-Identification [38.19907319079833]
UAVベースのオブジェクトReIDのバックボーンとして、畳み込みのない新しいマルチスケールアーキテクチャであるPraamid Vision Transformer(PVT)を用いるマルチタスク学習手法を提案する。
クラス内変動の不確実性モデリングにより、不確実性認識オブジェクトIDとカメラID情報の両方を用いて、提案手法を協調的に最適化することができる。
論文 参考訳(メタデータ) (2022-09-19T00:27:07Z) - High-Resolution UAV Image Generation for Sorghum Panicle Detection [23.88932181375298]
本稿では,データ拡張のためのGAN(Generative Adversarial Network)からの合成トレーニング画像を用いて,ソルガムパニックの検出とカウントの性能を向上させる手法を提案する。
提案手法は,実際のUAV RGB画像の地上真実データセットを限定した画像から画像への変換GANを用いて,パニックラベルを用いた合成高解像度UAV RGB画像を生成することができる。
論文 参考訳(メタデータ) (2022-05-08T20:26:56Z) - RestoreX-AI: A Contrastive Approach towards Guiding Image Restoration
via Explainable AI Systems [8.430502131775722]
気象汚染は物体の検知可能性を妨げ、ナビゲーションと信頼性に深刻な脅威をもたらす可能性がある。
本稿では,修復モデルによる画像の評価とポストトレーニングによる画像の評価により,この問題の緩和に向けた対照的なアプローチを提案する。
気象条件下での入力画像と復元画像の間に平均178%のmAP増加が達成された。
論文 参考訳(メタデータ) (2022-04-03T12:45:00Z) - Dual Perceptual Loss for Single Image Super-Resolution Using ESRGAN [13.335546116599494]
本稿では,従来の知覚損失を置き換えるためにDP損失(Dual Perceptual Loss)と呼ばれる手法を提案する。
VGG特徴とResNet特徴の相補的な性質のため、提案されたDPロスは2つの特徴を同時に学習する利点を考察する。
ベンチマークデータセットの定性的および定量的解析により,提案手法が最先端の超解像法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-01-17T12:42:56Z) - Adversarial Domain Feature Adaptation for Bronchoscopic Depth Estimation [111.89519571205778]
そこで本研究では,深度推定のためのドメイン適応手法を提案する。
提案する2段階構造は,まず,ラベル付き合成画像を用いた深度推定ネットワークを教師付きで訓練する。
実験の結果,提案手法は実画像上でのネットワーク性能をかなりの差で向上させることがわかった。
論文 参考訳(メタデータ) (2021-09-24T08:11:34Z) - Towards Unsupervised Deep Image Enhancement with Generative Adversarial
Network [92.01145655155374]
監視されていない画像強調生成ネットワーク(UEGAN)を提案する。
教師なしの方法で所望の特性を持つ画像の集合から、対応する画像と画像のマッピングを学習する。
その結果,提案モデルは画像の美的品質を効果的に向上することがわかった。
論文 参考訳(メタデータ) (2020-12-30T03:22:46Z) - Gated Fusion Network for Degraded Image Super Resolution [78.67168802945069]
本稿では,基本特徴と回復特徴を別々に抽出する二分岐畳み込みニューラルネットワークを提案する。
特徴抽出ステップを2つのタスク非依存ストリームに分解することで、デュアルブランチモデルがトレーニングプロセスを容易にすることができる。
論文 参考訳(メタデータ) (2020-03-02T13:28:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。