論文の概要: Adaptive Object Detection with ESRGAN-Enhanced Resolution & Faster R-CNN
- arxiv url: http://arxiv.org/abs/2506.11122v1
- Date: Tue, 10 Jun 2025 05:49:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-16 17:50:49.485243
- Title: Adaptive Object Detection with ESRGAN-Enhanced Resolution & Faster R-CNN
- Title(参考訳): ESRGAN強化解像度と高速R-CNNによる適応物体検出
- Authors: Divya Swetha K, Ziaul Haque Choudhury, Hemanta Kumar Bhuyan, Biswajit Brahma, Nilayam Kumar Kamila,
- Abstract要約: 高速領域畳み込みニューラルネットワーク (Faster R-CNN) と高分解能生成共振器ネットワーク (ESRGAN) を提案する。
ESRGANは低画質の画像を改善し、詳細を復元し、明瞭さを向上させる。
より高速なR-CNNは、拡張画像上で正確なオブジェクト検出を行う。
- 参考スコア(独自算出の注目度): 1.3107174618549584
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this study, proposes a method for improved object detection from the low-resolution images by integrating Enhanced Super-Resolution Generative Adversarial Networks (ESRGAN) and Faster Region-Convolutional Neural Network (Faster R-CNN). ESRGAN enhances low-quality images, restoring details and improving clarity, while Faster R-CNN performs accurate object detection on the enhanced images. The combination of these techniques ensures better detection performance, even with poor-quality inputs, offering an effective solution for applications where image resolution is in consistent. ESRGAN is employed as a pre-processing step to enhance the low-resolution input image, effectively restoring lost details and improving overall image quality. Subsequently, the enhanced image is fed into the Faster R-CNN model for accurate object detection and localization. Experimental results demonstrate that this integrated approach yields superior performance compared to traditional methods applied directly to low-resolution images. The proposed framework provides a promising solution for applications where image quality is variable or limited, enabling more robust and reliable object detection in challenging scenarios. It achieves a balance between improved image quality and efficient object detection
- Abstract(参考訳): 本研究では,低解像度画像からの物体検出を,高解像度の超解像生成支援ネットワーク (ESRGAN) と高速領域畳み込みニューラルネットワーク (Faster R-CNN) を統合して改善する手法を提案する。
ESRGANは低画質の画像を向上し、詳細を復元し、明快さを向上する一方、Faster R-CNNは、拡張された画像に対して正確なオブジェクト検出を行う。
これらの技術を組み合わせることで、画質の悪い入力であっても検出性能が向上し、画像解像度が一貫したアプリケーションに効果的なソリューションを提供する。
ESRGANは、低解像度の入力画像を強化し、失われた詳細を効果的に復元し、全体的な画質を向上させるための前処理ステップとして使用される。
その後、拡張画像をFaster R-CNNモデルに入力し、正確な物体検出と位置決めを行う。
実験により, この統合手法は, 低解像度画像に対して直接適用される従来の手法に比べ, 優れた性能を示すことが示された。
提案するフレームワークは,画像品質が可変あるいは制限されたアプリケーションに対して,より堅牢で信頼性の高いオブジェクト検出を可能にする,有望なソリューションを提供する。
改良された画像品質と効率的な物体検出のバランスを実現する
関連論文リスト
- A Tree-guided CNN for image super-resolution [50.30242741813306]
画像超解像のためのツリー誘導CNN(TSRNet)を設計する。
ツリーアーキテクチャを使ってディープネットワークを誘導し、キーノードの効果を高め、階層的な情報の関係を増幅する。
得られた構造情報の不足を防止するため、TSRNetのコサイン変換技術を用いて画像超解像の性能を向上させる。
論文 参考訳(メタデータ) (2025-06-03T08:05:11Z) - Sewer Image Super-Resolution with Depth Priors and Its Lightweight Network [11.13549330516683]
クイックビュー(QV)技術は下水道システム内の欠陥を検出する主要な方法である。
超解像度は画像品質を改善する効果的な方法であり、様々な場面で応用されている。
本研究では, DSRNet で表される新しい深層誘導参照型超解法フレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-27T14:45:34Z) - Efficient Visual State Space Model for Image Deblurring [99.54894198086852]
畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)は、画像復元において優れた性能を発揮している。
本稿では,画像のデブロアに対する簡易かつ効果的な視覚状態空間モデル(EVSSM)を提案する。
提案したEVSSMは、ベンチマークデータセットや実世界の画像に対する最先端の手法に対して好意的に機能する。
論文 参考訳(メタデータ) (2024-05-23T09:13:36Z) - Improving Performance of Object Detection using the Mechanisms of Visual
Recognition in Humans [0.4297070083645048]
我々はまず、画像解像度の関数として最先端のディープオブジェクト認識ネットワークであるFaster-RCNNの性能を追跡する。
また、認識過程において、異なる空間周波数が物体に関する異なる情報を伝えることも示している。
単分解能ネットワークではなく,多分解能オブジェクト認識フレームワークを提案する。
論文 参考訳(メタデータ) (2023-01-23T19:09:36Z) - Exploring Resolution and Degradation Clues as Self-supervised Signal for
Low Quality Object Detection [77.3530907443279]
劣化した低解像度画像中の物体を検出するための,新しい自己教師型フレームワークを提案する。
本手法は, 既存手法と比較して, 異変劣化状況に直面する場合に比べ, 優れた性能を示した。
論文 参考訳(メタデータ) (2022-08-05T09:36:13Z) - Image Super-resolution with An Enhanced Group Convolutional Neural
Network [102.2483249598621]
学習能力の強いCNNは、超解像問題を解くために広く選択されている。
浅層構造を持つ超解像群CNN(ESRGCNN)を提案する。
ESRGCNNは、SISRの性能、複雑さ、実行速度、画質評価およびSISRの視覚効果の観点から、最先端技術を上回っていると報告されている。
論文 参考訳(メタデータ) (2022-05-29T00:34:25Z) - Learning Enriched Features for Fast Image Restoration and Enhancement [166.17296369600774]
本稿では,ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とする。
我々は、高解像度の空間的詳細を同時に保存しながら、複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
提案手法は,デフォーカス・デブロアリング,画像デノイング,超解像,画像強調など,さまざまな画像処理タスクに対して,最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2022-04-19T17:59:45Z) - Efficient texture-aware multi-GAN for image inpainting [5.33024001730262]
近年のGAN (Generative Adversarial Network) のインペイント手法は顕著に改善されている。
本稿では,性能とレンダリング効率の両方を改善するマルチGANアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-09-30T14:58:03Z) - Small-Object Detection in Remote Sensing Images with End-to-End
Edge-Enhanced GAN and Object Detector Network [9.135036713000513]
超高分解能GAN(ESRGAN)と呼ばれるGANベースモデルでは,画像強調性能が顕著である。
リモートセンシング画像の画質を向上させるために,新しいエッジ強化超解像GAN(EESRGAN)を提案する。
論文 参考訳(メタデータ) (2020-03-20T03:07:30Z) - Learning Enriched Features for Real Image Restoration and Enhancement [166.17296369600774]
畳み込みニューラルネットワーク(CNN)は、画像復元作業における従来のアプローチよりも劇的に改善されている。
ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とした,新しいアーキテクチャを提案する。
提案手法は,高解像度の空間的詳細を同時に保存しながら,複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
論文 参考訳(メタデータ) (2020-03-15T11:04:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。