論文の概要: Improved Pothole Detection Using YOLOv7 and ESRGAN
- arxiv url: http://arxiv.org/abs/2401.08588v1
- Date: Fri, 10 Nov 2023 16:22:10 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-22 10:03:41.708508
- Title: Improved Pothole Detection Using YOLOv7 and ESRGAN
- Title(参考訳): YOLOv7とESRGANを用いたポトホール検出の改善
- Authors: Nirmal Kumar Rout, Gyanateet Dutta, Varun Sinha, Arghadeep Dey,
Subhrangshu Mukherjee, Gopal Gupta
- Abstract要約: ポットホール(Pothole)は、自動車に損傷を与え、運転者に安全リスクを与える道路の危険である。
CNNは、Deep Learningメソッドに基づいたオブジェクト検出のために、業界で広く使われている。
本稿では,低分解能カメラや低分解能画像,ビデオフィードを自動ポットホール検出に使用することを保証するために,一意に優れたアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 1.0485739694839669
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Potholes are common road hazards that is causing damage to vehicles and
posing a safety risk to drivers. The introduction of Convolutional Neural
Networks (CNNs) is widely used in the industry for object detection based on
Deep Learning methods and has achieved significant progress in hardware
improvement and software implementations. In this paper, a unique better
algorithm is proposed to warrant the use of low-resolution cameras or
low-resolution images and video feed for automatic pothole detection using
Super Resolution (SR) through Super Resolution Generative Adversarial Networks
(SRGANs). Then we have proceeded to establish a baseline pothole detection
performance on low quality and high quality dashcam images using a You Only
Look Once (YOLO) network, namely the YOLOv7 network. We then have illustrated
and examined the speed and accuracy gained above the benchmark after having
upscaling implementation on the low quality images.
- Abstract(参考訳): ポットホールは、車両にダメージを与え、ドライバーに安全リスクをもたらす一般的な道路の危険である。
畳み込みニューラルネットワーク(CNN)の導入は、ディープラーニング手法に基づくオブジェクト検出の業界で広く使われており、ハードウェアの改善とソフトウェア実装において大きな進歩を遂げている。
本稿では,超高解像度ネットワーク(srgans)による超解像(sr)によるポットホール自動検出のために,低解像度カメラや低解像度画像や映像フィードを用いたユニークなアルゴリズムを提案する。
そこで我々は,YOLO(You Only Look Once)ネットワーク,すなわちYOLOv7ネットワークを用いて,高品質で高品質なダッシュカム画像のベースラインポット検出性能を確立した。
次に,低画質画像へのアップスケール実装後のベンチマークで得られた速度と精度について検討した。
関連論文リスト
- YOLO-FEDER FusionNet: A Novel Deep Learning Architecture for Drone Detection [4.281091463408282]
YOLO-FEDER FusionNetと呼ばれる新しいディープラーニングアーキテクチャを導入する。
従来のアプローチとは異なり、YOLO-FEDER FusionNetは、汎用オブジェクト検出手法とカモフラージュオブジェクト検出技術の特殊強度を組み合わせることで、ドローン検出能力を向上している。
論文 参考訳(メタデータ) (2024-06-17T15:25:31Z) - Exploring Deep Learning Image Super-Resolution for Iris Recognition [50.43429968821899]
重畳自動エンコーダ(SAE)と畳み込みニューラルネットワーク(CNN)の2つの深層学習単一画像超解法手法を提案する。
精度評価と認識実験により,1.872個の近赤外虹彩画像のデータベースを用いて評価を行い,比較アルゴリズムよりも深層学習の方が優れていることを示す。
論文 参考訳(メタデータ) (2023-11-02T13:57:48Z) - SqueezerFaceNet: Reducing a Small Face Recognition CNN Even More Via
Filter Pruning [55.84746218227712]
我々は,100万パラメータ未満の軽量顔認識ネットワークであるSqueezerFaceNetを開発した。
性能を損なうことなく、さらに(最大40%)削減できることを示す。
論文 参考訳(メタデータ) (2023-07-20T08:38:50Z) - LSwinSR: UAV Imagery Super-Resolution based on Linear Swin Transformer [7.3817359680010615]
超高分解能技術は無人航空機(UAV)に特に有用である
本稿では,UAV画像の高分解能化のために,最先端のSwin Transformerに基づく新しいネットワークを提案する。
論文 参考訳(メタデータ) (2023-03-17T20:14:10Z) - Rethinking Resolution in the Context of Efficient Video Recognition [49.957690643214576]
クロスレゾリューションKD(ResKD)は、低解像度フレームでの認識精度を高めるための単純だが効果的な方法である。
我々は,最先端アーキテクチャ,すなわち3D-CNNとビデオトランスフォーマーに対して,その効果を広く示す。
論文 参考訳(メタデータ) (2022-09-26T15:50:44Z) - FOVEA: Foveated Image Magnification for Autonomous Navigation [53.69803081925454]
入力キャンバスを小さく保ちながら、ある領域を弾性的に拡大する注意的アプローチを提案する。
提案手法は,高速R-CNNより高速かつ微調整の少ない検出APを高速化する。
Argoverse-HD と BDD100K の自律走行データセットでは,提案手法が標準の高速 R-CNN を超越した検出APを微調整なしで促進することを示す。
論文 参考訳(メタデータ) (2021-08-27T03:07:55Z) - Improved detection of small objects in road network sequences [0.0]
本稿では,畳み込みニューラルネットワークによる検出に基づく超解像プロセスを適用し,小型物体の検出手法を提案する。
本研究は, 異なるスケールの要素を含むトラヒック画像の集合に対して, モデルにより得られた検出値に従って効率を試験するために試験された。
論文 参考訳(メタデータ) (2021-05-18T10:13:23Z) - D-Unet: A Dual-encoder U-Net for Image Splicing Forgery Detection and
Localization [108.8592577019391]
画像スプライシング偽造検出は、画像指紋によって改ざんされた領域と非改ざんされた領域を区別するグローバルバイナリ分類タスクである。
画像スプライシングフォージェリ検出のためのデュアルエンコーダU-Net(D-Unet)という,固定されていないエンコーダと固定エンコーダを用いた新しいネットワークを提案する。
D-Unetと最先端技術の比較実験において、D-Unetは画像レベルおよび画素レベルの検出において他の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-12-03T10:54:02Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - Small-Object Detection in Remote Sensing Images with End-to-End
Edge-Enhanced GAN and Object Detector Network [9.135036713000513]
超高分解能GAN(ESRGAN)と呼ばれるGANベースモデルでは,画像強調性能が顕著である。
リモートセンシング画像の画質を向上させるために,新しいエッジ強化超解像GAN(EESRGAN)を提案する。
論文 参考訳(メタデータ) (2020-03-20T03:07:30Z) - The Mertens Unrolled Network (MU-Net): A High Dynamic Range Fusion
Neural Network for Through the Windshield Driver Recognition [1.758759574398869]
制約のない環境での顔認識は、光沢、照明の悪さ、ドライバーのポーズ、動きなど、多くのユニークな課題を生んでいる。
我々は、これらの課題を克服するために、カスタム車両イメージングシステムのハードウェアとソフトウェアをさらに発展させます。
我々は、スルーウインドシールド画像のHDR出力を微調整するために、Mertens Unrolled Network (MU-Net) と名付けた。
論文 参考訳(メタデータ) (2020-02-27T16:57:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。