論文の概要: Enhancing Hazy Wildlife Imagery: AnimalHaze3k and IncepDehazeGan
- arxiv url: http://arxiv.org/abs/2604.16284v1
- Date: Fri, 17 Apr 2026 17:46:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-20 22:00:20.037551
- Title: Enhancing Hazy Wildlife Imagery: AnimalHaze3k and IncepDehazeGan
- Title(参考訳): 野生生物画像のエンハンスメント:AnimalHaze3kとIncepDehazeGan
- Authors: Shivarth Rai, Tejeswar Pokuri,
- Abstract要約: AnimalHaze3kは、1,159枚の野生生物の写真から生成される3,477枚の画像からなる合成ハゼのデータセットである。
当社の新規アーキテクチャである IncepDehazeGan は,GAN フレームワークにおける開始ブロックと残留スキップ接続を結合する。
下流検出タスクに適用すると、脱ハズド画像はYOLOv11検出mAPを112%改善し、IoUを67%改善した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Atmospheric haze significantly degrades wildlife imagery, impeding computer vision applications critical for conservation, such as animal detection, tracking, and behavior analysis. To address this challenge, we introduce AnimalHaze3k a synthetic dataset comprising of 3,477 hazy images generated from 1,159 clear wildlife photographs through a physics-based pipeline. Our novel IncepDehazeGan architecture combines inception blocks with residual skip connections in a GAN framework, achieving state-of-the-art performance (SSIM: 0.8914, PSNR: 20.54, and LPIPS: 0.1104), delivering 6.27% higher SSIM and 10.2% better PSNR than competing approaches. When applied to downstream detection tasks, dehazed images improved YOLOv11 detection mAP by 112% and IoU by 67%. These advances can provide ecologists with reliable tools for population monitoring and surveillance in challenging environmental conditions, demonstrating significant potential for enhancing wildlife conservation efforts through robust visual analytics.
- Abstract(参考訳): 大気迷路は野生生物のイメージを著しく劣化させ、動物検出、追跡、行動分析などの保存にとって重要なコンピュータビジョンの応用を妨げる。
この課題に対処するために,1,159枚の鮮明な野生生物写真から生成した3,477枚のハズイ画像からなる合成データセットであるAnimalHaze3kを紹介した。
当社の新たなアーキテクチャである IncepDehazeGan は,GAN フレームワークにおける遅延スキップ接続とインセプションブロックを組み合わせ,最先端性能(SSIM: 0.8914, PSNR: 20.54, LPIPS: 0.1104)を実現し,SSIM が 6.27%,PSNR が 10.2% 向上した。
下流検出タスクに適用すると、脱ハズド画像はYOLOv11検出mAPを112%改善し、IoUを67%改善した。
これらの進歩は生態学者に、厳しい環境条件下での個体群監視と監視のための信頼性の高いツールを提供し、堅牢な視覚分析を通じて野生生物の保護活動を強化する大きな可能性を示す。
関連論文リスト
- Physically-Induced Atmospheric Adversarial Perturbations: Enhancing Transferability and Robustness in Remote Sensing Image Classification [54.952203312050564]
敵対的攻撃は、リモートセンシング(RS)画像分類におけるディープラーニングモデルの信頼性に深刻な脅威をもたらす。
本稿ではフォグフール(FogFool)を提案する。
2つのベンチマークRSデータセットの実験は、FogFoolが優れたパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2026-04-16T05:47:57Z) - Panoramic Affordance Prediction [94.50813972018504]
順応予測は、具体化されたAIにおける知覚と行動の間に重要な橋渡しとなる。
本研究では,360度画像を用いたパノラマ精度予測法について紹介する。
本研究では,ヒトの胎児の視覚系に触発されたトレーニング不要で粗いパイプラインであるPAPを提案する。
論文 参考訳(メタデータ) (2026-03-16T17:21:49Z) - Evaluation of deep learning architectures for wildlife object detection: A comparative study of ResNet and Inception [0.0]
本研究では,野生生物検出におけるResNet-101とInception v3の2つの個別ディープラーニングアーキテクチャの有効性について検討した。
モデルは、標準化された前処理アプローチを用いて野生生物の画像データセットで訓練され、評価された。
ResNet-101モデルでは、分類精度は94%、平均精度は0.91で、階層的な特徴を抽出する上で高い性能を示した。
論文 参考訳(メタデータ) (2025-12-17T14:30:47Z) - Multi-perspective monitoring of wildlife and human activities from camera traps and drones with deep learning models [2.8310300763813645]
この研究は、チトワン国立公園(CNP)、ネパール、および近隣地域で実施された。
深層学習モデルは、野生生物と人間の活動を自動的に識別するために構築された。
この研究は、保存された景観の中で人間の野生生物の衝突を明らかにする。
論文 参考訳(メタデータ) (2025-08-21T14:53:16Z) - AI-Powered Cow Detection in Complex Farm Environments [7.956743113777889]
既存の牛検出アルゴリズムは、現実世界の農業環境において課題に直面している。
本研究では、6つの環境から得られた多様な牛のデータセットを用いてこれらの課題に対処する。
YOLOv8-CBAM は YOLOv8 を2.3%向上させ、95.2% の精度で、mAP@0.5:0.95 の82.6%を達成した。
論文 参考訳(メタデータ) (2025-01-03T19:54:38Z) - AI-Driven Real-Time Monitoring of Ground-Nesting Birds: A Case Study on Curlew Detection Using YOLOv10 [0.07255608805275862]
本研究は,カリュー(Numenius arquata)に着目したAIによるリアルタイム種検出手法を提案する。
カスタムトレーニングされたYOLOv10モデルは、Create AIプラットフォームにリンクされた3/4G対応カメラを使用して、カリューとそのニワトリを検知し、分類するために開発された。
ウェールズの11箇所で、このモデルは高い性能を達成し、感度は90.56%、特異度は100%、F1スコアは95.05%だった。
論文 参考訳(メタデータ) (2024-11-22T10:36:29Z) - NOMAD: A Natural, Occluded, Multi-scale Aerial Dataset, for Emergency Response Scenarios [41.03292974500013]
Natural, Occluded, Multi-scale Aerial dataset (NOMAD) は、人体検知のためのベンチマークデータセットである。
NOMADは100種類のアクターで構成されており、全て歩いたり、横たわったり、隠れたりしている。
42,825フレームを含み、5.4kの解像度ビデオから抽出され、バウンディングボックスと10の異なる視界レベルを示すラベルで手動で注釈付けされている。
論文 参考訳(メタデータ) (2023-09-18T06:57:00Z) - Towards Generating Large Synthetic Phytoplankton Datasets for Efficient
Monitoring of Harmful Algal Blooms [77.25251419910205]
有害な藻類(HAB)は養殖農場で重大な魚死を引き起こす。
現在、有害藻や他の植物プランクトンを列挙する標準的な方法は、顕微鏡でそれらを手動で観察し数えることである。
合成画像の生成にはGAN(Generative Adversarial Networks)を用いる。
論文 参考訳(メタデータ) (2022-08-03T20:15:55Z) - Potato Crop Stress Identification in Aerial Images using Deep
Learning-based Object Detection [60.83360138070649]
本稿では, 深層ニューラルネットワークを用いたジャガイモの空中画像解析手法を提案する。
主な目的は、植物レベルでの健康作物とストレス作物の自動空間認識を実証することである。
実験により、フィールド画像中の健康植物とストレス植物を識別し、平均Dice係数0.74を達成できることを示した。
論文 参考訳(メタデータ) (2021-06-14T21:57:40Z) - Unifying data for fine-grained visual species classification [15.14767769034929]
465種にまたがる2.9M画像に基づいて訓練した,初期の深部畳み込みニューラルネットワークモデルを提案する。
長期的な目標は、科学者が種数と人口の健康状態のほぼリアルタイムでの分析から、保護的なレコメンデーションを行うことである。
論文 参考訳(メタデータ) (2020-09-24T01:04:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。