論文の概要: Application of image-to-image translation in improving pedestrian
detection
- arxiv url: http://arxiv.org/abs/2209.03625v1
- Date: Thu, 8 Sep 2022 08:07:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-09 12:24:41.466514
- Title: Application of image-to-image translation in improving pedestrian
detection
- Title(参考訳): 画像から画像への変換の歩行者検出改善への応用
- Authors: Devarsh Patel, Sarthak Patel, Megh Patel
- Abstract要約: 本研究では、LLVIPデータセットにPix2pixGANやYOLOv7のような高度なディープラーニングモデルを使用し、低照度ビジョンのための可視赤外画像ペアを含む。
このデータセットには33672の画像が含まれており、ほとんどの画像は暗い場所で撮影され、時間と場所と密に同期している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The lack of effective target regions makes it difficult to perform several
visual functions in low intensity light, including pedestrian recognition, and
image-to-image translation. In this situation, with the accumulation of
high-quality information by the combined use of infrared and visible images it
is possible to detect pedestrians even in low light. In this study we are going
to use advanced deep learning models like pix2pixGAN and YOLOv7 on LLVIP
dataset, containing visible-infrared image pairs for low light vision. This
dataset contains 33672 images and most of the images were captured in dark
scenes, tightly synchronized with time and location.
- Abstract(参考訳): 効果的な目標領域の欠如は、歩行者認識やイメージ・ツー・イメージ翻訳など、低強度光でいくつかの視覚機能を実行するのを困難にしている。
このような状況下では、赤外線と可視画像の併用による高品質な情報の蓄積により、低照度でも歩行者を検出することができる。
本研究では、LLVIPデータセットにPix2pixGANやYOLOv7のような高度なディープラーニングモデルを使用し、低照度ビジョンのための可視赤外画像ペアを含む。
このデータセットには33672の画像が含まれており、ほとんどの画像は暗い場所で撮影され、時間と場所と密に同期している。
関連論文リスト
- Beyond Night Visibility: Adaptive Multi-Scale Fusion of Infrared and
Visible Images [49.75771095302775]
赤外線および可視画像を用いた適応型マルチスケール核融合ネットワーク(AMFusion)を提案する。
まず、赤外画像と可視画像から空間的特徴と意味的特徴を分離し、前者が光分布の調整に使用される。
第2に,事前学習したバックボーンから抽出した検出機能を利用して,意味的特徴の融合を誘導する。
第3に、通常の光強度で融合画像を制約する新しい照明損失を提案する。
論文 参考訳(メタデータ) (2024-03-02T03:52:07Z) - NiteDR: Nighttime Image De-Raining with Cross-View Sensor Cooperative Learning for Dynamic Driving Scenes [49.92839157944134]
夜間の運転シーンでは、不十分で不均一な照明が暗闇の中でシーンを遮蔽し、画質と可視性が低下する。
雨天時の運転シーンに適した画像デライニング・フレームワークを開発した。
雨の人工物を取り除き、風景表現を豊かにし、有用な情報を復元することを目的としている。
論文 参考訳(メタデータ) (2024-02-28T09:02:33Z) - You Only Need One Color Space: An Efficient Network for Low-light Image Enhancement [50.37253008333166]
低照度画像強調(LLIE)タスクは、劣化した低照度画像から詳細と視覚情報を復元する傾向がある。
水平/垂直インテンシティ(HVI)と呼ばれる新しいトレーニング可能なカラー空間を提案する。
輝度と色をRGBチャネルから切り離して、拡張中の不安定性を緩和するだけでなく、トレーニング可能なパラメータによって異なる照明範囲の低照度画像にも適応する。
論文 参考訳(メタデータ) (2024-02-08T16:47:43Z) - Nighttime Thermal Infrared Image Colorization with Feedback-based Object
Appearance Learning [27.58748298687474]
フィードバックに基づくオブジェクト外観学習(FoalGAN)を取り入れた生成的対向ネットワークを提案する。
FoalGANは、小さなオブジェクトの外観学習に有効であるが、意味保存とエッジ整合性の点で、他の画像翻訳方法よりも優れている。
論文 参考訳(メタデータ) (2023-10-24T09:59:55Z) - Enhancing Low-Light Images Using Infrared-Encoded Images [81.8710581927427]
従来の芸術は、主にピクセルワイド・ロスを用いて可視光スペクトルで捉えた低照度画像に焦点を当てていた。
我々は,赤外線カットオフフィルタを除去することにより,低照度環境下で撮影された画像の可視性を高める新しい手法を提案する。
論文 参考訳(メタデータ) (2023-07-09T08:29:19Z) - Enhancing Low-Light Images in Real World via Cross-Image Disentanglement [58.754943762945864]
そこで本研究では,現実の汚職とミスアライメントされたトレーニング画像からなる,新しい低照度画像強調データセットを提案する。
本モデルでは,新たに提案したデータセットと,他の一般的な低照度データセットの両方に対して,最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-01-10T03:12:52Z) - LLVIP: A Visible-infrared Paired Dataset for Low-light Vision [4.453060631960743]
低照度ビジョンのための可視赤外ペアデータセットであるLLVIPを提案する。
このデータセットには30976枚の画像、15488枚の画像が含まれており、そのほとんどは非常に暗い場所で撮影された。
我々は、このデータセットを他の可視赤外線データセットと比較し、人気のあるビジュアルアルゴリズムの性能を評価する。
論文 参考訳(メタデータ) (2021-08-24T16:29:17Z) - Thermal Infrared Image Colorization for Nighttime Driving Scenes with
Top-Down Guided Attention [14.527765677864913]
toP-down attEntion and gRadient aLignment based GAN(PearlGAN)を提案する。
トップダウンガイドアテンションモジュールと精巧なアテンションロスは、翻訳中の意味的エンコーディングの曖昧さを減らすために最初に設計されている。
さらに、FLIRおよびKAISTデータセットのサブセット上で画素レベルのアノテーションを行い、複数の翻訳手法のセマンティックな保存性能を評価する。
論文 参考訳(メタデータ) (2021-04-29T14:35:25Z) - The Cube++ Illumination Estimation Dataset [50.58610459038332]
本稿では,新しい照明推定データセットを提案する。
照明色が既知の4890の画像と、追加のセマンティックデータで構成されている。
データセットは、単一または2つの照度推定を実行するメソッドのトレーニングとテストに使用することができる。
論文 参考訳(メタデータ) (2020-11-19T18:50:08Z) - Towards Geometry Guided Neural Relighting with Flash Photography [26.511476565209026]
本稿では,深層学習を用いた深度マップを用いた1枚のフラッシュ写真から画像のリライティングを行うフレームワークを提案する。
本研究は,本質的な画像分解と画像リライティングにおける最先端の画像ベースアプローチに対する幾何学的アプローチの利点を実験的に検証する。
論文 参考訳(メタデータ) (2020-08-12T08:03:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。