論文の概要: An Ensemble Model for Distorted Images in Real Scenarios
- arxiv url: http://arxiv.org/abs/2309.14998v1
- Date: Tue, 26 Sep 2023 15:12:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-27 13:13:43.334317
- Title: An Ensemble Model for Distorted Images in Real Scenarios
- Title(参考訳): 実シナリオにおける歪画像のアンサンブルモデル
- Authors: Boyuan Ji, Jianchang Huang, Wenzhuo Huang, Shuke He
- Abstract要約: 本稿では,オブジェクト検出器YOLOv7を用いてCDCOCOデータセットから歪み画像を検出する。
慎重に設計した最適化により,CDCOCOテストセット上での優れた性能を実現する。
我々のデノナイジング検出モデルは、歪んだ画像をデノナイズし、修復することができるため、様々な現実のシナリオや環境において有用である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image acquisition conditions and environments can significantly affect
high-level tasks in computer vision, and the performance of most computer
vision algorithms will be limited when trained on distortion-free datasets.
Even with updates in hardware such as sensors and deep learning methods, it
will still not work in the face of variable conditions in real-world
applications. In this paper, we apply the object detector YOLOv7 to detect
distorted images from the dataset CDCOCO. Through carefully designed
optimizations including data enhancement, detection box ensemble, denoiser
ensemble, super-resolution models, and transfer learning, our model achieves
excellent performance on the CDCOCO test set. Our denoising detection model can
denoise and repair distorted images, making the model useful in a variety of
real-world scenarios and environments.
- Abstract(参考訳): 画像取得条件と環境はコンピュータビジョンのハイレベルなタスクに大きく影響し、歪みのないデータセットでトレーニングされた場合、ほとんどのコンピュータビジョンアルゴリズムのパフォーマンスは制限される。
センサーやディープラーニングメソッドなどのハードウェアのアップデートであっても、現実世界のアプリケーションでは、さまざまな条件に直面しては動作しない。
本稿では、オブジェクト検出器YOLOv7を用いて、データセットCDCOCOから歪んだ画像を検出する。
データエンハンスメント、検出ボックスアンサンブル、デノイザーアンサンブル、超解像モデル、転送学習など、慎重に設計された最適化により、本モデルはCDCOCOテストセット上で優れた性能を達成する。
ノイズ検出モデルは歪んだ画像のノイズや修復が可能であり,実世界の様々なシナリオや環境において有用である。
関連論文リスト
- BEHAVIOR Vision Suite: Customizable Dataset Generation via Simulation [57.40024206484446]
我々は、コンピュータビジョンモデルの体系的評価のために、完全にカスタマイズされた合成データを生成するためのツールと資産のセットであるBEHAVIOR Vision Suite(BVS)を紹介する。
BVSはシーンレベルで多数の調整可能なパラメータをサポートする。
アプリケーションシナリオを3つ紹介する。
論文 参考訳(メタデータ) (2024-05-15T17:57:56Z) - Deep Domain Adaptation: A Sim2Real Neural Approach for Improving Eye-Tracking Systems [80.62854148838359]
眼球画像のセグメンテーションは、最終視線推定に大きな影響を及ぼす眼球追跡の重要なステップである。
対象視線画像と合成訓練データとの重なり合いを測定するために,次元還元法を用いている。
提案手法は,シミュレーションと実世界のデータサンプルの相違に対処する際の頑健で,性能が向上する。
論文 参考訳(メタデータ) (2024-03-23T22:32:06Z) - Real-Time Object Detection in Occluded Environment with Background
Cluttering Effects Using Deep Learning [0.8192907805418583]
混在した環境下での車やタンクのリアルタイム検出のためのディープラーニングモデルに集中する。
開発した手法は、カスタムデータセットを作成し、ノイズの多いデータセットをきれいにするために前処理技術を使用する。
SSD-Mobilenet v2モデルの精度とフレームは、YOLO V3やYOLO V4よりも高い。
論文 参考訳(メタデータ) (2024-01-02T01:30:03Z) - CD-COCO: A Versatile Complex Distorted COCO Database for
Scene-Context-Aware Computer Vision [6.48583124646155]
画像取得条件は、ハイレベル画像処理の性能に大きな影響を及ぼす。
我々はMS-COCOデータベースから派生した汎用データベースを構築した。
シーンコンテキストを考慮した新たな局所歪みが発生する。
論文 参考訳(メタデータ) (2023-11-12T22:28:19Z) - Let Segment Anything Help Image Dehaze [12.163299570927302]
低レベルコンピュータビジョンタスクに先立って,大規模モデルを統合するためのフレームワークを提案する。
低レベル視覚タスクの導出における大規模モデルの有効性と適用性を示す。
論文 参考訳(メタデータ) (2023-06-28T02:02:19Z) - Bilevel Fast Scene Adaptation for Low-Light Image Enhancement [50.639332885989255]
低照度シーンにおける画像の強調は、コンピュータビジョンにおいて難しいが、広く懸念されている課題である。
主な障害は、異なるシーンにまたがる分散の相違によるモデリングの混乱にある。
上述の潜在対応をモデル化するための双レベルパラダイムを導入する。
エンコーダのシーン非関連な一般化を多様なシーンにもたらすために、双方向学習フレームワークを構築した。
論文 参考訳(メタデータ) (2023-06-02T08:16:21Z) - Benchmarking performance of object detection under image distortions in
an uncontrolled environment [0.483420384410068]
オブジェクト検出アルゴリズムの堅牢性は、現実世界のアプリケーションにおいて顕著な役割を果たす。
物体検出法の性能は, 被写体内歪みに悩まされていることが証明されている。
本稿では,最先端のオブジェクト検出手法の性能評価フレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-28T09:06:52Z) - Exploring Resolution and Degradation Clues as Self-supervised Signal for
Low Quality Object Detection [77.3530907443279]
劣化した低解像度画像中の物体を検出するための,新しい自己教師型フレームワークを提案する。
本手法は, 既存手法と比較して, 異変劣化状況に直面する場合に比べ, 優れた性能を示した。
論文 参考訳(メタデータ) (2022-08-05T09:36:13Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - Object Detection and Recognition of Swap-Bodies using Camera mounted on
a Vehicle [13.702911401489427]
本研究の目的は、スワップボディのオブジェクト検出を共同で行い、ILUコードを読み取ってスワップボディの種類を見つけることである。
近年の研究活動は、コンピュータビジョンの分野を強化する深層学習技術を大幅に改善している。
論文 参考訳(メタデータ) (2020-04-17T08:49:54Z) - Two-shot Spatially-varying BRDF and Shape Estimation [89.29020624201708]
形状とSVBRDFを段階的に推定した新しいディープラーニングアーキテクチャを提案する。
ドメインランダム化された幾何学と現実的な材料を用いた大規模合成学習データセットを作成する。
合成データセットと実世界のデータセットの両方の実験により、合成データセットでトレーニングされたネットワークが、実世界の画像に対してうまく一般化できることが示されている。
論文 参考訳(メタデータ) (2020-04-01T12:56:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。