論文の概要: Improved Handling of Motion Blur in Online Object Detection
- arxiv url: http://arxiv.org/abs/2011.14448v2
- Date: Tue, 30 Mar 2021 14:34:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-07 09:01:01.619706
- Title: Improved Handling of Motion Blur in Online Object Detection
- Title(参考訳): オンライン物体検出における動きのぼかし処理の改善
- Authors: Mohamed Sayed, Gabriel Brostow
- Abstract要約: 我々は、感情誘発ぼかしの詳細に焦点を当てた。
鮮明な画像とぼやけた画像のパフォーマンスのギャップを、それぞれ異なる潜在的な原因をターゲットとする5つの治療法のクラスを探索する。
他の4つの治療法は、マルチスケールなテクスチャ、アウト・オブ・ディストリビューション・テスト、ラベル生成、曖昧な型による条件付けに対処する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We wish to detect specific categories of objects, for online vision systems
that will run in the real world. Object detection is already very challenging.
It is even harder when the images are blurred, from the camera being in a car
or a hand-held phone. Most existing efforts either focused on sharp images,
with easy to label ground truth, or they have treated motion blur as one of
many generic corruptions.
Instead, we focus especially on the details of egomotion induced blur. We
explore five classes of remedies, where each targets different potential causes
for the performance gap between sharp and blurred images. For example, first
deblurring an image changes its human interpretability, but at present, only
partly improves object detection. The other four classes of remedies address
multi-scale texture, out-of-distribution testing, label generation, and
conditioning by blur-type. Surprisingly, we discover that custom label
generation aimed at resolving spatial ambiguity, ahead of all others, markedly
improves object detection. Also, in contrast to findings from classification,
we see a noteworthy boost by conditioning our model on bespoke categories of
motion blur.
We validate and cross-breed the different remedies experimentally on blurred
COCO images and real-world blur datasets, producing an easy and practical
favorite model with superior detection rates.
- Abstract(参考訳): 私たちは、現実世界で動作するオンラインビジョンシステムに対して、特定の種類のオブジェクトを検出したいと考えています。
オブジェクト検出はすでに非常に難しいです。
車や携帯のカメラから画像がぼやけていると、さらに難しくなります。
既存の取り組みのほとんどは、シャープなイメージに焦点を絞って、真実に簡単にラベルを付けるか、あるいは多くの一般的な汚職の1つとして動きのぼかしを扱いました。
代わりに、私たちは特に、感情誘発ぼかしの詳細に焦点を当てます。
鮮明な画像とぼやけた画像のパフォーマンスのギャップを、それぞれ異なる潜在的な原因をターゲットとする5つの治療法のクラスを探索する。
例えば、まず画像をデブラリングすると人間の解釈性が変わるが、現時点では部分的にオブジェクト検出が改善されているだけである。
他の4つのリメディエーションは、マルチスケールテクスチャ、分散テスト、ラベル生成、ぼかしタイプによるコンディショニングに対応している。
驚いたことに、カスタムラベル生成は空間的曖昧さを解消することを目的としており、他のすべてのものよりも先に、オブジェクト検出を著しく改善している。
また, 分類の結果とは対照的に, 動きのぼやけという異常なカテゴリーにモデルを適用することで, 顕著な向上が見られる。
本研究では,coco画像と実世界のぼかしデータセットを用いて,異なる治療法を実験的に検証し,相互交配し,検出率の高い簡便で実用的なモデルを構築した。
関連論文リスト
- Retrieval Robust to Object Motion Blur [54.34823913494456]
本研究では,動きのぼやけの影響を受けやすい画像のオブジェクト検索手法を提案する。
ぼやけたオブジェクト検索のための最初の大規模データセットを提示する。
提案手法は,新しいぼやけた検索データセット上で,最先端の検索手法より優れている。
論文 参考訳(メタデータ) (2024-04-27T23:22:39Z) - ZoomNeXt: A Unified Collaborative Pyramid Network for Camouflaged Object Detection [70.11264880907652]
最近のオブジェクト(COD)は、現実のシナリオでは極めて複雑で難しい、視覚的にブレンドされたオブジェクトを周囲に分割しようと試みている。
本研究では,不明瞭な画像を観察したり,ズームインしたりアウトしたりする際の人間の行動を模倣する,効果的な統合協調ピラミッドネットワークを提案する。
我々のフレームワークは、画像とビデオのCODベンチマークにおいて、既存の最先端の手法を一貫して上回っている。
論文 参考訳(メタデータ) (2023-10-31T06:11:23Z) - Take a Prior from Other Tasks for Severe Blur Removal [52.380201909782684]
知識蒸留に基づくクロスレベル特徴学習戦略
多レベルアグリゲーションとセマンティックアテンション変換によるセマンティック事前埋め込み層を効果的に統合する。
GoProやRealBlurのデータセットのような、自然な画像劣化ベンチマークと実世界の画像の実験は、我々の方法の有効性と能力を実証している。
論文 参考訳(メタデータ) (2023-02-14T08:30:51Z) - Differential Evolution based Dual Adversarial Camouflage: Fooling Human
Eyes and Object Detectors [0.190365714903665]
本研究では,2段階からなる二重対向カモフラージュ法(DE_DAC)を提案する。
第1段階では、レンダリング対象とシーン画像との差を最小限に抑えるために、グローバルテクスチャを最適化する。
第2段階では、局所的なテクスチャを最適化する3つの損失関数を設計し、物体検出を非効率にする。
論文 参考訳(メタデータ) (2022-10-17T09:07:52Z) - Thin-Plate Spline Motion Model for Image Animation [9.591298403129532]
イメージアニメーションは、ドライビングビデオに従って、ソースイメージ内の静的オブジェクトに生命をもたらす。
近年の研究では、事前知識を使わずに、教師なし手法による任意の物体の移動を試みている。
ソース内のオブジェクトと駆動イメージの間に大きなポーズギャップがある場合、現在の教師なしメソッドにとって、これは依然として重要な課題である。
論文 参考訳(メタデータ) (2022-03-27T18:40:55Z) - A Simple and Effective Use of Object-Centric Images for Long-Tailed
Object Detection [56.82077636126353]
シーン中心画像における物体検出を改善するために,物体中心画像を活用する。
私たちは、シンプルで驚くほど効果的なフレームワークを提示します。
我々の手法は、レアオブジェクトのオブジェクト検出(およびインスタンスセグメンテーション)の精度を相対的に50%(および33%)向上させることができる。
論文 参考訳(メタデータ) (2021-02-17T17:27:21Z) - Improving Object Detection with Selective Self-supervised Self-training [62.792445237541145]
本研究では,Web画像を利用した人為的対象検出データセットの強化について検討する。
画像と画像の検索によりWebイメージを検索し、他の検索手法に比べて、キュレートされたデータからのドメインシフトが少なくなる。
画像分類のためのラベルのないデータを探索する2つの並列処理をモチベーションとした新しい学習手法を提案する。
論文 参考訳(メタデータ) (2020-07-17T18:05:01Z) - Self-Supervised Linear Motion Deblurring [112.75317069916579]
深層畳み込みニューラルネットワークは、画像の劣化の最先端技術である。
本稿では,自己監督型動作遅延に対する識別可能なreblurモデルを提案する。
我々の実験は、自己監督された単一画像の劣化が本当に実現可能であることを実証した。
論文 参考訳(メタデータ) (2020-02-10T20:15:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。