論文の概要: Object Detection and Recognition of Swap-Bodies using Camera mounted on
a Vehicle
- arxiv url: http://arxiv.org/abs/2004.08118v1
- Date: Fri, 17 Apr 2020 08:49:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-12 12:49:46.997675
- Title: Object Detection and Recognition of Swap-Bodies using Camera mounted on
a Vehicle
- Title(参考訳): 車両に搭載されたカメラによるスワップボディの物体検出と認識
- Authors: Ebin Zacharias, Didier Stricker, Martin Teuchler and Kripasindhu
Sarkar
- Abstract要約: 本研究の目的は、スワップボディのオブジェクト検出を共同で行い、ILUコードを読み取ってスワップボディの種類を見つけることである。
近年の研究活動は、コンピュータビジョンの分野を強化する深層学習技術を大幅に改善している。
- 参考スコア(独自算出の注目度): 13.702911401489427
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object detection and identification is a challenging area of computer vision
and a fundamental requirement for autonomous cars. This project aims to jointly
perform object detection of a swap-body and to find the type of swap-body by
reading an ILU code using an efficient optical character recognition (OCR)
method. Recent research activities have drastically improved deep learning
techniques which proves to enhance the field of computer vision. Collecting
enough images for training the model is a critical step towards achieving good
results. The data for training were collected from different locations with
maximum possible variations and the details are explained. In addition, data
augmentation methods applied for training has proved to be effective in
improving the performance of the trained model. Training the model achieved
good results and the test results are also provided. The final model was tested
with images and videos. Finally, this paper also draws attention to some of the
major challenges faced during various stages of the project and the possible
solutions applied.
- Abstract(参考訳): 物体の検出と識別はコンピュータビジョンの困難な領域であり、自動運転車の基本的な要件である。
本研究の目的は、スワップボディのオブジェクト検出を共同で行い、効率的な光学文字認識(OCR)法を用いてILUコードを読み取ることである。
近年の研究活動は、コンピュータビジョンの分野を強化する深層学習技術を大幅に改善している。
モデルをトレーニングするために十分な画像を集めることは、良い結果を得るための重要なステップです。
トレーニング用データは、可能な限りのバリエーションで異なる場所から収集され、詳細が説明される。
さらに,トレーニングに応用したデータ拡張手法は,トレーニングモデルの性能向上に有効であることが判明した。
優れた結果を得たモデルをトレーニングし、テスト結果も提供します。
最終モデルは画像とビデオでテストされた。
最後に,本論文は,プロジェクトのさまざまな段階において直面する課題や,適用可能な解決策についても注目する。
関連論文リスト
- LEAP:D - A Novel Prompt-based Approach for Domain-Generalized Aerial Object Detection [2.1233286062376497]
学習可能なプロンプトを用いた革新的な視覚言語アプローチを提案する。
この手動プロンプトからのシフトは、ドメイン固有の知識干渉を減らすことを目的としている。
トレーニングプロセスを一段階のアプローチで合理化し、学習可能なプロンプトとモデルトレーニングを同時に更新する。
論文 参考訳(メタデータ) (2024-11-14T04:39:10Z) - A Simple Background Augmentation Method for Object Detection with Diffusion Model [53.32935683257045]
コンピュータビジョンでは、データの多様性の欠如がモデル性能を損なうことはよく知られている。
本稿では, 生成モデルの進歩を生かして, 単純かつ効果的なデータ拡張手法を提案する。
背景強化は、特にモデルの堅牢性と一般化能力を大幅に改善する。
論文 参考訳(メタデータ) (2024-08-01T07:40:00Z) - An Ensemble Model for Distorted Images in Real Scenarios [0.0]
本稿では,オブジェクト検出器YOLOv7を用いてCDCOCOデータセットから歪み画像を検出する。
慎重に設計した最適化により,CDCOCOテストセット上での優れた性能を実現する。
我々のデノナイジング検出モデルは、歪んだ画像をデノナイズし、修復することができるため、様々な現実のシナリオや環境において有用である。
論文 参考訳(メタデータ) (2023-09-26T15:12:55Z) - A Dual-Cycled Cross-View Transformer Network for Unified Road Layout
Estimation and 3D Object Detection in the Bird's-Eye-View [4.251500966181852]
本稿では,トランスアーキテクチャとCycleGAN学習フレームワークにヒントを得た,道路レイアウト推定と3次元物体検出のための統一モデルを提案する。
道路配置推定におけるマルチクラス学習の効果を検討するために,幅広い学習シナリオを構築した。
その結果,道路配置推定と3次元物体検出の両タスクにおいて,最先端の性能を実現することができた。
論文 参考訳(メタデータ) (2022-09-19T08:43:38Z) - Advancing Plain Vision Transformer Towards Remote Sensing Foundation
Model [97.9548609175831]
約1億のパラメータを持つプレーンビジョントランスフォーマーを利用して、リモートセンシングタスク用にカスタマイズされた大規模なビジョンモデルを提案する。
具体的には、RS画像における大きな画像サイズと様々な向きのオブジェクトを扱うために、回転する様々なウィンドウアテンションを提案する。
検出タスクの実験は、DOTA-V1.0データセット上で81.16%のmAPを達成したすべての最先端モデルよりも、我々のモデルの方が優れていることを示す。
論文 参考訳(メタデータ) (2022-08-08T09:08:40Z) - One-Shot Object Affordance Detection in the Wild [76.46484684007706]
Affordance Detectionは、画像内のオブジェクトの潜在的なアクション可能性を特定することを指す。
我々は、人間の行動目的を推定し、それを転送して、すべての候補画像から共通価格を検出するワンショットアフォーダンス検出ネットワーク(OSAD-Net)を考案する。
複雑なシーンと豊富なアノテーションによって、当社のPADv2データセットは、アベイランス検出メソッドをベンチマークするためのテストベッドとして使用することができます。
論文 参考訳(メタデータ) (2021-08-08T14:53:10Z) - Few-Cost Salient Object Detection with Adversarial-Paced Learning [95.0220555274653]
本稿では,少数のトレーニング画像にのみ手動アノテーションを応用して,効果的なサルエント物体検出モデルを学習することを提案する。
我々は,このタスクを,少額の有能な物体検出とみなし,少数のコストの学習シナリオを促進するために,APL(Adversarialpaced Learning)ベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2021-04-05T14:15:49Z) - Factors of Influence for Transfer Learning across Diverse Appearance
Domains and Task Types [50.1843146606122]
現在の最新のコンピュータビジョンモデルでは、簡単な転送学習が一般的です。
転校学習に関するこれまでの体系的な研究は限られており、作業が期待される状況は十分に理解されていない。
本論文では,非常に異なる画像領域にまたがる転送学習の広範な実験的研究を行う。
論文 参考訳(メタデータ) (2021-03-24T16:24:20Z) - Learning Collision-Free Space Detection from Stereo Images: Homography
Matrix Brings Better Data Augmentation [16.99302954185652]
少数のトレーニングサンプルを使用して、深い畳み込みニューラルネットワーク(DCNN)を訓練することは、依然としてオープンな課題です。
本稿では,dcnnの性能向上に有効なトレーニングデータ拡張手法について検討する。
論文 参考訳(メタデータ) (2020-12-14T19:14:35Z) - Auto-Rectify Network for Unsupervised Indoor Depth Estimation [119.82412041164372]
ハンドヘルド環境に現れる複雑な自我運動が,学習深度にとって重要な障害であることが確認された。
本稿では,相対回転を除去してトレーニング画像の修正を効果的に行うデータ前処理手法を提案する。
その結果、従来の教師なしSOTA法よりも、難易度の高いNYUv2データセットよりも優れていた。
論文 参考訳(メタデータ) (2020-06-04T08:59:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。