論文の概要: Supervised Virtual-to-Real Domain Adaptation for Object Detection Task
using YOLO
- arxiv url: http://arxiv.org/abs/2302.13891v1
- Date: Mon, 27 Feb 2023 15:36:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-28 15:00:25.978012
- Title: Supervised Virtual-to-Real Domain Adaptation for Object Detection Task
using YOLO
- Title(参考訳): YOLOを用いたオブジェクト検出タスクにおける仮想領域適応の最適化
- Authors: Akbar Satya Nugraha, Yudistira Novanto, Bayu Rahayudi
- Abstract要約: 十分に注釈付けされたデータセットは、ディープニューラルネットワークの精度に影響を与える。
コンピュータ生成データや仮想データセットは、これを克服するために使用される。
5000と10000の仮想データと220の実データを用いて,VW-PPEデータセットを使用する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Deep neural network shows excellent use in a lot of real-world tasks. One of
the deep learning tasks is object detection. Well-annotated datasets will
affect deep neural network accuracy. More data learned by deep neural networks
will make the model more accurate. However, a well-annotated dataset is hard to
find, especially in a specific domain. To overcome this, computer-generated
data or virtual datasets are used. Researchers could generate many images with
specific use cases also with its annotation. Research studies showed that
virtual datasets could be used for object detection tasks. Nevertheless, with
the usage of the virtual dataset, the model must adapt to real datasets, or the
model must have domain adaptability features. We explored the domain adaptation
inside the object detection model using a virtual dataset to overcome a few
well-annotated datasets. We use VW-PPE dataset, using 5000 and 10000 virtual
data and 220 real data. For model architecture, we used YOLOv4 using
CSPDarknet53 as the backbone and PAN as the neck. The domain adaptation
technique with fine-tuning only on backbone weight achieved a mean average
precision of 74.457%.
- Abstract(参考訳): ディープニューラルネットワークは、多くの現実世界のタスクで優れた利用を示している。
ディープラーニングタスクの1つは、オブジェクト検出である。
注釈付きデータセットはディープニューラルネットワークの精度に影響する。
ディープニューラルネットワークによって学習されるデータが増えると、モデルがより正確になる。
しかし、よく注釈付けされたデータセットは、特に特定のドメインで見つけるのが難しい。
これを克服するために、コンピュータ生成データや仮想データセットが使用される。
研究者は、アノテーションを使って、特定のユースケースで多くの画像を生成することができる。
研究によると、仮想データセットはオブジェクト検出タスクに使用できる。
それでも、仮想データセットを使用することで、モデルは実際のデータセットに適応しなければならないし、あるいはモデルがドメイン適応性機能を持つ必要がある。
仮想データセットを用いたオブジェクト検出モデル内のドメイン適応について検討し,いくつかの注釈付きデータセットを克服した。
5000と10000の仮想データと220の実データを用いて,VW-PPEデータセットを使用する。
モデルアーキテクチャでは、CSPDarknet53をバックボーンとして、PANをネックとして、YOLOv4を使用しました。
背骨重量のみを微調整したドメイン適応法の平均精度は74.457%に達した。
関連論文リスト
- RanLayNet: A Dataset for Document Layout Detection used for Domain Adaptation and Generalization [36.973388673687815]
RanLayNetは、自動的に割り当てられたラベルでリッチ化された合成ドキュメントデータセットである。
本研究では,データセットでトレーニングしたディープレイアウト識別モデルに対して,実際の文書のみをトレーニングしたモデルと比較して,性能が向上したことを示す。
論文 参考訳(メタデータ) (2024-04-15T07:50:15Z) - 3D Adversarial Augmentations for Robust Out-of-Domain Predictions [115.74319739738571]
ドメイン外データへの一般化の改善に注力する。
対象を逆向きに変形させるベクトルの集合を学習する。
本研究では,学習したサンプル非依存ベクトルをモデルトレーニング時に利用可能なオブジェクトに適用することにより,対数拡大を行う。
論文 参考訳(メタデータ) (2023-08-29T17:58:55Z) - Exploring the Effectiveness of Dataset Synthesis: An application of
Apple Detection in Orchards [68.95806641664713]
本研究では,リンゴ樹の合成データセットを生成するための安定拡散2.1-baseの有用性について検討する。
我々は、現実世界のリンゴ検出データセットでリンゴを予測するために、YOLOv5mオブジェクト検出モデルを訓練する。
その結果、実世界の画像でトレーニングされたベースラインモデルと比較して、生成データでトレーニングされたモデルはわずかに性能が劣っていることがわかった。
論文 参考訳(メタデータ) (2023-06-20T09:46:01Z) - Quantifying the LiDAR Sim-to-Real Domain Shift: A Detailed Investigation
Using Object Detectors and Analyzing Point Clouds at Target-Level [1.1999555634662635]
自律運転のためのニューラルネットワークに基づくLiDARオブジェクト検出アルゴリズムは、トレーニング、検証、テストのために大量のデータを必要とする。
ニューラルネットワークのトレーニングにシミュレーションデータを使用することで、シーン、シナリオ、分布の違いによるトレーニングデータとテストデータのドメインシフトが生じることを示す。
論文 参考訳(メタデータ) (2023-03-03T12:52:01Z) - Detection Hub: Unifying Object Detection Datasets via Query Adaptation
on Language Embedding [137.3719377780593]
新しいデザイン(De Detection Hubという名前)は、データセット認識とカテゴリ整列である。
データセットの不整合を緩和し、検出器が複数のデータセットをまたいで学習するための一貫性のあるガイダンスを提供する。
データセット間のカテゴリは、ワンホットなカテゴリ表現を単語埋め込みに置き換えることで、意味的に統一された空間に整列される。
論文 参考訳(メタデータ) (2022-06-07T17:59:44Z) - Towards Optimal Strategies for Training Self-Driving Perception Models
in Simulation [98.51313127382937]
合成ドメインのみにおけるラベルの使用に焦点を当てる。
提案手法では,ニューラル不変表現の学習方法と,シミュレータからデータをサンプリングする方法に関する理論的にインスピレーションを得た視点を導入する。
マルチセンサーデータを用いた鳥眼視車両分割作業におけるアプローチについて紹介する。
論文 参考訳(メタデータ) (2021-11-15T18:37:43Z) - AI Playground: Unreal Engine-based Data Ablation Tool for Deep Learning [0.0]
機械学習はデータを必要とするが、実際のデータの取得とラベル付けは困難であり、高価であり、時間を要する。
仮想画像データの生成とラベル付けを行うオープンソースUnreal EngineベースのツールであるAI Playground(AIP)を紹介する。
私たちはディープニューラルネットワークをトレーニングし、深さ値、表面正規値、またはオブジェクトラベルを予測し、各ネットワークのイントラおよびクロスデータセットのパフォーマンスを評価しました。
論文 参考訳(メタデータ) (2020-07-13T02:04:39Z) - Virtual to Real adaptation of Pedestrian Detectors [9.432150710329607]
ViPeDは、ビデオゲームGTA V - Grand Theft Auto Vのグラフィカルエンジンで収集された新しい合成画像セットである。
本稿では,歩行者検出作業に適した2つの異なる領域適応手法を提案する。
実験によると、ViPeDでトレーニングされたネットワークは、実世界のデータでトレーニングされた検出器よりも、目に見えない現実世界のシナリオを一般化できる。
論文 参考訳(メタデータ) (2020-01-09T14:50:11Z) - Neural Data Server: A Large-Scale Search Engine for Transfer Learning
Data [78.74367441804183]
我々は,ターゲットドメインに最も有用な転送学習データを見つけるための大規模検索エンジンであるNeural Data Server (NDS)を紹介した。
NDSは、いくつかの人気のある画像データセットをインデックスするデータサーバで構成され、クライアントにデータを推奨することを目的としている。
我々は,NDSが様々な伝達学習シナリオにおいて有効であることを示し,複数のターゲットデータセットに対して最先端の性能を示す。
論文 参考訳(メタデータ) (2020-01-09T01:21:30Z) - Stance Detection Benchmark: How Robust Is Your Stance Detection? [65.91772010586605]
Stance Detection (StD) は、あるトピックやクレームに対する著者の姿勢を検出することを目的としている。
マルチデータセット学習環境において、さまざまなドメインの10のStDデータセットから学習するStDベンチマークを導入する。
このベンチマーク設定では、5つのデータセットに新しい最先端結果を表示することができます。
論文 参考訳(メタデータ) (2020-01-06T13:37:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。