論文の概要: Roboflow 100: A Rich, Multi-Domain Object Detection Benchmark
- arxiv url: http://arxiv.org/abs/2211.13523v1
- Date: Thu, 24 Nov 2022 10:44:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-28 16:37:20.793071
- Title: Roboflow 100: A Rich, Multi-Domain Object Detection Benchmark
- Title(参考訳): Roboflow 100: リッチでマルチドメインのオブジェクト検出ベンチマーク
- Authors: Floriana Ciaglia, Francesco Saverio Zuppichini, Paul Guerrie, Mark
McQuade, and Jacob Solawetz
- Abstract要約: Roboflow-100は100のデータセット、7のイメージドメイン、224,714のイメージと、11,170以上のラベル付き時間を持つ805のクラスラベルで構成されている。
RF100は、研究者が実際のデータでモデルの一般化可能性をテストするのに役立つデータセットのマルチドメインベンチマークである。
- 参考スコア(独自算出の注目度): 0.2446672595462589
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The evaluation of object detection models is usually performed by optimizing
a single metric, e.g. mAP, on a fixed set of datasets, e.g. Microsoft COCO and
Pascal VOC. Due to image retrieval and annotation costs, these datasets consist
largely of images found on the web and do not represent many real-life domains
that are being modelled in practice, e.g. satellite, microscopic and gaming,
making it difficult to assert the degree of generalization learned by the
model. We introduce the Roboflow-100 (RF100) consisting of 100 datasets, 7
imagery domains, 224,714 images, and 805 class labels with over 11,170
labelling hours. We derived RF100 from over 90,000 public datasets, 60 million
public images that are actively being assembled and labelled by computer vision
practitioners in the open on the web application Roboflow Universe. By
releasing RF100, we aim to provide a semantically diverse, multi-domain
benchmark of datasets to help researchers test their model's generalizability
with real-life data. RF100 download and benchmark replication are available on
GitHub.
- Abstract(参考訳): オブジェクト検出モデルの評価は通常、Microsoft COCOやPascal VOCといった固定データセットのセット上で、mAPなどの単一のメトリックを最適化することで行われる。
画像検索とアノテーションのコストのため、これらのデータセットはweb上に存在する画像で構成されており、衛星、顕微鏡、ゲームなど、実際にモデル化されている多くの現実のドメインを表現していないため、モデルによって学習される一般化の程度を断定することは困難である。
我々は,100のデータセット,7つのイメージドメイン,224,714のイメージ,805のクラスラベルからなるroboflow-100 (rf100)を紹介する。
私たちは、9万以上の公開データセットからRF100を抽出し、600万の公開イメージを、WebアプリケーションRoboflow Universeのオープンでコンピュータビジョンの実践者が積極的に組み立て、ラベル付けしています。
RF100をリリースすることにより、研究者が実際のデータを用いてモデルの一般化可能性をテストするのに役立つ、セマンティックに多様性のあるマルチベンチマークデータセットの提供を目指している。
RF100のダウンロードとベンチマークのレプリケーションはGitHubで公開されている。
関連論文リスト
- SARDet-100K: Towards Open-Source Benchmark and ToolKit for Large-Scale SAR Object Detection [79.23689506129733]
我々は,大規模SARオブジェクト検出のための新しいベンチマークデータセットとオープンソース手法を構築した。
私たちのデータセットであるSARDet-100Kは、10の既存のSAR検出データセットの厳格な調査、収集、標準化の結果です。
私たちの知る限りでは、SARDet-100KはCOCOレベルの大規模マルチクラスSARオブジェクト検出データセットとしては初めてのものです。
論文 参考訳(メタデータ) (2024-03-11T09:20:40Z) - Towards Universal Image Embeddings: A Large-Scale Dataset and Challenge
for Generic Image Representations [4.606379774346321]
我々は、単一のユニバーサルモデルが訓練され、複数のドメインで使用される、普遍的なイメージ埋め込みの問題に対処する。
まず、既存のドメイン固有のデータセットを活用し、普遍的な画像埋め込みの評価のための新しい大規模公開ベンチマークを慎重に構築する。
第2に、新しいデータセットに関する包括的な実験的評価を行い、既存のアプローチと単純化された拡張が、各ドメインで個別にトレーニングされたモデルの集合よりもパフォーマンスを低下させることを示した。
論文 参考訳(メタデータ) (2023-09-04T23:18:38Z) - OBELICS: An Open Web-Scale Filtered Dataset of Interleaved Image-Text
Documents [122.55393759474181]
我々は、インターリーブされた画像テキスト文書のオープンなWebスケールフィルタリングデータセットであるOBELICSを紹介する。
データセット作成プロセスを説明し、包括的なフィルタリングルールを示し、データセットの内容を分析する。
IDEFICSという名前の9~800億のパラメータのビジョンと言語モデルをトレーニングし、異なるマルチモーダルベンチマークで競合性能を得る。
論文 参考訳(メタデータ) (2023-06-21T14:01:01Z) - Large-Scale Unsupervised Object Discovery [80.60458324771571]
教師なしオブジェクトディスカバリ(UOD)は、パフォーマンスを損なう近似なしでは、大規模なデータセットにスケールアップしない。
本稿では,固有値問題やリンク解析に利用できる分散手法の武器として,ランク付け問題としてのUODの新たな定式化を提案する。
論文 参考訳(メタデータ) (2021-06-12T00:29:49Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - DatasetGAN: Efficient Labeled Data Factory with Minimal Human Effort [117.41383937100751]
現在のディープネットワークは、大規模なデータセットのトレーニングの恩恵を受ける、非常にデータハングリーです。
GAN潜入コードがどのようにデコードされ、イメージのセマンティックセグメンテーションを生成するかを示す。
これらの生成されたデータセットは、実際のデータセットと同じように、コンピュータビジョンアーキテクチャのトレーニングに使用できます。
論文 参考訳(メタデータ) (2021-04-13T20:08:29Z) - Object Detection in Aerial Images: A Large-Scale Benchmark and
Challenges [124.48654341780431]
航空画像(DOTA)におけるオブジェクトデテクションの大規模データセットとODAIの総合的ベースラインについて述べる。
提案するDOTAデータセットは,11,268個の空中画像から収集した18カテゴリのオブジェクト指向ボックスアノテーションの1,793,658個のオブジェクトインスタンスを含む。
70以上の構成を持つ10の最先端アルゴリズムをカバーするベースラインを構築し,各モデルの速度と精度を評価した。
論文 参考訳(メタデータ) (2021-02-24T11:20:55Z) - MLRSNet: A Multi-label High Spatial Resolution Remote Sensing Dataset
for Semantic Scene Understanding [6.880271407391406]
深層学習を用いたセマンティックシーン理解のためのマルチラベル高空間分解能リモートセンシングデータセットMLRSNetを構築した。
MLRSNetには46のシーンカテゴリに109,161のサンプルが含まれており、各イメージには60の事前定義されたラベルの少なくとも1つが含まれている。
実験の結果、MLRSNetは将来の研究において重要なベンチマークであることが示された。
論文 参考訳(メタデータ) (2020-10-01T08:03:47Z) - Google Landmarks Dataset v2 -- A Large-Scale Benchmark for
Instance-Level Recognition and Retrieval [9.922132565411664]
大規模できめ細かいインスタンス認識と画像検索のための新しいベンチマークであるGoogle Landmarks dataset v2(GLDv2)を紹介した。
GLDv2は、500万以上の画像と200万のインスタンスラベルを含む、これまでで最大のデータセットである。
ウィキメディア・コモンズ(Wikimedia Commons)は、世界最大のクラウドソースによるランドマーク写真コレクションである。
論文 参考訳(メタデータ) (2020-04-03T22:52:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。