論文の概要: Object Recognition Datasets and Challenges: A Review
- arxiv url: http://arxiv.org/abs/2507.22361v1
- Date: Wed, 30 Jul 2025 03:56:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-31 16:14:17.980202
- Title: Object Recognition Datasets and Challenges: A Review
- Title(参考訳): オブジェクト認識データセットと課題: レビュー
- Authors: Aria Salari, Abtin Djavadifar, Xiangrui Liu, Homayoun Najjaran,
- Abstract要約: 本研究では,高度に調査された物体認識領域におけるデータセットの詳細な分析を行う。
本稿では,代表的なオブジェクト認識ベンチマークとコンペティションの概要を紹介する。
導入されたデータセットと課題はすべて、.com/AbtinDjavadifar/ORDCでオンラインで見ることができる。
- 参考スコア(独自算出の注目度): 5.638005500131518
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Object recognition is among the fundamental tasks in the computer vision applications, paving the path for all other image understanding operations. In every stage of progress in object recognition research, efforts have been made to collect and annotate new datasets to match the capacity of the state-of-the-art algorithms. In recent years, the importance of the size and quality of datasets has been intensified as the utility of the emerging deep network techniques heavily relies on training data. Furthermore, datasets lay a fair benchmarking means for competitions and have proved instrumental to the advancements of object recognition research by providing quantifiable benchmarks for the developed models. Taking a closer look at the characteristics of commonly-used public datasets seems to be an important first step for data-driven and machine learning researchers. In this survey, we provide a detailed analysis of datasets in the highly investigated object recognition areas. More than 160 datasets have been scrutinized through statistics and descriptions. Additionally, we present an overview of the prominent object recognition benchmarks and competitions, along with a description of the metrics widely adopted for evaluation purposes in the computer vision community. All introduced datasets and challenges can be found online at github.com/AbtinDjavadifar/ORDC.
- Abstract(参考訳): オブジェクト認識は、コンピュータビジョンアプリケーションにおける基本的なタスクのひとつであり、他のすべての画像理解操作への道を開く。
オブジェクト認識研究のあらゆる段階において、最先端のアルゴリズムの能力に合わせた新しいデータセットの収集と注釈付けが試みられている。
近年,新たなディープネットワーク技術の有用性がトレーニングデータに大きく依存しているため,データセットのサイズや品質の重要性が増している。
さらに、データセットは競争の公正なベンチマーク手段であり、発達したモデルに定量的なベンチマークを提供することで、オブジェクト認識研究の進歩に寄与することが証明された。
一般的に使われている公開データセットの特徴を詳しく見ていくことは、データ駆動型および機械学習研究者にとって重要な第一歩であるようだ。
本研究では,高度に調査された物体認識領域におけるデータセットの詳細な分析を行う。
160以上のデータセットが統計や記述を通じて精査されている。
さらに、コンピュータビジョンコミュニティにおいて、評価目的に広く採用されているメトリクスの記載とともに、顕著なオブジェクト認識ベンチマークとコンペティションの概要を示す。
導入されたデータセットと課題はすべてgithub.com/AbtinDjavadifar/ORDCでオンラインで見ることができる。
関連論文リスト
- Smelly, dense, and spreaded: The Object Detection for Olfactory References (ODOR) dataset [11.701487651068263]
提案されたODORデータセットは、4712イメージに対して38,116のオブジェクトレベルのアノテーションを提供する。
我々は、カテゴリの詳細なセット、密なオブジェクトと重なり合うオブジェクト、画像キャンバス全体の空間分布など、挑戦的なデータセット特性を示す。
このデータセットは、研究者に対して、物体の認識と匂いの知覚の交わりを調査するよう求めている。
論文 参考訳(メタデータ) (2025-07-11T07:58:21Z) - A Comprehensive Survey on Underwater Image Enhancement Based on Deep Learning [51.7818820745221]
水中画像強調(UIE)はコンピュータビジョン研究において重要な課題である。
多数のUIEアルゴリズムが開発されているにもかかわらず、網羅的で体系的なレビューはいまだに欠落している。
論文 参考訳(メタデータ) (2024-05-30T04:46:40Z) - Deep Learning-Based Object Pose Estimation: A Comprehensive Survey [73.74933379151419]
ディープラーニングに基づくオブジェクトポーズ推定の最近の進歩について論じる。
また、複数の入力データモダリティ、出力ポーズの自由度、オブジェクト特性、下流タスクについても調査した。
論文 参考訳(メタデータ) (2024-05-13T14:44:22Z) - Navigating Dataset Documentations in AI: A Large-Scale Analysis of
Dataset Cards on Hugging Face [46.60562029098208]
私たちはHugging Faceで7,433のデータセットドキュメントを分析します。
本研究は,大規模データサイエンス分析によるデータセットの文書化に関するユニークな視点を提供する。
論文 参考訳(メタデータ) (2024-01-24T21:47:13Z) - DataPerf: Benchmarks for Data-Centric AI Development [81.03754002516862]
DataPerfは、MLデータセットとデータ中心アルゴリズムを評価するための、コミュニティ主導のベンチマークスイートである。
私たちは、この反復的な開発をサポートするために、複数の課題を抱えたオープンなオンラインプラットフォームを提供しています。
ベンチマーク、オンライン評価プラットフォーム、ベースライン実装はオープンソースである。
論文 参考訳(メタデータ) (2022-07-20T17:47:54Z) - A large scale multi-view RGBD visual affordance learning dataset [4.3773754388936625]
大規模マルチビューRGBDビジュアルアプライアンス学習データセットを提案する。
これは、初めてかつ最大のマルチビューRGBDビジュアルアプライアンス学習データセットである。
いくつかの最先端のディープラーニングネットワークを,それぞれが可視性認識とセグメンテーションタスクのために評価する。
論文 参考訳(メタデータ) (2022-03-26T14:31:35Z) - Bringing the People Back In: Contesting Benchmark Machine Learning
Datasets [11.00769651520502]
機械学習データの系譜である研究プログラムを概説し、これらのデータセットの作成方法と理由について検討する。
機械学習におけるベンチマークデータセットを基盤として運用する方法を解説し、これらのデータセットについて4つの研究課題を提起する。
論文 参考訳(メタデータ) (2020-07-14T23:22:13Z) - Deflating Dataset Bias Using Synthetic Data Augmentation [8.509201763744246]
自律走行車(AV)の視覚タスクの最先端の手法は、教師あり学習に依存している。
本研究の目的は,視覚タスクにおける実際のデータセットのギャップを埋めるために,ターゲットとなる合成データ拡張の利用を検討することである。
AVに実用的な3つの異なるコンピュータビジョンタスクに関する実証研究は、トレーニングミックスに合成データを持つことは、クロスデータセットの一般化性能を著しく向上させることを一貫して示している。
論文 参考訳(メタデータ) (2020-04-28T21:56:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。