論文の概要: Deep Learning for Scene Classification: A Survey
- arxiv url: http://arxiv.org/abs/2101.10531v2
- Date: Sat, 20 Feb 2021 04:39:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-13 19:55:24.125531
- Title: Deep Learning for Scene Classification: A Survey
- Title(参考訳): シーン分類のためのディープラーニング:調査
- Authors: Delu Zeng, Minyu Liao, Mohammad Tavakolian, Yulan Guo, Bolei Zhou,
Dewen Hu, Matti Pietik\"ainen, Li Liu
- Abstract要約: シーン分類は、コンピュータビジョンにおける長年の、根本的かつ挑戦的な問題である。
大規模データセットの出現と深層学習技術のルネッサンスは、シーン表現と分類の分野において顕著な進歩をもたらした。
本稿では,深層学習によるシーン分類における最近の成果を総合的に調査する。
- 参考スコア(独自算出の注目度): 48.57123373347695
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Scene classification, aiming at classifying a scene image to one of the
predefined scene categories by comprehending the entire image, is a
longstanding, fundamental and challenging problem in computer vision. The rise
of large-scale datasets, which constitute the corresponding dense sampling of
diverse real-world scenes, and the renaissance of deep learning techniques,
which learn powerful feature representations directly from big raw data, have
been bringing remarkable progress in the field of scene representation and
classification. To help researchers master needed advances in this field, the
goal of this paper is to provide a comprehensive survey of recent achievements
in scene classification using deep learning. More than 200 major publications
are included in this survey covering different aspects of scene classification,
including challenges, benchmark datasets, taxonomy, and quantitative
performance comparisons of the reviewed methods. In retrospect of what has been
achieved so far, this paper is also concluded with a list of promising research
opportunities.
- Abstract(参考訳): シーンの分類は、画像全体を解釈することで、事前に定義されたシーンカテゴリの1つに分類することを目的としており、コンピュータビジョンにおける長年の、基本的で挑戦的な問題である。
多様な実世界のシーンの密集サンプリングを構成する大規模データセットの台頭と、大規模生データから直接強力な特徴表現を学習するディープラーニング技術のルネッサンスは、シーン表現と分類の分野において顕著な進歩をもたらしている。
本研究の目的は,深層学習を用いたシーン分類における最近の成果を包括的に調査することである。
この調査には、課題、ベンチマークデータセット、分類学、レビューされた方法の定量的パフォーマンス比較など、シーン分類のさまざまな側面をカバーする200以上の主要な出版物が含まれています。
これまでの成果を振り返って、本論文では有望な研究機会のリストもまとめています。
関連論文リスト
- A Comprehensive Review of Few-shot Action Recognition [64.47305887411275]
アクション認識は、複雑で可変なビデオデータを手動でラベル付けすることのコストと非現実性に対処することを目的としている。
ビデオ中の人間のアクションを正確に分類するには、クラスごとにいくつかのラベル付き例だけを使用する必要がある。
論文 参考訳(メタデータ) (2024-07-20T03:53:32Z) - Deep Learning-Based Object Pose Estimation: A Comprehensive Survey [73.74933379151419]
ディープラーニングに基づくオブジェクトポーズ推定の最近の進歩について論じる。
また、複数の入力データモダリティ、出力ポーズの自由度、オブジェクト特性、下流タスクについても調査した。
論文 参考訳(メタデータ) (2024-05-13T14:44:22Z) - Semantic-Based Active Perception for Humanoid Visual Tasks with Foveal Sensors [49.99728312519117]
この研究の目的は、最近の意味に基づくアクティブな知覚モデルが、人間が定期的に行う視覚的なタスクをいかに正確に達成できるかを確立することである。
このモデルは、現在のオブジェクト検出器が多数のオブジェクトクラスをローカライズし、分類し、複数の固定にまたがるシーンのセマンティック記述を更新する能力を利用する。
シーン探索の課題では、セマンティック・ベースの手法は従来のサリエンシ・ベース・モデルよりも優れた性能を示す。
論文 参考訳(メタデータ) (2024-04-16T18:15:57Z) - Seeing the Intangible: Survey of Image Classification into High-Level
and Abstract Categories [0.20718016474717196]
コンピュータビジョン(CV)の分野は、高レベルの視覚感覚タスクへとシフトしつつある。
本稿では,画像の自動分類における抽象概念(AC)に着目し,高レベルの視覚的理解に関する研究を体系的にレビューする。
論文 参考訳(メタデータ) (2023-08-21T08:37:04Z) - Recent Advances in Scene Image Representation and Classification [1.8369974607582584]
本稿では,画像分類に広く用いられている既存のシーン画像表現手法について概説する。
我々は、その性能を質的に(例えば、出力の品質、pros/consなど)、量的に(例えば、精度)比較する。
本稿では,従来のコンピュータビジョン(CV)ベースの手法,ディープラーニング(DL)ベースの手法,検索エンジン(SE)ベースの手法について,最近のシーン画像表現手法の詳細な知見と応用について述べる。
論文 参考訳(メタデータ) (2022-06-15T07:12:23Z) - Deep Depth Completion: A Survey [26.09557446012222]
我々は、読者が研究動向をよりよく把握し、現在の進歩を明確に理解するのに役立つ総合的な文献レビューを提供する。
ネットワークアーキテクチャ,損失関数,ベンチマークデータセット,学習戦略の設計面から,関連する研究について検討する。
室内および屋外のデータセットを含む,広く使用されている2つのベンチマークデータセットに対して,モデル性能の定量的比較を行った。
論文 参考訳(メタデータ) (2022-05-11T08:24:00Z) - Scene Graph Generation: A Comprehensive Survey [35.80909746226258]
シーングラフは、その強力な意味表現とシーン理解への応用から研究の焦点となっている。
SGG(Scene Graph Generation)とは、画像を自動的にセマンティックなシーングラフにマッピングするタスクである。
本稿では,異なる入力モダリティをカバーする138の代表的な作品についてレビューし,既存の画像ベースSGGの手法を体系的に要約する。
論文 参考訳(メタデータ) (2022-01-03T00:55:33Z) - A Survey on Deep Learning Technique for Video Segmentation [147.0767454918527]
ビデオセグメンテーションは幅広い応用において重要な役割を果たしている。
ディープラーニングベースのアプローチは、ビデオセグメンテーションに特化しており、魅力的なパフォーマンスを提供している。
論文 参考訳(メタデータ) (2021-07-02T15:51:07Z) - A Survey on Text Classification: From Shallow to Deep Learning [83.47804123133719]
過去10年は、ディープラーニングが前例のない成功を収めたために、この分野の研究が急増している。
本稿では,1961年から2021年までの最先端のアプローチを見直し,そのギャップを埋める。
特徴抽出と分類に使用されるテキストとモデルに基づいて,テキスト分類のための分類を作成する。
論文 参考訳(メタデータ) (2020-08-02T00:09:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。