論文の概要: Recent Advances in Scene Image Representation and Classification
- arxiv url: http://arxiv.org/abs/2206.07326v1
- Date: Wed, 15 Jun 2022 07:12:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-16 14:16:10.679379
- Title: Recent Advances in Scene Image Representation and Classification
- Title(参考訳): シーン画像の表現と分類の最近の進歩
- Authors: Chiranjibi Sitaula, Tej Bahadur Shahi, Faezeh Marzbanrad
- Abstract要約: 本稿では,画像分類に広く用いられている既存のシーン画像表現手法について概説する。
我々は、その性能を質的に(例えば、出力の品質、pros/consなど)、量的に(例えば、精度)比較する。
本稿では,従来のコンピュータビジョン(CV)ベースの手法,ディープラーニング(DL)ベースの手法,検索エンジン(SE)ベースの手法について,最近のシーン画像表現手法の詳細な知見と応用について述べる。
- 参考スコア(独自算出の注目度): 1.8369974607582584
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the rise of deep learning algorithms nowadays, scene image
representation methods on big data (e.g., SUN-397) have achieved a significant
performance boost in classification. However, the performance is still limited
because the scene images are mostly complex in nature having higher intra-class
dissimilarity and inter-class similarity problems. To deal with such problems,
there are several methods proposed in the literature with their own advantages
and limitations. A detailed study of previous works is necessary to understand
their pros and cons in image representation and classification. In this paper,
we review the existing scene image representation methods that are being used
widely for image classification. For this, we, first, devise the taxonomy using
the seminal existing methods proposed in the literature to this date. Next, we
compare their performance both qualitatively (e.g., quality of outputs,
pros/cons, etc.) and quantitatively (e.g., accuracy). Last, we speculate the
prominent research directions in scene image representation tasks. Overall,
this survey provides in-depth insights and applications of recent scene image
representation methods for traditional Computer Vision (CV)-based methods, Deep
Learning (DL)-based methods, and Search Engine (SE)-based methods.
- Abstract(参考訳): 近年のディープラーニングアルゴリズムの台頭により、ビッグデータ上のシーン画像表現手法(例えば、SUN-397)は、分類において顕著なパフォーマンス向上を実現している。
しかし,シーンイメージはクラス間の相似性やクラス間の類似性に問題があり,本質的には複雑なため,パフォーマンスは依然として限られている。
このような問題に対処するために、文献にはいくつかの方法が提案されている。
画像表現と分類の長所と短所を理解するためには,先行研究の詳細な研究が必要である。
本稿では,画像分類に広く用いられている既存のシーン画像表現手法について概説する。
そこで,本稿ではまず,本文献に提案されている専門的な方法を用いて分類を考案する。
次に、それらの性能(例えば、出力の品質、pros/consなど)と定量的(例えば、精度)を比較します。
最後に,シーンイメージ表現タスクにおける顕著な研究方向を推測する。
本稿では,従来のコンピュータビジョン(CV)ベースの手法,ディープラーニング(DL)ベースの手法,検索エンジン(SE)ベースの手法について,最近のシーン画像表現手法の詳細な知見と応用について述べる。
関連論文リスト
- Improving Computer Vision Interpretability: Transparent Two-level Classification for Complex Scenes [0.694388984236049]
本稿では,透明性問題に対処する2段階の分類手法を提案する。
この手法を、14万枚以上の画像からなる新しいデータセットに適用し、政治的抗議を示すものを検出する。
オブジェクトを知ることは、抗議的なイメージと非抗議的なイメージを区別する分析を可能にする。
論文 参考訳(メタデータ) (2024-07-04T09:48:58Z) - Deep Image Matting: A Comprehensive Survey [85.77905619102802]
本稿では,ディープラーニング時代における画像マッチングの最近の進歩を概観する。
本稿では,補助的な入力ベースの画像マッチングと,自動的な画像マッチングという,2つの基本的なサブタスクに焦点を当てる。
画像マッチングの関連応用について論じ,今後の研究への課題と可能性を明らかにする。
論文 参考訳(メタデータ) (2023-04-10T15:48:55Z) - A survey on facial image deblurring [3.6775758132528877]
顔画像がぼやけていると、顔認識などのハイレベルな視覚タスクに大きな影響を与えます。
本稿では,最近発表された顔画像の難読化手法について概説し,その大部分はディープラーニングに基づくものである。
本稿では,データセットとメトリクスにおける古典的手法の性能を示すとともに,モデルに基づく手法と学習に基づく手法の違いについて,簡単な議論を行う。
論文 参考訳(メタデータ) (2023-02-10T02:24:56Z) - Facing the Void: Overcoming Missing Data in Multi-View Imagery [0.783788180051711]
本稿では,この問題に頑健な多視点画像分類のための新しい手法を提案する。
提案手法は,最先端の深層学習とメートル法学習に基づいて,他のアプリケーションやドメインに容易に適応し,活用することができる。
その結果,提案アルゴリズムは,最先端手法と比較して,多視点画像分類精度の向上を図っている。
論文 参考訳(メタデータ) (2022-05-21T13:21:27Z) - Knowledge Mining with Scene Text for Fine-Grained Recognition [53.74297368412834]
本研究では,シーンテキスト画像の背景にある暗黙的な文脈知識をマイニングする,エンドツーエンドのトレーニング可能なネットワークを提案する。
我々は,KnowBertを用いて意味表現の関連知識を検索し,それを画像特徴と組み合わせ,きめ細かい分類を行う。
本手法は,3.72%のmAPと5.39%のmAPをそれぞれ上回っている。
論文 参考訳(メタデータ) (2022-03-27T05:54:00Z) - Deep Image Deblurring: A Survey [165.32391279761006]
低レベルのコンピュータビジョンにおいて、デブロアリングは古典的な問題であり、ぼやけた入力画像からシャープなイメージを復元することを目的としている。
近年のディープラーニングの進歩は、この問題の解決に大きな進歩をもたらした。
論文 参考訳(メタデータ) (2022-01-26T01:31:30Z) - Deep Learning for Scene Classification: A Survey [48.57123373347695]
シーン分類は、コンピュータビジョンにおける長年の、根本的かつ挑戦的な問題である。
大規模データセットの出現と深層学習技術のルネッサンスは、シーン表現と分類の分野において顕著な進歩をもたらした。
本稿では,深層学習によるシーン分類における最近の成果を総合的に調査する。
論文 参考訳(メタデータ) (2021-01-26T03:06:50Z) - A Decade Survey of Content Based Image Retrieval using Deep Learning [13.778851745408133]
本稿では,コンテンツベース画像検索における過去10年間のディープラーニングベース開発に関する包括的調査について述べる。
クエリ画像の代表的な特徴とデータセット画像との類似性は、検索のために画像のランク付けに使用される。
ディープラーニングは、手作業で設計した機能工学の、10年前から支配的な代替手段として現れてきた。
論文 参考訳(メタデータ) (2020-11-23T02:12:30Z) - Remote Sensing Image Scene Classification Meets Deep Learning:
Challenges, Methods, Benchmarks, and Opportunities [81.29441139530844]
本稿では,160以上の論文を網羅し,リモートセンシング画像シーン分類のためのディープラーニング手法の体系的調査を行う。
リモートセンシング画像シーンの分類と調査の主な課題について論じる。
リモートセンシング画像シーン分類に使用されるベンチマークを導入し,2ダース以上の代表アルゴリズムの性能を要約する。
論文 参考訳(メタデータ) (2020-05-03T14:18:00Z) - Distilling Localization for Self-Supervised Representation Learning [82.79808902674282]
コントラスト学習は教師なし表現学習に革命をもたらした。
現在のコントラストモデルでは、前景オブジェクトのローカライズには効果がない。
本稿では,背景変化を学習するためのデータ駆動型手法を提案する。
論文 参考訳(メタデータ) (2020-04-14T16:29:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。